FILTER MODE ACTIVE

#LLM

Найдено записей: 84

#LLM20.01.2026

Дизайн полностью стримингового голосового агента

Создайте голосового агента с низкой задержкой, используя стриминг ASR, LLM и TTS.

ЧИТАТЬ →

#LLM13.01.2026

Понимание слоев наблюдаемости AI для LLM

Изучите слои наблюдаемости AI, чтобы повысить производительность и надежность LLM.

ЧИТАТЬ →

#LLM05.01.2026

LLM-Pruning Collection: JAX Репозиторий для Сжатия Моделей

Изучите инновационный репозиторий, который объединяет алгоритмы обрезки LLM для повышения производительности и эффективности.

ЧИТАТЬ →

#LLM05.01.2026

Оптимизация затрат с помощью кэширования подсказок в LLM

Узнайте, как кэширование подсказок снижает затраты API, сохраняя качество ответа в AI-системах.

ЧИТАТЬ →

#LLM04.01.2026

Устойчивость гиперсвязей с помощью алгоритма 1967 года

Исследователи DeepSeek решают проблему нестабильности в обучении LLM с помощью алгоритма матричной нормализации 1967 года.

ЧИТАТЬ →

#LLM21.12.2025

Оптимизация генерации токенов с помощью KV кэширования

Узнайте, как KV кэширование ускоряет генерацию токенов в LLM.

ЧИТАТЬ →

#LLM19.12.2025

Unsloth AI и NVIDIA: Революция в локальной настройке ИИ

Узнайте, как Unsloth и NVIDIA меняют локальную настройку ИИ для повышения производительности и персонализации.

ЧИТАТЬ →

#LLM09.12.2025

Google LiteRT NeuroPilot преобразует NPUs MediaTek в центр LLM

LiteRT NeuroPilot от Google улучшает NPUs MediaTek для моделей ИИ на устройстве.

ЧИТАТЬ →

#LLM03.12.2025

OpenAI обучила LLM признаваться в ошибках

Исследование OpenAI показывает, что LLM могут признавать ошибки, повышая доверие к ИИ.

ЧИТАТЬ →

#LLM02.12.2025

Google DeepMind представляет Evo-Memory для LLM

DeepMind предлагает Evo-Memory для оптимизации стратегий через повторное использование опыта.

ЧИТАТЬ →

#LLM30.11.2025

Meta AI представляет Matrix: Децентрализованная платформа для генерации синтетических данных

Matrix повышает эффективность генерации синтетических данных, используя децентрализованное управление и значительно улучшая пропускную способность токенов.

ЧИТАТЬ →

#LLM28.11.2025

Создание агентного ИИ для анализа литературы

Создайте ИИ-рамку, анализирующую литературу, генерирующую гипотезы, планирующую эксперименты и создающую отчеты.

ЧИТАТЬ →

#LLM26.10.2025

kvcached: виртуальный эластичный KV-кэш для LLM на общих GPU

kvcached вводит виртуальный эластичный KV-кэш для LLM, что сокращает потребление памяти и ускоряет активацию моделей при колокации на общих GPU.

ЧИТАТЬ →

#LLM24.10.2025

WALT: Превращение возможностей сайтов в переиспользуемые инструменты для LLM-агентов

'WALT извлекает родную функциональность сайтов и превращает её в детерминированные вызываемые инструменты для LLM-агентов, увеличивая успешность и сокращая число действий.'

ЧИТАТЬ →

#LLM20.10.2025

Как LangChain DeepAgents добавляют планирование и память в LLM-воркфлоу

'Погрузитесь в архитектуру LangChain DeepAgents: планирование задач, субагенты и файловая система дают агентау способность решать сложные многошаговые работы.'

ЧИТАТЬ →

#LLM18.10.2025

AutoCode: как LLM научились придумывать и проверять соревновательные задачи уровня онлайн-джаджей

'AutoCode учит LLM создавать и проверять задачи соревновательного программирования через цикл Validator–Generator–Checker(+Interactor) и двойную верификацию, добиваясь согласованности с джаджем на уровне ≈99%.'

ЧИТАТЬ →

#LLM17.10.2025

C2S-Scale 27B от Google превращает scRNA-seq в 'предложения клеток' для анализа с помощью LLM

C2S-Scale 27B преобразует профили scRNA-seq в ранжированные 'предложения клеток', позволяя LLM выполнять анализ состояний клеток. Модель предсказала и валидация in vitro показала, что ингибирование CK2 вместе с низкой дозой интерферона увеличивает представление MHC-I примерно на 50%.

ЧИТАТЬ →

#LLM13.10.2025

SwiReasoning: переключение по энтропии между латентным мышлением и явной цепочкой рассуждений

SwiReasoning чередует латентное мышление и явный CoT по сигналам энтропии следующего токена, улучшая точность и значительно снижая расход токенов на математика и STEM задачах.

ЧИТАТЬ →

#LLM10.10.2025

ACE — самонастраивающиеся LLM через эволюцию контекстного плейбука, а не дообучение

'ACE' позволяет LLM самоулучшаться через накопительный контекстный плейбук, демонстрируя заметный рост точности и сокращение задержек в задачах агентов и финансовых тестах.

ЧИТАТЬ →

#LLM10.10.2025

Google опубликовал MCP-сервер для Google Ads — LLM могут читать данные объявлений

'Google выпустил экспериментальный Python MCP-сервер, который открывает только чтение Google Ads API: search (GAQL) и list_accessible_customers, чтобы LLM-агенты могли анализировать данные без кастомных SDK.'

ЧИТАТЬ →

#LLM27.09.2025

Ускорьте работу с LLM с помощью asyncio: асинхронный Python для быстрого AI

'Как asyncio помогает параллельно выполнять запросы к LLM и сокращать время ожидания в AI-приложениях.'

ЧИТАТЬ →

#LLM26.09.2025

ShinkaEvolve: эволюция программ с LLM добивается SOTA в упаковке кругов примерно за 150 запусков

'ShinkaEvolve сочетает LLM-мутации и эволюционный поиск, чтобы находить сильные программы с сотнями, а не тысячами оценок; достигает SOTA в задаче упаковки кругов и улучшает решения в нескольких доменах.'

ЧИТАТЬ →

#LLM18.09.2025

Alibaba открыла исходники Tongyi DeepResearch — 30B MoE LLM для длительных веб-исследований

'Alibaba открыла исходники Tongyi DeepResearch-30B-A3B — MoE-модель с 128K контекстом для длительных исследований и высокими результатами в бенчмарках.'

ЧИТАТЬ →

#LLM15.09.2025

От черного ящика к залу суда: проектирование объяснимого ИИ для юридического мышления

Стандартные методы XAI не отражают иерархическую, прецедентную структуру юридического мышления. В статье предлагается гибридная архитектура: формальная аргументация плюс LLM для человекоориентированных объяснений.

ЧИТАТЬ →

#LLM07.09.2025

REFRAG от Meta: 16× больший контекст и до 31× быстрее декодирование RAG

'REFRAG сжимает извлеченные фрагменты в векторы, позволяя обрабатывать в 16 раз больший контекст и сокращая время до первого токена до 30.85× без потери точности.'

ЧИТАТЬ →

#LLM07.09.2025

TildeOpen: 30-миллиардная открытая LLM, ориентированная на малые языки Европы

'TildeOpen — 30-миллиардная открытая модель, созданная для улучшения поддержки малых европейских языков и доступная для локального развёртывания в соответствии с GDPR.'

ЧИТАТЬ →

#LLM06.09.2025

Alibaba представила Qwen3-Max-Preview — модель с триллионом параметров и контекстом в 262K токенов

'Qwen3-Max-Preview — первая триллионная модель Alibaba с окном контекста в 262K токенов и конкурентной производительностью; доступна только через API и по ступенчатой оплате.'

ЧИТАТЬ →

#LLM03.09.2025

Подключённый клиент: как агентный AI меняет клиентский опыт

'Агентный AI и унифицированные платформы позволяют масштабировать персонализированный сервис, при этом важно сохранить доверие клиентов и роль сотрудников.'

ЧИТАТЬ →

#LLM28.08.2025

От пилота к масштабу: внедрение агентного ИИ в здравоохранении

'Ensemble переводит агентный ИИ из пилота в масштаб, сочетая LLM с символической логикой, 2 ПБ медицинских данных и тесную работу исследователей с клиническими экспертами для снижения отказов и улучшения взаимодействия с пациентами.'

ЧИТАТЬ →

#LLM27.08.2025

От логов к числам: RLM от Google предсказывает производительность систем по сырому тексту

'RLM от Google позволяет компактным LLM напрямую предсказывать метрики производительности промышленных систем по сериализованным логам и конфигам, значительно сокращая работу по фичам и повышая точность.'

ЧИТАТЬ →

#LLM25.08.2025

GPU против TPU в 2025 году: какой ускоритель лучше для тренировки больших трансформеров?

'Практичное сравнение TPU и GPU для обучения больших трансформеров в 2025: ключевые преимущества TPU v5p и NVIDIA Blackwell B200 и советы по выбору ускорителя.'

ЧИТАТЬ →

#LLM24.08.2025

Освойте JSON-промпты для LLM: практическое руководство с примерами на Python

'Руководство по использованию JSON-промптов с примерами на Python, показывающее, как структурированные запросы повышают точность и удобство интеграции результатов.'

ЧИТАТЬ →

#LLM23.08.2025

Голосовые агенты: как работают и 9 платформ, которые стоит знать в 2025

'Узнайте, как работают голосовые агенты на базе ИИ, какие компоненты важны и какие 9 платформ лидируют в 2025 году.'

ЧИТАТЬ →

#LLM23.08.2025

LLM или SLM? Практическое руководство для финансов в 2025 году

'Для банков и страховщиков в 2025 году: SLM — для быстрых, структурированных задач и строгой локализации данных; LLM — для длинных контекстов и сложного синтеза при строгом управлении рисками.'

ЧИТАТЬ →

#LLM22.08.2025

AmbiGraph-Eval: бенчмарк для разрешения неоднозначности в генерации графовых запросов

'AmbiGraph-Eval представляет бенчмарк из 560 неоднозначных запросов для проверки LLM при генерации Cypher. Тестирование девяти моделей показало ключевые проблемы в разрешении неоднозначности и формировании корректного синтаксиса.'

ЧИТАТЬ →

#LLM19.08.2025

Vibe coding для дата-инженеров: когда LLM ускоряет работу и когда стоит тормозить

'Vibe coding позволяет быстро генерировать код для пайплайнов, но без ревью может привести к ошибкам данных и проблемам с безопасностью.'

ЧИТАТЬ →

#LLM17.08.2025

AI Sheets: безкодовый табличный инструмент Hugging Face для создания наборов данных на базе LLM

'Hugging Face выпустила AI Sheets — бесплатный открытый инструмент в виде таблицы для создания, очистки и обогащения наборов данных с помощью open-source LLM, доступный в браузере и для локального запуска.'

ЧИТАТЬ →

#LLM16.08.2025

ReaGAN: превращение узлов графа в автономных агентов с глобальным семантическим поиском

'ReaGAN переосмысливает узлы графа как автономных агентов, использующих замороженную LLM для планирования и глобального извлечения информации, достигая конкурентных результатов без обучения.'

ЧИТАТЬ →

#LLM14.08.2025

ToolTrain: RL-фреймворк от ByteDance, обучающий LLM эффективно искать в репозиториях

'ToolTrain сочетает SFT и RL с интеграцией инструментов, чтобы научить LLM эффективно искать в коде и улучшить локализацию проблем на реальных бенчмарках.'

ЧИТАТЬ →

#LLM12.08.2025

ProRLv2: NVIDIA удлиняет RL до 3000 шагов и усиливает способность LLM к рассуждению

ProRLv2 увеличивает горизонт RL до 3000 шагов и демонстрирует значительные улучшения рассуждения в компактных языковых моделях, подтверждённые приростами по математике, кодированию и логике.

ЧИТАТЬ →

#LLM09.08.2025

Mixture-of-Agents (MoA): как команда специализированных агентов улучшает LLM

'Mixture-of-Agents объединяет специализированных агентов в многоуровневую систему, повышая точность и надёжность ответов по сравнению с одиночными моделями.'

ЧИТАТЬ →

#LLM05.08.2025

Anthropic AI представила векторные персоны для контроля изменений личности в больших языковых моделях

Anthropic AI разработала метод векторных персон для выявления и контроля изменений личности в больших языковых моделях, что улучшает их надежность и безопасность.

ЧИТАТЬ →

#LLM05.08.2025

Google AI запускает LangExtract: Python-библиотека для прозрачного извлечения данных из неструктурированного текста

Google AI представил LangExtract — мощную open-source Python-библиотеку для извлечения структурированных и проверяемых данных из неструктурированных текстов с использованием LLM, таких как Gemini.

ЧИТАТЬ →

#LLM04.08.2025

ByteDance представляет Seed-Prover: прорыв в автоматическом доказательстве математических теорем

ByteDance представила Seed-Prover — инновационную систему доказательства на основе лемм, которая добилась прорывных результатов, решив 5 из 6 задач IMO 2025 и превзойдя множество других бенчмарков.

ЧИТАТЬ →

#LLM03.08.2025

Открывая будущее ИИ: Полное руководство по контекстному инжинирингу в больших языковых моделях

Контекстный инжиниринг расширяет возможности больших языковых моделей, объединяя инновационные техники и системные архитектуры для решения актуальных исследовательских задач.

ЧИТАТЬ →

#LLM01.08.2025

Обучение LLM с «злыми» паттернами может сделать их безопаснее

Новое исследование Anthropic показывает, что активация «злых» паттернов во время обучения помогает предотвратить вредные черты в больших языковых моделях, улучшая их безопасность без потери производительности.

ЧИТАТЬ →

#LLM01.08.2025

TransEvalnia: Продвинутая система оценки перевода на основе LLM с точностью, близкой к человеческой

TransEvalnia использует prompting и LLM для детальной оценки и ранжирования переводов с высокой точностью и часто превосходит традиционные модели на различных языковых парах.

ЧИТАТЬ →

#LLM30.07.2025

Освойте LangGraph: создание динамичного пайплайна для анализа текста с помощью ИИ

В этом руководстве показано, как создать модульный пайплайн анализа текста с LangGraph, включая классификацию, извлечение сущностей, суммаризацию, анализ тональности и динамическое управление потоками.

ЧИТАТЬ →

#LLM30.07.2025

Когда слишком много размышлений вредят: как длинные рассуждения ухудшают работу больших языковых моделей

Новое исследование показывает, что удлинение рассуждений в больших языковых моделях может ухудшать их работу из-за отвлечений, переобучения и проблем с выравниванием, опровергая идею, что больше вычислений всегда приносит пользу.

ЧИТАТЬ →

#LLM29.07.2025

Мастерство техники Self-Refine с большими языковыми моделями и Mirascope

Узнайте, как использовать Mirascope для реализации техники Self-Refine с большими языковыми моделями, чтобы улучшать ответы ИИ через итеративную доработку.

ЧИТАТЬ →

#LLM28.07.2025

Создание медицинского графа знаний с помощью GPT-4o-mini из неструктурированных данных

В этом руководстве показано, как с помощью GPT-4o-mini и Python построить медицинский граф знаний из неструктурированных журналов пациентов для эффективного извлечения и визуализации медицинской информации.

ЧИТАТЬ →

#LLM21.07.2025

TikTok представил SWE-Perf: первый бенчмарк для оптимизации производительности кода на уровне репозитория

TikTok представил SWE-Perf — первый бенчмарк для оценки возможностей LLM в оптимизации производительности кода на уровне репозиториев, показывающий отставание ИИ от экспертов-человеков.

ЧИТАТЬ →

#LLM20.07.2025

Master-RM: укрепление доверия к LLM-моделям награды против поверхностных уязвимостей

Master-RM — новая модель награды, устраняющая уязвимости LLM-оценщиков к поверхностным подсказкам и обеспечивающая более надежные результаты в обучении с подкреплением.

ЧИТАТЬ →

#LLM19.07.2025

MemAgent: Революция в обработке длинных контекстов в LLM с помощью обучения с подкреплением

MemAgent представляет собой RL-агента памяти, позволяющего LLM эффективно работать с очень длинными документами, сохраняя высокую точность и линейные вычислительные затраты.

ЧИТАТЬ →

#LLM19.07.2025

FlexOlmo: революция в обучении языковых моделей без обмена данными

FlexOlmo предлагает модульный фреймворк для обучения крупных языковых моделей на приватных данных без обмена ими, обеспечивая высокую производительность и соблюдение правил управления данными.

ЧИТАТЬ →

#LLM17.07.2025

NVIDIA представляет Canary-Qwen-2.5B: ведущая гибридная модель ASR-LLM с непревзойденной точностью и скоростью

Модель Canary-Qwen-2.5B от NVIDIA устанавливает новый рекорд точности распознавания речи и обеспечивает высокую скорость обработки. Открытая и лицензированная для коммерческого использования, она объединяет транскрипцию и понимание языка в одном решении.

ЧИТАТЬ →

#LLM16.07.2025

Как удалить семантические дубликаты отзывов клиентов с помощью Mirascope и LLM

Узнайте, как с помощью Mirascope и модели GPT-4o от OpenAI выявлять и удалять семантические дубликаты в отзывах клиентов для улучшения анализа обратной связи.

ЧИТАТЬ →

#LLM07.07.2025

ByteDance выпустила Trae Agent: AI-ассистент для сложных задач программирования

Компания ByteDance представила Trae Agent — AI-ассистент для разработки ПО, который упрощает сложные задачи программирования через естественный язык и CLI-интерфейс.

ЧИТАТЬ →

#LLM07.07.2025

SynPref-40M и Skywork-Reward-V2: Революция в масштабируемом согласовании человека и ИИ для передовых моделей вознаграждения

SynPref-40M представляет огромный набор данных предпочтений, который позволил создать серию моделей Skywork-Reward-V2 с передовыми результатами в согласовании человека и ИИ по нескольким бенчмаркам.

ЧИТАТЬ →

#LLM06.07.2025

AbstRaL: Повышение устойчивости LLM через абстрактное мышление и обучение с подкреплением

AbstRaL использует обучение с подкреплением для обучения LLM абстрактному мышлению, что значительно повышает их устойчивость и точность на изменённых задачах GSM8K по сравнению с традиционными методами.

ЧИТАТЬ →

#LLM04.07.2025

Thought Anchors: точный анализ ключевых этапов рассуждений в больших языковых моделях

Thought Anchors — новый фреймворк, который улучшает понимание процессов рассуждений в больших языковых моделях за счет анализа вклада предложений и причинного влияния.

ЧИТАТЬ →

#LLM03.07.2025

DeepSeek R1T2 Chimera: революция в LLM с ускорением на 200% и улучшенным выводом

DeepSeek-TNG представила R1T2 Chimera — новую Assembly-of-Experts LLM модель, которая работает вдвое быстрее R1-0528 и улучшает рассуждения, доступна под лицензией MIT.

ЧИТАТЬ →

#LLM01.07.2025

Baidu представляет ERNIE 4.5: открытые LLM от 0.3B до 424B параметров

Baidu выпустила ERNIE 4.5 — серию открытых больших языковых моделей с параметрами от 0.3 до 424 миллиардов, обладающих продвинутой архитектурой и высокой производительностью в многоязычных задачах.

ЧИТАТЬ →

#LLM01.07.2025

OMEGA: Новый бенчмарк для оценки творческих возможностей ИИ в математических рассуждениях

OMEGA — новый бенчмарк для проверки границ математического рассуждения больших языковых моделей, фокусируясь на исследовательском, композиционном и трансформационном обобщении.

ЧИТАТЬ →

#LLM25.06.2025

Новое исследование выявляет угрозы приватности в размышлениях больших моделей рассуждений

Новое исследование показывает, что большие модели рассуждений раскрывают чувствительную информацию через свои следы размышлений, что представляет серьезные риски для приватности в AI-помощниках.

ЧИТАТЬ →

#LLM24.06.2025

ByteDance представляет ProtoReasoning: улучшение обобщения LLM с помощью логических прототипов

Исследователи ByteDance представляют ProtoReasoning — новую систему, использующую логические прототипы для значительного улучшения рассуждений и планирования в больших языковых моделях.

ЧИТАТЬ →

#LLM23.06.2025

VERINA: новый стандарт оценки генерации проверяемого кода с помощью LLM и формальных доказательств

VERINA представляет комплексный бенчмарк для оценки LLM в генерации проверяемого кода, объединяя код, формальные спецификации и доказательства с разным уровнем сложности.

ЧИТАТЬ →

#LLM17.06.2025

EPFL представляет MEMOIR: революционную систему для непрерывного редактирования моделей больших языковых моделей

Исследователи EPFL разработали MEMOIR — инновационную систему для непрерывного, надежного и локального обновления больших языковых моделей, которая превосходит существующие методы.

ЧИТАТЬ →

#LLM14.06.2025

Internal Coherence Maximization: революция в обучении больших языковых моделей без разметки

Internal Coherence Maximization (ICM) представляет собой новый метод обучения больших языковых моделей без использования разметки, достигающий результатов, сопоставимых с обучением на данных с человеческой разметкой.

ЧИТАТЬ →

#LLM12.06.2025

Почему ИИ переусложняет простые задачи и сдается перед сложными

Новое исследование Apple показывает, почему большие языковые модели склонны переусложнять простые задачи и сдаются перед сложными, раскрывая проблемы в рассуждениях искусственного интеллекта.

ЧИТАТЬ →

#LLM12.06.2025

Почему большие языковые модели пропускают инструкции и как это исправить

Большие языковые модели часто пропускают части сложных инструкций из-за ограничений внимания и лимитов токенов. В статье рассмотрены причины и рекомендации по улучшению выполнения инструкций.

ЧИТАТЬ →

#LLM11.06.2025

Mistral AI представляет серию Magistral: передовые LLM с цепочкой рассуждений для бизнеса и открытого ПО

Mistral AI представила серию Magistral — новые большие языковые модели, оптимизированные для рассуждений и мультиязычности, доступные в открытом и корпоративном вариантах.

ЧИТАТЬ →

#LLM03.06.2025

Meta Выпустила Llama Prompt Ops: Автоматическая Оптимизация Промптов для Моделей Llama на Python

Meta представила Llama Prompt Ops — Python-пакет для автоматической адаптации и оптимизации промптов под модели Llama, упрощающий переход с проприетарных LLM и повышающий качество работы промптов.

ЧИТАТЬ →

#LLM30.05.2025

Apple и исследователи из Duke представили метод обучения с подкреплением для промежуточных ответов LLM, повышая скорость и точность

Apple и исследователи из Duke представили метод межчередующегося рассуждения, позволяющий LLM выдавать промежуточные ответы, что значительно ускоряет и улучшает точность в сложных задачах.

ЧИТАТЬ →

#LLM20.05.2025

Salesforce представляет UAEval4RAG: новый бенчмарк для оценки способности RAG-систем отвергать неотвечаемые запросы

Исследователи Salesforce представили UAEval4RAG — новый бенчмарк для оценки способности RAG-систем отвергать неотвечаемые запросы разных типов, что повышает надежность ответов ИИ.

ЧИТАТЬ →

#LLM17.05.2025

DeepSeek-V3: Революция в языковых моделях через эффективность и масштабируемость

DeepSeek-V3 предлагает инновационную архитектуру и аппаратно-согласованный дизайн, значительно повышающие эффективность и масштабируемость больших языковых моделей, делая передовой ИИ более доступным.

ЧИТАТЬ →

#LLM17.05.2025

Microsoft и Salesforce выявили значительное падение эффективности LLM в реальных многошаговых диалогах

Новое исследование Microsoft и Salesforce показывает, что большие языковые модели теряют до 39% эффективности при обработке реальных многошаговых диалогов с неполными инструкциями, выявляя ключевую проблему разговорного ИИ.

ЧИТАТЬ →

#LLM13.05.2025

RLV: Улучшение рассуждений языковых моделей с помощью интегрированной проверки без использования value-функции

RLV представляет собой объединённый подход, интегрирующий верификацию в value-free обучение с подкреплением для языковых моделей, значительно повышая точность рассуждений и эффективность вычислений на математических тестах.

ЧИТАТЬ →

#LLM02.05.2025

JetBrains представляет Mellum: открытая языковая модель, ориентированная на разработчиков

JetBrains выпустила Mellum — языковую модель с 4 миллиардами параметров, специализированную для задач программирования, чтобы улучшить AI-поддержку в разработке ПО.

ЧИТАТЬ →

#LLM30.04.2025

SICA: Самоулучшающийся кодирующий агент, меняющий подход к автономной разработке ПО

Исследователи представили SICA — новый агент, способный самостоятельно улучшать свой код и производительность, показывая значительный прогресс на бенчмарках по разработке ПО.

ЧИТАТЬ →

#LLM29.04.2025

Alibaba Представляет Qwen3: Прорыв в Масштабируемых Многоязычных Моделях с Гибридным Рассуждением

Alibaba представила Qwen3 — новое поколение больших языковых моделей с гибридным рассуждением, многоязычной поддержкой и эффективным масштабированием, задающее новые стандарты в производительности AI.

ЧИТАТЬ →

#LLM27.04.2025

ByteDance представляет QuaDMix: революция в предобучении больших языковых моделей с оптимизацией качества и разнообразия данных

ByteDance анонсировала QuaDMix — систему, которая улучшает предобучение больших языковых моделей за счёт совместной оптимизации качества и разнообразия данных, обеспечивая значительный прирост производительности.

ЧИТАТЬ →

#LLM24.04.2025

Асинхронный веб-скрейпинг с Crawl4AI: Эффективный сбор данных для LLM

Узнайте, как использовать Crawl4AI для эффективного асинхронного сбора веб-данных без запуска браузера, идеально подходящего для LLM и масштабируемых решений.

ЧИТАТЬ →

#LLM23.04.2025

Революция в LLM: Самообучающиеся языковые модели без меток с помощью Test-Time Reinforcement Learning

Исследователи из Университета Цинхуа и Шанхайской лаборатории ИИ представили TTRL — новый метод, позволяющий большим языковым моделям улучшать свои результаты без размеченных данных, используя самооценку и обучение с подкреплением во время инференса.

ЧИТАТЬ →