FILTER MODE ACTIVE

#Qwen3

Найдено записей: 8

#Qwen325.11.2025

Agent0: самообучающаяся LLM, осваивающая инструменты и решающая сложную математику без внешних данных

'Agent0 коэволюционирует генератор задач и исполнителя из одного базового LLM, используя песочницу Python и адаптивный RL для улучшения математических и общих навыков без внешних данных.'

ЧИТАТЬ →

#Qwen314.11.2025

TiDAR: гибридная архитектура NVIDIA сочетает диффузию и автогрессию для ускорения инференса LLM

TiDAR объединяет диффузионное черновое предсказание и автогрессивную верификацию в одном проходе, что позволяет умножить количество токенов на проход и увеличить скорость инференса до примерно 5.9x без заметной потери качества.

ЧИТАТЬ →

#Qwen314.10.2025

Думай прежде, чем предсказывать: RLP от NVIDIA внедряет усиленное обучение в стадию предтренировки

'NVIDIA RLP вознаграждает «думание» перед предсказанием, давая плотный позиционный сигнал информационного прироста и улучшая результаты в задачах рассуждения при меньшем количестве данных.'

ЧИТАТЬ →

#Qwen322.09.2025

Qwen3-Next-80B-A3B в FP8: гибридный MoE 80B/3B становится жизнеспособным на обычных GPU

Qwen из Alibaba выпустила FP8-контрольные точки для Qwen3-Next-80B-A3B (Instruct и Thinking), что делает практичным деплой 80B/3B-гибридного MoE на обычных GPU и улучшает производительность в режимах длинного контекста

ЧИТАТЬ →

#Qwen309.06.2025

Отбор токенов с высокой энтропией в RLVR повышает точность и снижает затраты на обучение LLM

‘Селективное обучение на токенах с высокой энтропией улучшает результаты рассуждений LLM и снижает вычислительные затраты, устанавливая новые рекорды на тестах AIME.’

ЧИТАТЬ →

#Qwen306.06.2025

Серия Qwen3 от Alibaba устанавливает новые стандарты многоязычного embedding и reranking

Команда Alibaba Qwen выпустила серию Qwen3-Embedding и Qwen3-Reranker — открытые многоязычные модели embedding и ранжирования, превосходящие существующие решения.

ЧИТАТЬ →

#Qwen329.04.2025

Alibaba представила Qwen3: новый открытый ИИ-конкурент ChatGPT и Google

Alibaba выпустила Qwen3 — инновационную серию открытых ИИ-моделей с гибридным мышлением, которая бросает вызов ChatGPT и Google.

ЧИТАТЬ →

#Qwen329.04.2025

Alibaba Представляет Qwen3: Прорыв в Масштабируемых Многоязычных Моделях с Гибридным Рассуждением

Alibaba представила Qwen3 — новое поколение больших языковых моделей с гибридным рассуждением, многоязычной поддержкой и эффективным масштабированием, задающее новые стандарты в производительности AI.

ЧИТАТЬ →