Alibaba открыла исходники Tongyi DeepResearch — 30B MoE LLM для длительных веб-исследований

Что такое Tongyi DeepResearch

Tongyi-DeepResearch-30B-A3B от лаборатории Tongyi (Alibaba) — открытая модель, ориентированная на агентскую работу и длительные исследования с использованием веб-инструментов. Модель использует архитектуру mixture-of-experts (MoE) с примерно 30.5 миллиардами общих параметров и около 3.0–3.3 миллиардами активных параметров на токен. Такая конструкция позволяет сохранять низкую стоимость вывода, приближенную к небольшим плотным моделям, при наличии экспертной емкости для сложного рассуждения в многократных сессиях.

Результаты бенчмарков

В релизе указаны конкурентные результаты на задачах глубокого поиска и агентских тестах. Ключевые показатели:

Также отмечены сильные результаты на WebWalkerQA, GAIA, FRAMES и SimpleQA. Команда утверждает, что модель сопоставима или превосходит существующие проприетарные и открытые решения для этих задач.

Архитектура и профиль вывода

Основные архитектурные и эксплуатационные характеристики:

Такое сочетание ориентировано на баланс пропускной способности и экспертной производительности в задачах глубоких исследований.

Тренировочный пайплайн: синтетические данные и on-policy RL

Модель тренируется как агент в полном цикле, а не просто как чат-LLM. В релизе выделена автоматизированная масштабируемая система генерации данных:

Эти механизмы направлены на повышение надежности при многопроходных взаимодействиях с инструментами и уменьшение галлюцинаций.

Роль в рабочих процессах документальных и веб-исследований

Задачи глубоких исследований требуют: планирования на длинную перспективу, итеративного поиска и верификации по нескольким источникам, отслеживания доказательств с низкой долей галлюцинаций и синтеза в больших контекстах. Tongyi DeepResearch обеспечивает это через:

Сообщенные улучшения по бенчмаркам указывают на большую устойчивость в задачах с многопереходным доступом к инструментам и источникам.

Ключевые особенности

Практическая значимость и где найти материалы

Для команд, строящих агенты для длительных исследований, релиз предлагает воспроизводимый открытый стек с реальными инструментами: веса под лицензией Apache-2.0, скрипты для инференса и утилиты для оценки. Репозиторий размещен на GitHub и модели доступны на Hugging Face вместе с техническими заметками, туториалами и ноутбуками, что упрощает воспроизведение и доработку.