Apriel-Nemotron-15b-Thinker: эффективная AI-модель для корпоративного применения

Мощное рассуждение при компактном размере модели

ServiceNow представила Apriel-Nemotron-15b-Thinker — AI-модель с 15 миллиардами параметров, которая обеспечивает высокоуровневые возможности рассуждения при эффективном использовании памяти и токенов. Несмотря на меньший размер по сравнению с такими моделями, как QWQ-32b и EXAONE-Deep-32b, она демонстрирует сопоставимую или превосходящую производительность в сложных задачах, важных для корпоративных приложений.

Продвинутая схема обучения

Модель была разработана с помощью тщательного трехэтапного обучения:

Непрерывное предварительное обучение (CPT): обработка более 100 миллиардов токенов из областей, требующих глубокого рассуждения, включая математическую логику, программирование, научную литературу и логические задачи.
Контролируемая донастройка (SFT): донастройка на 200 000 качественных примерах для повышения точности и аккуратности.
Оптимизация предпочтений с подкреплением (GRPO): финальная доработка для согласования результатов с ожидаемыми ответами по ключевым задачам.

Выдающаяся производительность и эффективность

Apriel-Nemotron-15b-Thinker показывает отличные результаты в различных корпоративных и академических тестах, таких как MBPP, BFCL, Enterprise RAG, MT Bench, MixEval, IFEval, Multi-Challenge, AIME-24, AIME-25, AMC-23, MATH-500 и GPQA. При этом модель использует примерно на 50% меньше памяти и на 40% меньше токенов по сравнению с сопоставимыми моделями, что значительно снижает затраты на инференс и позволяет внедрять её на стандартном корпоративном оборудовании.

Применение в корпоративной среде и реальных условиях

Модель специально создана для практического использования, поддерживая приложения в реальном времени, такие как помощники по программированию, бизнес-автоматизация и инструменты логического анализа. Оптимизированное использование ресурсов позволяет преодолеть разрыв между возможностями продвинутого ИИ и реальной внедряемостью в бизнес без необходимости масштабных обновлений инфраструктуры.

Ключевые моменты

15 миллиардов параметров с производительностью, сравнимой с большими моделями.
Трехфазное обучение: CPT, SFT и GRPO.
Экономия памяти на 50% и снижение потребления токенов на 40%.
Высокие результаты на корпоративных и академических тестах.
Оптимизация для агентских и корпоративных задач, идеально подходит для автоматизации и AI-ассистентов.