Apriel-Nemotron-15b-Thinker: эффективная AI-модель для корпоративного применения
'ServiceNow представила Apriel-Nemotron-15b-Thinker — компактную AI-модель с высокой производительностью и вдвое меньшим потреблением памяти и токенов по сравнению с крупными моделями, оптимизированную для корпоративного внедрения.'
Мощное рассуждение при компактном размере модели
ServiceNow представила Apriel-Nemotron-15b-Thinker — AI-модель с 15 миллиардами параметров, которая обеспечивает высокоуровневые возможности рассуждения при эффективном использовании памяти и токенов. Несмотря на меньший размер по сравнению с такими моделями, как QWQ-32b и EXAONE-Deep-32b, она демонстрирует сопоставимую или превосходящую производительность в сложных задачах, важных для корпоративных приложений.
Продвинутая схема обучения
Модель была разработана с помощью тщательного трехэтапного обучения:
- Непрерывное предварительное обучение (CPT): обработка более 100 миллиардов токенов из областей, требующих глубокого рассуждения, включая математическую логику, программирование, научную литературу и логические задачи.
- Контролируемая донастройка (SFT): донастройка на 200 000 качественных примерах для повышения точности и аккуратности.
- Оптимизация предпочтений с подкреплением (GRPO): финальная доработка для согласования результатов с ожидаемыми ответами по ключевым задачам.
Выдающаяся производительность и эффективность
Apriel-Nemotron-15b-Thinker показывает отличные результаты в различных корпоративных и академических тестах, таких как MBPP, BFCL, Enterprise RAG, MT Bench, MixEval, IFEval, Multi-Challenge, AIME-24, AIME-25, AMC-23, MATH-500 и GPQA. При этом модель использует примерно на 50% меньше памяти и на 40% меньше токенов по сравнению с сопоставимыми моделями, что значительно снижает затраты на инференс и позволяет внедрять её на стандартном корпоративном оборудовании.
Применение в корпоративной среде и реальных условиях
Модель специально создана для практического использования, поддерживая приложения в реальном времени, такие как помощники по программированию, бизнес-автоматизация и инструменты логического анализа. Оптимизированное использование ресурсов позволяет преодолеть разрыв между возможностями продвинутого ИИ и реальной внедряемостью в бизнес без необходимости масштабных обновлений инфраструктуры.
Ключевые моменты
- 15 миллиардов параметров с производительностью, сравнимой с большими моделями.
- Трехфазное обучение: CPT, SFT и GRPO.
- Экономия памяти на 50% и снижение потребления токенов на 40%.
- Высокие результаты на корпоративных и академических тестах.
- Оптимизация для агентских и корпоративных задач, идеально подходит для автоматизации и AI-ассистентов.
Следите за моделью на Hugging Face и обновлениями в Twitter.
Switch Language
Read this article in English