<НА ГЛАВНУЮ

Apriel-Nemotron-15b-Thinker: эффективная AI-модель для корпоративного применения

'ServiceNow представила Apriel-Nemotron-15b-Thinker — компактную AI-модель с высокой производительностью и вдвое меньшим потреблением памяти и токенов по сравнению с крупными моделями, оптимизированную для корпоративного внедрения.'

Мощное рассуждение при компактном размере модели

ServiceNow представила Apriel-Nemotron-15b-Thinker — AI-модель с 15 миллиардами параметров, которая обеспечивает высокоуровневые возможности рассуждения при эффективном использовании памяти и токенов. Несмотря на меньший размер по сравнению с такими моделями, как QWQ-32b и EXAONE-Deep-32b, она демонстрирует сопоставимую или превосходящую производительность в сложных задачах, важных для корпоративных приложений.

Продвинутая схема обучения

Модель была разработана с помощью тщательного трехэтапного обучения:

  • Непрерывное предварительное обучение (CPT): обработка более 100 миллиардов токенов из областей, требующих глубокого рассуждения, включая математическую логику, программирование, научную литературу и логические задачи.
  • Контролируемая донастройка (SFT): донастройка на 200 000 качественных примерах для повышения точности и аккуратности.
  • Оптимизация предпочтений с подкреплением (GRPO): финальная доработка для согласования результатов с ожидаемыми ответами по ключевым задачам.

Выдающаяся производительность и эффективность

Apriel-Nemotron-15b-Thinker показывает отличные результаты в различных корпоративных и академических тестах, таких как MBPP, BFCL, Enterprise RAG, MT Bench, MixEval, IFEval, Multi-Challenge, AIME-24, AIME-25, AMC-23, MATH-500 и GPQA. При этом модель использует примерно на 50% меньше памяти и на 40% меньше токенов по сравнению с сопоставимыми моделями, что значительно снижает затраты на инференс и позволяет внедрять её на стандартном корпоративном оборудовании.

Применение в корпоративной среде и реальных условиях

Модель специально создана для практического использования, поддерживая приложения в реальном времени, такие как помощники по программированию, бизнес-автоматизация и инструменты логического анализа. Оптимизированное использование ресурсов позволяет преодолеть разрыв между возможностями продвинутого ИИ и реальной внедряемостью в бизнес без необходимости масштабных обновлений инфраструктуры.

Ключевые моменты

  • 15 миллиардов параметров с производительностью, сравнимой с большими моделями.
  • Трехфазное обучение: CPT, SFT и GRPO.
  • Экономия памяти на 50% и снижение потребления токенов на 40%.
  • Высокие результаты на корпоративных и академических тестах.
  • Оптимизация для агентских и корпоративных задач, идеально подходит для автоматизации и AI-ассистентов.

Следите за моделью на Hugging Face и обновлениями в Twitter.

🇬🇧

Switch Language

Read this article in English

Switch to English