NVIDIA выпустила открытые модели Open Code Reasoning с лидирующим уровнем интеллекта для кода

Модели Open Code Reasoning от NVIDIA

Компания NVIDIA опубликовала в открытом доступе набор моделей Open Code Reasoning (OCR) с параметрами 32B, 14B и 7B. Эти большие языковые модели специально созданы для решения сложных задач, связанных с пониманием и генерацией кода. Все модели распространяются под лицензией Apache 2.0.

Рекордные показатели в бенчмарках

Модели OCR превосходят по производительности версии OpenAI o3-Mini и o1 (low) на бенчмарке LiveCodeBench, который оценивает умения в отладке, генерации кода и завершении логики. Модель с 32 миллиардами параметров занимает первое место среди открытых моделей по способностям к рассуждению.

Такой результат достигается благодаря архитектуре моделей и уникальному OCR датасету NVIDIA — высококачественному обучающему корпусу, ориентированному на код, который улучшает следование инструкциям, рассуждение и решение многошаговых задач. Это даёт 30% прироста в эффективности использования токенов, что позволяет создавать точный код и логические выводы с меньшим числом токенов.

Варианты моделей для разных задач

Набор включает:

OpenCodeReasoning-Nemotron-32B: для высокопроизводительных исследований и инференса
OpenCodeReasoning-Nemotron-14B: сбалансированное сочетание производительности и экономии ресурсов
OpenCodeReasoning-Nemotron-7B: оптимальный вариант для ограниченных по ресурсам окружений с достойными результатами

Все модели основаны на архитектуре Nemotron — трансформерной базе NVIDIA, оптимизированной для многоязычного и многозадачного обучения. Весовые коэффициенты и конфигурации доступны на Hugging Face.

Совместимость с популярными фреймворками

Модели поддерживают интеграцию с:

llama.cpp для лёгкого инференса на CPU/GPU
vLLM для оптимизированного обслуживания на GPU и спекулятивного декодирования
Transformers от Hugging Face для обучения и оценки
TGI (Text Generation Inference) для масштабируемого API

Это позволяет разработчикам и компаниям легко внедрять модели в существующую инфраструктуру ИИ.

Прорыв в области открытого интеллекта для кода

Открытый релиз этих мощных моделей NVIDIA вносит значительный вклад в развитие экосистемы открытых моделей для кода, предоставляя сообществу альтернативы закрытым решениям. Это расширяет возможности по созданию копилотов для разработчиков, автоматическим проверкам кода и сервисам генерации.