<НА ГЛАВНУЮ

NVIDIA выпустила открытые модели Open Code Reasoning с лидирующим уровнем интеллекта для кода

NVIDIA представила открытый доступ к моделям Open Code Reasoning (32B, 14B, 7B), которые показывают лучшие результаты в задачах работы с кодом и совместимы с популярными AI-фреймворками.

Модели Open Code Reasoning от NVIDIA

Компания NVIDIA опубликовала в открытом доступе набор моделей Open Code Reasoning (OCR) с параметрами 32B, 14B и 7B. Эти большие языковые модели специально созданы для решения сложных задач, связанных с пониманием и генерацией кода. Все модели распространяются под лицензией Apache 2.0.

Рекордные показатели в бенчмарках

Модели OCR превосходят по производительности версии OpenAI o3-Mini и o1 (low) на бенчмарке LiveCodeBench, который оценивает умения в отладке, генерации кода и завершении логики. Модель с 32 миллиардами параметров занимает первое место среди открытых моделей по способностям к рассуждению.

Такой результат достигается благодаря архитектуре моделей и уникальному OCR датасету NVIDIA — высококачественному обучающему корпусу, ориентированному на код, который улучшает следование инструкциям, рассуждение и решение многошаговых задач. Это даёт 30% прироста в эффективности использования токенов, что позволяет создавать точный код и логические выводы с меньшим числом токенов.

Варианты моделей для разных задач

Набор включает:

  • OpenCodeReasoning-Nemotron-32B: для высокопроизводительных исследований и инференса
  • OpenCodeReasoning-Nemotron-14B: сбалансированное сочетание производительности и экономии ресурсов
  • OpenCodeReasoning-Nemotron-7B: оптимальный вариант для ограниченных по ресурсам окружений с достойными результатами

Все модели основаны на архитектуре Nemotron — трансформерной базе NVIDIA, оптимизированной для многоязычного и многозадачного обучения. Весовые коэффициенты и конфигурации доступны на Hugging Face.

Совместимость с популярными фреймворками

Модели поддерживают интеграцию с:

  • llama.cpp для лёгкого инференса на CPU/GPU
  • vLLM для оптимизированного обслуживания на GPU и спекулятивного декодирования
  • Transformers от Hugging Face для обучения и оценки
  • TGI (Text Generation Inference) для масштабируемого API

Это позволяет разработчикам и компаниям легко внедрять модели в существующую инфраструктуру ИИ.

Прорыв в области открытого интеллекта для кода

Открытый релиз этих мощных моделей NVIDIA вносит значительный вклад в развитие экосистемы открытых моделей для кода, предоставляя сообществу альтернативы закрытым решениям. Это расширяет возможности по созданию копилотов для разработчиков, автоматическим проверкам кода и сервисам генерации.

Ознакомьтесь с моделями 32B, 14B, 7B и специальной 32B версии с улучшенным обучением для инструкций, чтобы познакомиться с передовыми технологиями в области AI для кода.

🇬🇧

Switch Language

Read this article in English

Switch to English