<НА ГЛАВНУЮ

IBM представила Granite 4.0 Nano: компактные открытые модели для AI на границе сети

'IBM анонсировала Granite 4.0 Nano — восемь компактных моделей (350M и ~1B) в гибридных и трансформерных вариантах для локального и edge-инференса с корпоративным управлением.'

Что такое Granite 4.0 Nano

Команда IBM выпустила Granite 4.0 Nano — семейство компактных открытых языковых моделей, ориентированных на локальное и edge-инференсирование с корпоративными средствами управления. Серия включает восемь моделей двух основных масштабов — примерно 350M и около 1B параметров — в гибридных SSM (H) и чисто трансформерных вариантах, каждая в базовой и инструкционной версии. Все модели распространяются по лицензии Apache 2.0, подписаны криптографически и соответствуют ISO 42001 для обеспечения происхождения и контроля.

Состав и форматы моделей

Nano-линейка включает как гибридные H-модели (SSM+трансформер), так и трансформерные аналоги для совместимости со средами исполнения. Среди ключевых моделей — Granite 4.0 H 1B (примерно 1.5B параметров) и Granite 4.0 H 350M (около 350M). Предоставляются также трансформерные версии для максимальной портируемости на различных рантаймах. Выпуск покрывает базовые и инструкционные варианты, пригодные для устройств, edge и браузерных сценариев.

Архитектура и обучение

H-варианты чередуют SSM-слои и трансформерные слои. Такая гибридная конструкция уменьшает рост потребления памяти по сравнению с чистым attention, при этом сохраняя универсальность трансформерных блоков. Nano-модели обучались по той же методике Granite 4.0 и на том же объёме данных — более 15 триллионов токенов — без упрощённого пайплайна. После предобучения модели были instruction-tuned для улучшения использования инструментов и следования инструкциям, что переносит сильные стороны крупных моделей на под-2B шкалу.

Производительность и бенчмарки

IBM сравнивает Granite 4.0 Nano с другими моделями до 2B параметров, такими как Qwen, Gemma и LiquidAI LFM. Аггрегированные результаты показывают заметный рост возможностей по общим знаниям, математике, коду и безопасности при схожих ресурсах. Для задач агентов Nano-модели демонстрируют преимущества на IFEval и в Berkeley Function Calling Leaderboard v3, что важно для сценариев с вызовом функций и инструментов.

Лицензирование, управление и поддержка рантаймов

Все модели Granite 4.0, включая Nano, выпущены под Apache 2.0, имеют криптографические подписи и выверены на соответствие ISO 42001. Это даёт предприятиям гарантии происхождения и управления, которые часто отсутствуют у небольших сообществных моделей. Модели доступны на Hugging Face и watsonx.ai, с нативной поддержкой vLLM, llama.cpp и MLX, что делает реалистичным развёртывание локально, на edge и в браузере.

Почему это важно

Перенос единого тренировочного пайплайна и истории управления Granite на малые размеры означает, что edge и on-device приложения получают модели, унаследовавшие качество и аудитируемость больших моделей. Комбинация конкурентной производительности, компактного размера, открытой лицензии и корпоративной пригодности делает Granite 4.0 Nano привлекательным выбором для инженерных команд с требованиями к соблюдению норм.

Доступность

Веса моделей и технические подробности опубликованы на Hugging Face и IBM watsonx.ai. Дополнительные материалы, включая руководства и ноутбуки, доступны на GitHub и в сообществе IBM.

🇬🇧

Switch Language

Read this article in English

Switch to English