OpenAI представила революционные открытые языковые модели: gpt-oss-120B для мощных ноутбуков и gpt-oss-20B для смартфонов

Две революционные открытые языковые модели от OpenAI

OpenAI кардинально меняет ландшафт искусственного интеллекта, выпустив две открытые языковые модели: gpt-oss-120B и gpt-oss-20B. Эти модели доступны для скачивания, изучения, дообучения и запуска на собственном оборудовании. Такой шаг открывает новую эру прозрачности, настройки и вычислительной мощности.

Почему этот релиз важен

Ранее OpenAI славилась впечатляющими моделями, но с ограниченным доступом к внутренностям. 5 августа 2025 года ситуация изменилась: обе модели выпущены под лицензией Apache 2.0, что позволяет использовать их в коммерческих и экспериментальных целях без ограничений. Теперь пользователи могут запускать модели OpenAI на своих устройствах, обходя облачные ограничения и получая полный контроль.

Модель gpt-oss-120B

Размер: 117 миллиардов параметров, из которых 5.1 миллиард активных на токен, за счёт технологии Mixture-of-Experts (MoE).
Производительность: Сопоставима или лучше, чем у модели o4-mini от OpenAI.
Требования к железу: Запускается на одном мощном GPU, например Nvidia H100 или картах с 80 ГБ видеопамяти, без необходимости в серверных фермах.
Возможности: Поддерживает цепочку размышлений и агентные функции — подходит для автоматизации исследований, технического письма, генерации кода.
Настройка: Регулируемая "мощность размышлений" (низкая, средняя, высокая) для баланса между производительностью и ресурсами.
Контекст: Обрабатывает до 128 000 токенов — достаточно для чтения целых книг.
Дообучение: Легко настраивается локально, обеспечивает приватность данных и отсутствие лимитов.

Модель gpt-oss-20B

Размер: 21 миллиард параметров с 3.6 миллиардами активных токенов, также с MoE.
Производительность: Между o3-mini и o4-mini, лучший среди "маленьких" моделей.
Требования к железу: Работает на обычных ноутбуках с 16 ГБ ОЗУ и даже на смартфонах.
Оптимизация для мобильных: Обеспечивает низкую задержку и приватный локальный ИИ для смартфонов (включая поддержку Qualcomm Snapdragon) и edge-устройств.
Агентные возможности: Может использовать API, создавать структурированные результаты и выполнять Python-код.

Технологии, лежащие в основе моделей

Обе модели используют архитектуру Mixture-of-Experts, активируя только несколько экспертных подсетей на токен. Это позволяет иметь огромное число параметров при умеренном использовании памяти и высокой скорости вывода. Технология MXFP4 квантования уменьшает размер модели без потери точности, благодаря чему 120B помещается на одном продвинутом GPU, а 20B — на ноутбуках и мобильных устройствах.

Практическое применение и влияние

Для предприятий: Развёртывание на месте с обеспечением конфиденциальности и соблюдением норм, подходит для финансового, медицинского и юридического секторов.
Для разработчиков: Свобода экспериментировать, дообучать и расширять без API-лимитов и дополнительных затрат.
Для сообщества: Модели доступны на Hugging Face, Ollama и других платформах для быстрой загрузки и запуска.

Как GPT-OSS выглядит на фоне других

Модель gpt-oss-120B — первая открытая модель с производительностью на уровне топовых коммерческих решений. Вариант 20B приносит мощный локальный ИИ на потребительские устройства, ускоряя инновации в области on-device AI.

Новая эра открытого ИИ

Модели GPT-OSS от OpenAI приглашают исследователей, разработчиков и компании полноценно использовать передовые технологии ИИ. Этот релиз — не просто для использования, а для построения, улучшения и эволюции ИИ сообща.

Для дополнительной информации смотрите технический блог GPT-OSS, обучающие материалы на GitHub, а также присоединяйтесь к сообществу в Twitter и ML SubReddit.