OpenAI представила революционные открытые языковые модели: gpt-oss-120B для мощных ноутбуков и gpt-oss-20B для смартфонов
OpenAI представила две мощные открытые языковые модели, gpt-oss-120B и gpt-oss-20B, позволяющие запускать передовой ИИ локально на ноутбуках и смартфонах с полной настройкой и приватностью.
Две революционные открытые языковые модели от OpenAI
OpenAI кардинально меняет ландшафт искусственного интеллекта, выпустив две открытые языковые модели: gpt-oss-120B и gpt-oss-20B. Эти модели доступны для скачивания, изучения, дообучения и запуска на собственном оборудовании. Такой шаг открывает новую эру прозрачности, настройки и вычислительной мощности.
Почему этот релиз важен
Ранее OpenAI славилась впечатляющими моделями, но с ограниченным доступом к внутренностям. 5 августа 2025 года ситуация изменилась: обе модели выпущены под лицензией Apache 2.0, что позволяет использовать их в коммерческих и экспериментальных целях без ограничений. Теперь пользователи могут запускать модели OpenAI на своих устройствах, обходя облачные ограничения и получая полный контроль.
Модель gpt-oss-120B
- Размер: 117 миллиардов параметров, из которых 5.1 миллиард активных на токен, за счёт технологии Mixture-of-Experts (MoE).
- Производительность: Сопоставима или лучше, чем у модели o4-mini от OpenAI.
- Требования к железу: Запускается на одном мощном GPU, например Nvidia H100 или картах с 80 ГБ видеопамяти, без необходимости в серверных фермах.
- Возможности: Поддерживает цепочку размышлений и агентные функции — подходит для автоматизации исследований, технического письма, генерации кода.
- Настройка: Регулируемая "мощность размышлений" (низкая, средняя, высокая) для баланса между производительностью и ресурсами.
- Контекст: Обрабатывает до 128 000 токенов — достаточно для чтения целых книг.
- Дообучение: Легко настраивается локально, обеспечивает приватность данных и отсутствие лимитов.
Модель gpt-oss-20B
- Размер: 21 миллиард параметров с 3.6 миллиардами активных токенов, также с MoE.
- Производительность: Между o3-mini и o4-mini, лучший среди "маленьких" моделей.
- Требования к железу: Работает на обычных ноутбуках с 16 ГБ ОЗУ и даже на смартфонах.
- Оптимизация для мобильных: Обеспечивает низкую задержку и приватный локальный ИИ для смартфонов (включая поддержку Qualcomm Snapdragon) и edge-устройств.
- Агентные возможности: Может использовать API, создавать структурированные результаты и выполнять Python-код.
Технологии, лежащие в основе моделей
Обе модели используют архитектуру Mixture-of-Experts, активируя только несколько экспертных подсетей на токен. Это позволяет иметь огромное число параметров при умеренном использовании памяти и высокой скорости вывода. Технология MXFP4 квантования уменьшает размер модели без потери точности, благодаря чему 120B помещается на одном продвинутом GPU, а 20B — на ноутбуках и мобильных устройствах.
Практическое применение и влияние
- Для предприятий: Развёртывание на месте с обеспечением конфиденциальности и соблюдением норм, подходит для финансового, медицинского и юридического секторов.
- Для разработчиков: Свобода экспериментировать, дообучать и расширять без API-лимитов и дополнительных затрат.
- Для сообщества: Модели доступны на Hugging Face, Ollama и других платформах для быстрой загрузки и запуска.
Как GPT-OSS выглядит на фоне других
Модель gpt-oss-120B — первая открытая модель с производительностью на уровне топовых коммерческих решений. Вариант 20B приносит мощный локальный ИИ на потребительские устройства, ускоряя инновации в области on-device AI.
Новая эра открытого ИИ
Модели GPT-OSS от OpenAI приглашают исследователей, разработчиков и компании полноценно использовать передовые технологии ИИ. Этот релиз — не просто для использования, а для построения, улучшения и эволюции ИИ сообща.
Для дополнительной информации смотрите технический блог GPT-OSS, обучающие материалы на GitHub, а также присоединяйтесь к сообществу в Twitter и ML SubReddit.
Switch Language
Read this article in English