Rubin CPX: GPU Nvidia для генерации видео и кода в экза-масштабе

Новый виток в аппаратной архитектуре для ИИ

Nvidia представила Rubin CPX — специализированный чип для задач с огромными контекстами, таких как создание длинного видео и генерация ПО для целых проектов. Ожидается выпуск к концу 2026 года. Главное в дизайне Rubin CPX — интеграция декодирования/кодирования видео и инференса ИИ в единую систему, что сокращает узкие места ввода-вывода и ускоряет конвейеры обработки данных.

Технические характеристики и производительность

Rubin CPX встроен в стэк Vera Rubin NVL144 и обеспечивает высокую плотность вычислений: Nvidia называет 8 экзафлопс, 100 ТБ памяти и чрезвычайно быстрые шины внутри стойки. Компания заявляет прирост производительности примерно в 7.5× по сравнению с решениями на базе Blackwell. Ключевой момент: оптимизация именно под длинный контекст — поддержка окон контекста свыше 1 миллиона токенов, что критично для генерации видео или для инструментов, которые должны анализировать большие кодовые базы.

Экономика и модели монетизации

Nvidia прогнозирует, что инвестиция в инфраструктуру Rubin CPX в размере $100 миллионов может открыть до $5 миллиардов дохода, генерируемого по токенной модели. Для операторов платформ и поставщиков API это может сделать экономически приемлемыми сервисы с большими контекстами и чувствительной к задержкам работой.

Практические сценарии применения

В индустрии контента Rubin CPX способен упростить автономный монтаж, создавать мгновенные подборки лучших моментов, выполнять трансформации видео в реальном времени и другие виды генеративного контента, ранее ограниченные размерами контекста и пропускной способностью. Для разработчиков и компаний увеличенное окно контекста позволит ассистентам по коду генерировать и рефакторить проекты целиком, а не только короткие фрагменты, что повышает их полезность в реальных рабочих процессах.

Контекст индустрии и поставки

Nvidia сообщает, что GPU Rubin и CPU Vera находятся в фазе tape-out и производства на TSMC, что подтверждает движение к целям 2026 года. При этом компания отмечает, что H100 и H200 доступны и не полностью распроданы. Параллельно в мире суперкомпьютеров происходит активность: Германия ввела в эксплуатацию экзафлопный суперкомпьютер Jupiter на базе технологий Nvidia, что отражает глобальные инвестиции в инфраструктуру для больших моделей ИИ.

На что обратить внимание дальше

В ближайшее время стоит следить за подтверждениями tape-out Rubin CPX, тестами производительности на реальных задачах по видео и коду, интеграциями с платформами контента и инструментами для разработчиков, а также за тем, как будут развиваться тарифные модели на основе токенов по мере внедрения этой инфраструктуры.