Смелый шаг Индии к созданию собственного AI на фоне глобальной конкуренции

Индийский AI: история двух стартапов

В Бангалоре запуск китайской языковой модели DeepSeek, сопоставимой с западными аналогами, но созданной с меньшими ресурсами, вызвал у индийских разработчиков смешанные чувства. Адитья Колави, основатель CognitiveLab, воспринял это как доказательство, что прорыв возможен даже при ограниченных средствах. В то же время Абхишек Аппервал, создатель одной из первых индийских foundation-моделей Pragna-1B, испытывал разочарование из-за нехватки финансирования, из-за чего его многоязычный проект, направленный на решение уникальных лингвистических задач Индии, не смог масштабироваться.

Проблемы развития AI в Индии

Индийская AI-сфера ограничена хроническим недофинансированием исследований и разработок — всего 0,65% ВВП против 2,68% в Китае и 3,5% в США. Многоязычность страны с 22 официальными языками и сотнями диалектов усложняет обучение языковых моделей, поскольку индийские языки занимают менее 1% онлайн-контента, а токенизаторы плохо обрабатывают индийские скрипты. Это усложняет создание эффективных многоязычных моделей по сравнению с англоязычными регионами.

Инициативы правительства и реакция индустрии

После запуска DeepSeek Министерство электроники и информационных технологий Индии (MeitY) быстро мобилизовало ресурсы, договорившись с облачными провайдерами о доступе к почти 19 000 GPU для исследований AI. Это вызвало волну заявок и привело к планам по разработке шести крупных моделей и 18 AI-приложений для ключевых секторов до конца 2025 года. Особое внимание уделили Sarvam AI, которому выделили средства на создание модели с 70 миллиардами параметров, оптимизированной для индийских языков.

Инновации в области индийского языкового AI

Стартапы Sarvam AI и Soket AI Labs создают решения для индийских языков. Sarvam выпустил OpenHathi-Hi-v0.1 — крупную открытую модель на хинди, обученную на 40 миллиардах токенов. Аппервал внедрил метод «сбалансированной токенизации», позволяющий небольшим моделям работать как крупные, учитывая агглютинативную грамматику и особенности индийских скриптов. Krutrim-2 нацелен на мультимодальные и голосовые приложения для 22 языков.

Финансирование, инфраструктура и развитие экосистемы

Амбиции Индии поддерживает программа IndiaAI с бюджетом 1,25 млрд долларов, предоставляющая более 18 000 GPU стартапам и финансирующая создание foundation-моделей. Несмотря на это, продолжаются дискуссии о закрытых и открытых моделях с точки зрения прозрачности и доступности. Доступ к вычислительным ресурсам остаётся узким местом, но государственные программы и более низкие затраты на дата-центры создают преимущества.

Стратегический фокус и перспективы

Стратегия Индии направлена на создание суверенного AI, адаптированного к местным лингвистическим и культурным особенностям, а не на прямое соперничество с гигантами вроде OpenAI. Ведущие эксперты советуют сосредоточиться на приложениях, талантах и нишевых преимуществах. Растущее сотрудничество государства и стартапов говорит о решимости преодолеть давние проблемы инноваций и занять уникальную позицию в глобальной AI-экосистеме.