Когда AI действительно приносит пользу: инференс в производстве и на масштабах

Почему именно инференс приносит ценность

Обучение модели ИИ для прогнозирования отказов оборудования — важная инженерная задача, но реальная бизнес-ценность возникает тогда, когда предсказание приводит к действию. Инференс — это оперативный уровень, который применяет обученные модели в рабочих процессах и переводит анализ в измеримые результаты. Как отмечает Крейг Парtridge, «истинная ценность ИИ заключается в инференсе». Когда инференс заслуживает доверия и работает в масштабе, организации получают наибольшую отдачу от инвестиций в ИИ.

Доверие как база

Trusted inferencing означает, что пользователи могут полагаться на ответы системы. Это важно для простых задач вроде генерации маркетинговых текстов, и критически важно для сценариев с высокими рисками — например, робота, помогающего во время операций, или автономного автомобиля.

Создание доверия начинается с качества данных: «Плохие входные данные дают плохой инференс», предупреждает Парtridge. Некачественные данные порождают ненадежные ответы, галлюцинации и контент, который засоряет рабочие процессы и вынуждает сотрудников тратить время на проверку фактов. По словам Кристиана Райхенбаха, многие организации застряли на этапе экспериментов и не переходят к операционной стадии. Когда результаты ненадежны, доверие падает, выгоды от продуктивности не достигаются, и ожидаемых бизнес-эффектов не происходит.

С другой стороны, правильно спроектированный доверенный инференс дает командам надежных помощников, повышающих скорость и точность работы. Например, команда сетевых операций получает круглосуточного участника, который предоставляет быстрые и персонализированные рекомендации по устранению неполадок.

Переход от модели-центричности к данным и появление AI-фабрики

Первая волна ИИ была ориентирована на модели и найм дата-сайентистов. По мере перехода пилотов в продакшн фокус смещается в сторону инженерии данных, архитектуры и ликвидации барьеров между хранилищами данных, чтобы быстро извлекать ценность из потоков данных. Райхенбах называет это появлением "AI-фабрики" — постоянно работающей производственной линии, где данные проходят по конвейеру и в замкнутых циклах дают непрерывную аналитику.

Это изменение поднимает стратегические вопросы: насколько интеллектуальная часть (модель) действительно принадлежит вам, и насколько уникальны ваши входные данные — от клиентов, операций или рынка? Ответы влияют на платформенную стратегию, операционные модели, роли инженеров и требования к доверию и безопасности.

Четырехквадрантная модель AI-фабрики HPE

Парtridge выделяет четыре квадранта, описывающих соотношение моделей и данных:

Run: доступ к внешним предобученным моделям через API; организация не владеет моделью и данными; требуются безопасность, управление и центр компетенций.
RAG (retrieval augmented generation): объединение внешних моделей с проприетарными данными компании для получения уникальных инсайтов; фокус на подключении потоков данных к инференсу.
Riches: обучение кастомных моделей на данных предприятия для дифференциации; требует масштабируемой, энергоэффективной инфраструктуры и часто высокопроизводительных систем.
Regulate: использование кастомных моделей, обученных на внешних данных, с усиленным вниманием к правовым и регуляторным требованиям при работе с чувствительными данными.

Эти квадранты не исключают друг друга: организации обычно действуют сразу в нескольких квадрантах, создавая собственные модели и затем предоставляя интеллектуальные возможности клиентам через «Run».

IT — лидер масштабирования

Переход от пилотов к масштабному применению выявляет ключевую проблему: то, что работает для нескольких кейсов, часто ломается при распространении по всей организации. Парtridge убежден, что IT-организация лучше всего подготовлена для масштабирования ИИ, потому что ее компетенция — внедрять дисциплину и операционные практики.

Пример с миграцией в облако показывает риск: когда IT не участвовало в принятии решений, бизнес-подразделения развернули сервисы самостоятельно, что привело к фрагментации, лишним расходам и уязвимостям безопасности. С ИИ та же динамика может привести к "теневому ИИ", когда инструменты используются без надзора.

Задача IT — не запрещать эксперименты, а упорядочить их: выстроить платформенную стратегию данных с ограждениями и фреймворком управления, обеспечить доступность данных и стандартизацию инфраструктуры, защиту целостности данных и доверия к бренду, сохранив при этом скорость и гибкость, необходимые для ИИ.

Практические выводы

Успех сводится к тому, чтобы понимать, где и как вы играете: когда использовать внешние модели (Run), когда обогащать их с помощью RAG, где инвестировать в собственные модели и данные (Riches) и когда регулировать использование чужих данных (Regulate). Победители будут те, кто согласует технологические амбиции с управлением, ответственностью и созданием ценности.

Операционализация инференса — это задача людей, процессов и технологий: обеспечьте качество данных и доверие, постройте data-centric конвейеры для непрерывной аналитики и доверьте IT координацию и управление ИИ по всему предприятию.

Для дополнительной информации зарегистрируйтесь на EmTech AI Salon от MIT Technology Review с участием HPE.

Этот материал подготовлен Insights, подразделением по созданию заказного контента MIT Technology Review. Он не был написан редакцией MIT Technology Review.