DeepFleet предсказывает трафик: Amazon использует ИИ для координации миллиона роботов

Amazon отметил важную веху: в глобальных центрах выполнения и сортировки компания развернула свой миллионный робот. Одновременно Amazon представила DeepFleet — набор foundation моделей, обученных на миллиардах часов реальных данных, способных прогнозировать поведение флота, снижать заторы и повышать эффективность роботов до 10%.

Foundation модели в задачах мульти-роботов

Foundation модели изменили подходы в обработке языка и изображений, обучаясь на огромных объёмах данных и выявляя общие закономерности. Amazon применяет ту же идею к робототехнике: прогнозирование взаимодействий тысяч мобильных агентов в меняющейся среде требует моделей, которые обобщают поведение по разным площадкам, поколениям роботов и рабочим циклам.

Почему прогноз важен для складов

В центрах выполнения роботы доставляют полки с товарами к сотрудникам, а в сортировочных центрах перемещают посылки по сложным площадям. При масштабировании флота до сотен тысяч агентов локальные пробки, тупики и замедления могут быстро приводить к каскадным задержкам. Прогнозные модели позволяют заранее перенаправлять, перераспределять задачи или регулировать поток, снижая простои и повышая пропускную способность.

Четыре архитектуры DeepFleet

DeepFleet исследует разные индуктивные приёмы для моделирования динамики множества роботов:

Robot-Centric (RC): авторегрессионный трансформер, ориентированный на отдельного робота, использующий локальные наблюдения — соседних роботов, объекты, метки на полу. Он обрабатывает асинхронные обновления и работает вместе с детерминированным симулятором среды. Модель имеет 97 миллионов параметров и показала наименьшие ошибки в прогнозах позиции и состояния.
Robot-Floor (RF): использует механизм cross-attention для объединения состояний роботов с глобальными характеристиками пола, такими как вершины и ребра графа. Синхронное декодирование баланcирует локальные взаимодействия с контекстом всего склада. RF насчитывает около 840 миллионов параметров и показала хорошие результаты в предсказании времени действий.
Image-Floor (IF): рассматривает склад как многоканальное изображение, применяет сверточные кодировщики для пространства и трансформеры для временных последовательностей. На большом масштабе модель хуже справлялась с захватом тонких пиксельных взаимодействий между роботами.
Graph-Floor (GF): представляет пол как пространственно-временной граф и сочетает графовые нейронные сети с трансформерами. GF эффективно моделирует глобальные отношения и при 13 миллионах параметров показал конкурентоспособные результаты, оставаясь малозатратным в вычислительном плане.

Архитектуры различаются по временному подходу (синхронный против событийно-ориентированного) и по пространственной перспективе (локальная агент-центричность против глобального представления пола), что позволяет выбирать оптимальные решения для прогнозирования на большом масштабе.

Метрики, масштабирование и вычислительные компромиссы

Оценки проводились с использованием динамического искривления времени (DTW) для точности траекторий и ошибки задержки из-за заторов (CDE) для реалистичности операций. RC лидировал с DTW позиции 8.68 и CDE 0.11%. GF продемонстрировал сильные результаты при гораздо меньшем числе параметров, что подчёркивает компромисс между точностью и вычислительными ресурсами.

Исследования масштабирования показали знакомую картину: увеличение модели и данных снижает функцию потерь. Для GF экстраполяции указывают, что версия на миллиард параметров, обученная на миллионах эпизодов, может эффективно использовать вычисления. Главное преимущество Amazon — огромное количество реальных часов работы роботов для обучения, что помогает моделям обобщать поведение в разных сценариях.

Реальное влияние на операции

DeepFleet уже внедряется в сети Amazon из более чем 300 объектов по всему миру, в том числе в недавних развертываниях в Японии. Ближайшие применения включают прогнозирование заторов, адаптивную маршрутизацию и улучшенное распределение задач. Повышая эффективность перемещений и снижая узкие места, DeepFleet ускоряет обработку посылок и уменьшает операционные расходы, с заявленным эффектом до 10%.

Amazon также акцентирует внимание на развитии кадров: с 2019 года компания обучила и повысила квалификацию более 700 000 сотрудников в областях, связанных с робототехникой и ИИ, что позволяет сочетать автоматизацию с безопасными и более высокооплачиваемыми рабочими функциями.

Перспективы

Amazon будет продолжать совершенствовать варианты RC, RF и GF, изучая компромиссы масштаба и развертывания. По мере того как методы foundation моделей переходят из цифровой среды в физическую автоматизацию, DeepFleet показывает, как прогнозный, основанный на данных контроль может перевести системы мульти-роботов от реактивного управления к проактивной большой-табличной оркестровке и потенциально изменить логистику и другие отрасли, зависящие от координированной робототехники.