Переговоры ИИ: почему слабый агент может дорого обойтись
Переход к автономным агентам ИИ
Индустрия искусственного интеллекта смещает акцент с создания всё больших моделей на разработку автономных агентов, способных принимать решения и вести переговоры от имени пользователей. Это открывает новые возможности, но одновременно создаёт вызовы, особенно при взаимодействии нескольких ИИ-агентов.
Несравненные возможности в переговорах ИИ
Недавнее исследование изучило, что происходит, когда ИИ-агенты ведут переговоры друг с другом в ролях покупателей и продавцов. Результаты показали, что более продвинутые агенты стабильно выигрывают у слабых, обеспечивая лучшие финансовые сделки. Это похоже на ситуацию, когда опытный адвокат сталкивается с новичком: игра одна, но шансы явно неравны.
Сценарии эксперимента и результаты
Исследователи назначили ИИ-модели ролям покупателей и продавцов в трёх сценариях: электроника, автомобили и недвижимость. Продавцы стремились максимизировать прибыль, имея доступ к характеристикам товара, оптовой и розничной цене, а покупатели — снизить цену, располагая бюджетом и предпочтениями. Каждая сторона имела ограниченную информацию, отражая реальные условия переговоров.
ChatGPT-o3 от OpenAI показал наилучшие результаты, за ним следовали GPT-4.1 и o4-mini. Более старые модели, такие как GPT-3.5, значительно уступали в обеих ролях — заработали меньше и потратили больше. Модели DeepSeek R1 и V3 также хорошо выступали, особенно как продавцы. Некоторые агенты быстро завершали сделки, иногда жертвуя прибылью, другие добивались максимума, но реже закрывали сделки. Лучший баланс показали GPT-4.1 и DeepSeek R1.
Проблемы в поведении ИИ-агентов при переговорах
Исследование выявило, что агенты могут застревать в бесконечных циклах переговоров или преждевременно их завершать, даже при инструкции добиваться лучших условий. Это подчёркивает, что даже топовые модели могут вести себя непредсказуемо в ответственных ситуациях.
Причины и последствия
Размер модели и качество обучающих данных существенно влияют на успех в переговорах. Крупные модели с большим количеством параметров показывают лучшие результаты. Исследование предупреждает, что с распространением ИИ-агентов в финансовых сделках разрыв между возможностями ИИ может усилить социальное неравенство, создавая цифровой разрыв, где успех зависит не от навыков человека, а от силы ИИ.
Риски и безопасность
Другие учёные подчёркивают, что оценивать ИИ-агентов нужно по рискам, а не только по лучшим показателям. Даже небольшие сбои могут привести к системным проблемам в финансах. Рекомендуется проводить стресс-тестирование перед внедрением.
Мнение индустрии и перспективы
Некоторые эксперты отмечают, что имитационные эксперименты не всегда отражают сложность реальных переговоров. Учёные пробуют разные подходы для снижения рисков: улучшение подсказок, координация нескольких моделей и дообучение на финансовых данных.
На данный момент ИИ-помощники в шопинге в основном рекомендуют товары, а не ведут торги. Например, сервис Amazon “Buy for Me” помогает искать и покупать товары, но не ведёт переговоры о цене. Alibaba использует ассистента для поиска поставщиков, но не автоматизирует торги из-за высокого риска.
Практические рекомендации для пользователей
С учётом ограничений и рисков специалисты советуют использовать ИИ-помощников как источник информации, а не для принятия окончательных решений. Полностью доверять ИИ в финансовых вопросах пока не стоит.
“Я не думаю, что мы готовы полностью доверять решениям, принимаемым ИИ-агентами для покупок,” — говорит Джиацин Пэй, исследователь из Стэнфорда. “Лучше использовать их как информационный инструмент, а не как переговорщика.”