Google Представляет Vertex AI Memory Bank для Постоянных Разговоров с AI-Агентами

Проблема Памяти в AI-Агентам

Разработчики давно сталкиваются с проблемой отсутствия у AI-агентов возможности запоминать предыдущие взаимодействия. Без памяти агенты воспринимают каждый разговор как первый, что приводит к повторяющимся вопросам, забыванию предпочтений пользователей и отсутствию персонализации. Это вызывает неудобства как у пользователей, так и у разработчиков.

Традиционные Решения и Их Ограничения

Ранее разработчики помещали весь диалог сессии в контекстное окно большой языковой модели (LLM). Этот способ обеспечивает некоторую непрерывность, но он затратен по вычислениям, замедляет ответы и увеличивает стоимость инференса. Кроме того, избыточный и нерелевантный контекст ухудшает качество ответов, вызывая потерю фокуса и "ротацию контекста".

Представляем Vertex AI Memory Bank

Новая служба Memory Bank от Google Cloud, доступная в публичном превью в составе Vertex AI Agent Engine, призвана изменить подход к диалоговым AI, обеспечивая постоянную память для агентов. Этот сервис позволяет агентам запоминать ключевые данные, предпочтения и прошлые взаимодействия, делая разговоры более персонализированными, контекстными и непрерывными.

Основные Преимущества Memory Bank

Персонализация взаимодействий: Memory Bank запоминает предпочтения, ключевые события и прошлые выборы пользователя, позволяя создавать уникальные ответы.
Непрерывность диалогов: Разговоры могут плавно продолжаться с того момента, на котором были прерваны, даже спустя длительное время.
Улучшенный контекст: Агенты получают доступ к релевантной информации, что делает ответы более информативными и полезными.
Повышение удобства для пользователя: Пользователям не нужно повторять информацию, что делает общение более естественным и эффективным.

Как Работает Memory Bank

Memory Bank использует продвинутый многоступенчатый процесс, основанный на моделях Gemini и новых исследованиях Google:

Понимание и извлечение памяти: Анализирует историю разговоров, сохранённую в Agent Engine Sessions, и извлекает ключевые факты, предпочтения и контекст асинхронно без необходимости создания сложных конвейеров.
Интеллектуальное хранение и обновление: Информация хранится по определённым областям, например, по ID пользователя. Gemini объединяет новую информацию с существующими данными, устраняя противоречия и поддерживая актуальность.
Воспоминание релевантной информации: При начале новой сессии агент может извлечь сохранённые данные либо простым вызовом, либо через продвинутый поиск по сходству с помощью эмбеддингов, что обеспечивает релевантность контекста.

Этот подход основан на новом методе исследования, принятом на ACL 2025, который задаёт новый стандарт для памяти агентов с фокусом на интеллектуальное обучение и воспоминание по темам.

Начало Работы с Memory Bank

Memory Bank интегрируется с Agent Development Kit (ADK) и Agent Engine Sessions. Разработчики могут создавать агентов с помощью ADK и управлять историей сессий. Варианты интеграции:

Использовать ADK для готового решения.
Взаимодействовать через API Memory Bank при использовании других фреймворков, таких как LangGraph или CrewAI.

Для новичков доступен быстрый режим регистрации через Gmail с получением API-ключа и бесплатным использованием перед переходом к полноценному проекту Google Cloud.

Vertex AI Memory Bank открывает новые возможности для создания AI-агентов, которые запоминают, персонализируют и ведут более насыщенные беседы.