Google Представляет Vertex AI Memory Bank для Постоянных Разговоров с AI-Агентами
Google Cloud запускает Vertex AI Memory Bank, который позволяет AI-агентам сохранять память для улучшения персонализации и непрерывности разговоров.
Проблема Памяти в AI-Агентам
Разработчики давно сталкиваются с проблемой отсутствия у AI-агентов возможности запоминать предыдущие взаимодействия. Без памяти агенты воспринимают каждый разговор как первый, что приводит к повторяющимся вопросам, забыванию предпочтений пользователей и отсутствию персонализации. Это вызывает неудобства как у пользователей, так и у разработчиков.
Традиционные Решения и Их Ограничения
Ранее разработчики помещали весь диалог сессии в контекстное окно большой языковой модели (LLM). Этот способ обеспечивает некоторую непрерывность, но он затратен по вычислениям, замедляет ответы и увеличивает стоимость инференса. Кроме того, избыточный и нерелевантный контекст ухудшает качество ответов, вызывая потерю фокуса и "ротацию контекста".
Представляем Vertex AI Memory Bank
Новая служба Memory Bank от Google Cloud, доступная в публичном превью в составе Vertex AI Agent Engine, призвана изменить подход к диалоговым AI, обеспечивая постоянную память для агентов. Этот сервис позволяет агентам запоминать ключевые данные, предпочтения и прошлые взаимодействия, делая разговоры более персонализированными, контекстными и непрерывными.
Основные Преимущества Memory Bank
- Персонализация взаимодействий: Memory Bank запоминает предпочтения, ключевые события и прошлые выборы пользователя, позволяя создавать уникальные ответы.
- Непрерывность диалогов: Разговоры могут плавно продолжаться с того момента, на котором были прерваны, даже спустя длительное время.
- Улучшенный контекст: Агенты получают доступ к релевантной информации, что делает ответы более информативными и полезными.
- Повышение удобства для пользователя: Пользователям не нужно повторять информацию, что делает общение более естественным и эффективным.
Как Работает Memory Bank
Memory Bank использует продвинутый многоступенчатый процесс, основанный на моделях Gemini и новых исследованиях Google:
- Понимание и извлечение памяти: Анализирует историю разговоров, сохранённую в Agent Engine Sessions, и извлекает ключевые факты, предпочтения и контекст асинхронно без необходимости создания сложных конвейеров.
- Интеллектуальное хранение и обновление: Информация хранится по определённым областям, например, по ID пользователя. Gemini объединяет новую информацию с существующими данными, устраняя противоречия и поддерживая актуальность.
- Воспоминание релевантной информации: При начале новой сессии агент может извлечь сохранённые данные либо простым вызовом, либо через продвинутый поиск по сходству с помощью эмбеддингов, что обеспечивает релевантность контекста.
Этот подход основан на новом методе исследования, принятом на ACL 2025, который задаёт новый стандарт для памяти агентов с фокусом на интеллектуальное обучение и воспоминание по темам.
Начало Работы с Memory Bank
Memory Bank интегрируется с Agent Development Kit (ADK) и Agent Engine Sessions. Разработчики могут создавать агентов с помощью ADK и управлять историей сессий. Варианты интеграции:
- Использовать ADK для готового решения.
- Взаимодействовать через API Memory Bank при использовании других фреймворков, таких как LangGraph или CrewAI.
Для новичков доступен быстрый режим регистрации через Gmail с получением API-ключа и бесплатным использованием перед переходом к полноценному проекту Google Cloud.
Vertex AI Memory Bank открывает новые возможности для создания AI-агентов, которые запоминают, персонализируют и ведут более насыщенные беседы.
Switch Language
Read this article in English