MIRIX: Революция в долговременной памяти AI-агентов с модульной мультиагентной архитектурой
MIRIX предлагает модульную мультиагентную систему памяти, которая обеспечивает долговременную и мультимодальную память для LLM-агентов, значительно улучшая их способность к персонализации и долгосрочному анализу.
Проблема памяти в LLM-агентах
Современные LLM-агенты значительно улучшили выполнение сложных задач. Однако их способность запоминать и анализировать пользовательскую информацию с течением времени остаётся ограниченной. Большинство таких агентов не сохраняют контекст за пределами одного запроса, что снижает их эффективность в реальных сценариях, где важны последовательность и персонализация.
MIRIX: модульная мультиагентная система памяти
Компания MIRIX AI представила MIRIX — модульную систему, обеспечивающую надёжную долговременную память для LLM-агентов. В отличие от текстоориентированных систем, MIRIX использует структурированную память разных типов, включая визуальные данные, и основана на архитектуре с несколькими координируемыми агентами.
Архитектура и компоненты памяти
Система включает шесть специализированных компонентов памяти, каждый управляется своим Memory Manager:
- Core Memory: хранит постоянную информацию об агенте и пользователе, разделённую на «persona» (профиль агента, тон, поведение) и «human» (данные пользователя: имя, предпочтения).
- Episodic Memory: фиксирует события и взаимодействия с временными метками и структурированными атрибутами.
- Semantic Memory: содержит абстрактные концепты, графы знаний и именованные сущности.
- Procedural Memory: хранит структурированные рабочие процессы и последовательности задач в формате JSON.
- Resource Memory: ведёт ссылки на внешние документы, изображения и аудио с описаниями.
- Knowledge Vault: защищает чувствительные данные, такие как креденшелы и ключи API, с жёстким контролем доступа.
Метапамять управляет этими компонентами, обеспечивая интеллектуальный маршрут сообщений, иерархическое хранение и эффективный поиск. Дополнительные агенты обеспечивают чат и интерфейс.
Активный поиск и взаимодействие
MIRIX использует механизм Active Retrieval: система сама определяет тему запроса, извлекает релевантные данные из всех компонентов памяти и помечает их для включения в системный запрос. Это снижает зависимость от устаревших знаний модели и улучшает точность ответов.
Используются стратегии поиска embedding_match, bm25_match и string_match для точного доступа к памяти. Архитектура готова к расширению новыми методами поиска.
Реализация и применение
MIRIX реализован как кроссплатформенный ассистент на React-Electron (UI) и Uvicorn (backend API). Система снимает скриншоты экрана каждые 1.5 секунды, отбрасывая повторяющиеся, и обновляет память пакетами примерно раз в минуту.
Данные загружаются на Gemini API в потоковом режиме, что позволяет обрабатывать визуальную информацию с задержкой менее 5 секунд. Пользователи взаимодействуют через чат, который использует различные компоненты памяти для персонализированных ответов. Семантическая и процедурная память отображаются в виде раскрывающихся списков для прозрачности.
Результаты тестирования
MIRIX демонстрирует высокие показатели на разных тестах:
- ScreenshotVQA: превосходит базовые модели с увеличением точности на 35% и сокращением объёма хранения на 99.9% по сравнению с текстовыми методами.
- LOCOMO: достигает 85.38% средней точности в задачах с долгими диалогами, опережая открытые системы более чем на 8 пунктов.
Модульная архитектура обеспечивает высокую производительность в мультиформатных и текстовых сценариях.
Перспективы и Memory Marketplace
MIRIX поддерживает лёгкие AI-устройства, такие как умные очки, обеспечивая гибридное хранение памяти на устройстве и в облаке. Возможности включают суммирование встреч, контекстуальное запоминание и моделирование привычек.
Инновационная функция Memory Marketplace представляет собой децентрализованную экосистему для безопасного обмена, монетизации и совместной персонализации памяти с управлением приватностью и сквозным шифрованием.
Часто задаваемые вопросы
Чем MIRIX отличается от других систем памяти? MIRIX предлагает мультикомпонентную, многомодальную память с мультиагентной архитектурой для масштабируемого и точного управления памятью.
Как обеспечивается низкая задержка обновления визуальной памяти? Потоковая загрузка с помощью Gemini API позволяет обновлять память за менее чем 5 секунд в активном режиме.
Совместим ли MIRIX с закрытыми LLM, например GPT-4? Да, MIRIX работает как внешняя система и может дополнять любые LLM вне зависимости от лицензии.
Подробности доступны в Paper, GitHub и на странице проекта.
Switch Language
Read this article in English