ROMA от Sentient AI: Рекурсивный мета-агент для прозрачных и производительных мультиагентных систем

октября 12, 2025 · 3 min

Что такое ROMA

ROMA (Recursive Open Meta-Agent) — это открытая мета-агентная платформа от Sentient AI, которая моделирует рабочие процессы агентов в виде иерархического рекурсивного дерева задач. Родительские узлы разбивают сложную цель на подзадачи, передают контекст дочерним узлам и затем агрегируют их ответы, делая движение контекста явным и трассируемым.

Основной цикл: Atomize → Plan → Execute → Aggregate

ROMA задает минимальный рекурсивный цикл управления. Узел сначала атомизирует запрос, чтобы понять, является ли он атомарным. Если запрос неатомарный, планировщик разбивает его на подзадачи. Если атомарный, исполнитель запускает задачу с помощью LLM, инструмента или вложенного агента. Агрегатор затем объединяет выводы дочерних узлов в ответ родителя. Этот цикл повторяется рекурсивно для каждой подзадачи, формируя дерево зависимостей, которое выполняет независимые ветви параллельно и соблюдает порядок слева направо, когда подзадача зависит от предыдущего брата.

Наблюдаемость, трассировка и человек в петле

Информация движется сверху вниз при разбиении задач и снизу вверх при агрегировании результатов. ROMA предоставляет трассировку на уровне этапов с структурированными входами и выходами для каждого узла, что помогает разработчикам отлаживать промпты, использование инструментов и маршрутизацию с видимостью каждой трансформации. Можно вставлять контрольные точки с участием человека на любом узле для подтверждения плана или проверки ключевых фактов, что закрывает распространенный пробел в наблюдаемости у фреймворков агентов.

Интерфейс разработчика и интеграции

ROMA включает скрипт быстрого старта и поддерживает Docker или нативную установку, а также флаги для интеграции песочницы. Стек ориентирован на Backend: Python 3.12+ с FastAPI или Flask; Frontend: React и TypeScript с WebSocket в реальном времени; поддержку LLM через LiteLLM; и выполнение кода через изолированные E2B песочницы. Пути данных поддерживают монтирование S3 для предприятий, проверки инъекции путей и безопасную работу с AWS-учетными данными. При этом базовая архитектура управляет графом задач и зависимостями, а навыки остаются взаимозаменяемыми.

ROMA можно подключать к закрытым или открытым LLM, локальным моделям, детерминированным инструментам или другим агентам без изменения мета-слоя. Входы и выходы задаются через Pydantic для структурированного и аудируемого I/O во время выполнения и трассировки.

Почему рекурсия важна

Рекурсивное разбиение ограничивает контекст тем, что нужно каждому узлу, уменьшая разрастание промптов. Трассировка на уровне этапов с типизированным I/O делает поток прозрачным, так что ошибки диагностируемы, а не скрыты в черном ящике. Независимые дочерние узлы могут выполняться параллельно, а ребра зависимостей обеспечивают секвенирование, когда оно необходимо, превращая выбор модели, промпта и инструмента в контролируемые и наблюдаемые элементы цикла планировать-исполнять-агрегировать.

Бенчмарки и проверка

Sentient реализовала ROMA Search на базе ROMA для проверки архитектуры. На SEALQA (Seal-0), наборе для оценки многоджерельного рассуждения, ROMA Search показывает 45.6% точности, опережая Kimi Researcher с 36% и Gemini 2.5 Pro с 19.8%. ROMA также заявляет лучшие результаты по FRAMES для многошагового рассуждения и близкие к лучшим по SimpleQA для фактического извлечения. Эти результаты от вендора носят ориентировочный характер до независимого воспроизведения, но показывают конкурентоспособность архитектуры.

Применение и практический смысл

ROMA позиционируется как каркас для открытых мета-агентов. Его рекурсивное иерархическое дерево задач, трассировка этапов и контрольные точки с участием человека позволяют интегрировать любые модели, инструменты или агентов и использовать параллелизм для независимых ветвей. Такая архитектура упрощает создание многошаговых рабочих нагрузок — от финансового анализа до креативной генерации — обеспечивая явный поток контекста, типизированные интерфейсы и наблюдаемое выполнение.

Открытость и контроль разработчиков

ROMA выпущена под лицензией Apache-2.0 и уже включает инструменты, такие как FastAPI и React, интеграцию LiteLLM и пути для изолированного выполнения. Основная цель проекта — дать разработчикам контроль: понятные графы задач, типизированные интерфейсы и прозрачный поток контекста, чтобы команды могли быстро итеративно развивать и проверять каждую стадию в системах с длинной горизонтом задач.