<НА ГЛАВНУЮ

Google представила открытую AI-систему с Gemini 2.5 и LangGraph для многошагового поиска и анализа в интернете

Google выпустила открытую AI-систему, объединяющую Gemini 2.5 и LangGraph для автономного многошагового веб-поиска и генерации проверенных ответов с ссылками на источники.

Развитие AI-ассистентов для исследований за пределами статичных ответов

Разговорный AI значительно продвинулся, но большинство крупных языковых моделей (LLM) ограничены использованием статичных данных обучения. Они не могут самостоятельно выявлять пробелы в знаниях или синтезировать информацию в реальном времени, что часто приводит к неполным или устаревшим ответам, особенно по узким или быстро меняющимся темам. Чтобы решить эту проблему, AI-агенты должны выходить за рамки пассивных запросов — им необходимо обнаруживать недостающую информацию, выполнять автономный веб-поиск, проверять результаты и уточнять ответы, действуя как человеческий исследователь.

Полноценный исследовательский агент Google: Gemini 2.5 и LangGraph

Google в сотрудничестве с Hugging Face и сообществом с открытым исходным кодом представила полнофункциональный стек AI-исследовательского агента. Система включает фронтенд на React и бэкенд на FastAPI + LangGraph, объединяя генерацию языка с интеллектуальным управлением и динамическим веб-поиском.

Агент использует API Gemini 2.5 для обработки пользовательских запросов и генерации структурированных поисковых терминов. Затем он выполняет рекурсивные циклы поиска и анализа с помощью Google Search API, проверяя, отвечает ли каждый результат на исходный вопрос. Этот итеративный процесс продолжается до получения проверенного и ссылающегося на источники ответа.

Удобная архитектура и настройка для разработчиков

  • Фронтенд: Построен с использованием Vite и React, обеспечивает горячую перезагрузку и модульное разделение кода.
  • Бэкенд: Реализован на Python (3.8+) с FastAPI и LangGraph для автономного принятия решений, циклов оценки и уточнения запросов.
  • Структура: Логика агента находится в backend/src/agent/graph.py, UI-компоненты — в папке frontend/.
  • Локальный запуск: Требуются Node.js, Python и ключ API Gemini. Система запускается командой make dev или отдельным запуском фронтенда и бэкенда.
  • Эндпоинты: API бэкенда доступен по адресу http://127.0.0.1:2024, фронтенд — http://localhost:5173.

Такое разделение облегчает разработчикам настройку поведения агента или интерфейса, делая проект удобным для международных команд.

Основные возможности и производительность

  • Рефлексивные циклы: LangGraph-агент самостоятельно оценивает результаты поиска, выявляет пробелы в охвате и уточняет запросы без участия человека.
  • Отложенный синтез ответов: AI формирует ответ только после сбора достаточного объема информации.
  • Ссылки на источники: Ответы содержат встроенные гиперссылки на оригинальные ресурсы, повышая доверие и прозрачность.
  • Сценарии использования: Идеально подходит для академических исследований, корпоративных баз знаний, технической поддержки и консультационных сервисов, где важна точность и проверка.

Значение для автономных AI-исследований

Проект демонстрирует интеграцию автономного рассуждения и синтеза поиска непосредственно в рабочие процессы LLM. Агент не просто отвечает, он исследует, проверяет и адаптирует ответы в реальном времени. Это отражает переход от статичных чат-ботов к интеллектуальным и надежным AI-ассистентам для исследований.

Разработчики и исследователи по всему миру — от Северной Америки до Юго-Восточной Азии — могут быстро развернуть этот AI-стек с минимальными усилиями, используя популярные технологии FastAPI, React и Gemini API.

Ключевые выводы

  • Модульная архитектура React + LangGraph поддерживает автономную генерацию запросов и рефлексию.
  • Итеративное рассуждение обеспечивает достижение порогов уверенности через повторные поиски и оценки.
  • Встроенные ссылки на источники обеспечивают прозрачность.
  • Локальная настройка требует лишь Node.js, Python 3.8+ и ключ API Gemini.
  • Полностью открытый исходный код приглашает сообщество к развитию и расширению.

Объединив Gemini 2.5 и LangGraph, проект стал прорывом в автономном AI-рассуждении, автоматизируя исследовательские процессы без потери точности и прозрачности. Это новый стандарт для интеллектуальных, надежных и удобных для разработчиков AI-инструментов.

Подробнее на GitHub. Следите за проектом в Twitter, присоединяйтесь к сообществу ML SubReddit и подписывайтесь на рассылку новостей.

🇬🇧

Switch Language

Read this article in English

Switch to English