Google открывает Data Commons для AI‑агентов с MCP‑сервером для публичной статистики
Общее описание
Google выпустил MCP‑сервер (Model Context Protocol) для Data Commons, который делает взаимосвязанные публичные наборы данных проекта — перепись, здоровье, климат, экономика — доступными для MCP‑клиентов и агентных систем. Сервер предоставляет стандартизированный интерфейс, позволяющий агентам обнаруживать переменные, разрешать сущности, получать временные ряды и генерировать отчёты на естественном языке.
Возможности MCP‑сервера
Data Commons MCP Server устраняет необходимость в ручном кодировании API‑вызовов для доступа к публичной статистике. Через совместимые с MCP клиенты агент может:
- Обнаруживать доступные переменные и покрытие по темам или регионам.
- Разрешать сущности и нормализовать географические идентификаторы.
- Получать выровненные временные ряды с учётом версий данных.
- Формировать аналитические результаты: таблицы, графики или сгенерированные тексты с указанием источников.
Google описывает процесс как «от первоначального обнаружения до генеративных отчётов», и предоставляет примеры подсказок для исследовательских, аналитических и генеративных задач.
Инструменты для разработчиков
Google разместил инструменты и примеры, которые упрощают интеграцию Data Commons в агентные конвейеры:
- Пакет на PyPI для программного доступа.
- Поток для Gemini CLI, позволяющий выполнять запросы к Data Commons через клиент MCP из командной строки.
- Пример для ADK и Colab, демонстрирующие, как встраивать запросы Data Commons в агенты Agent Development Kit и сочетать результаты с инструментами визуализации или хранения.
Почему MCP важен сейчас
MCP — это открытый протокол, который связывает LLM‑агентов с внешними инструментами и данными с едиными возможностями и транспортной семантикой. Публикация полноценного MCP‑сервера от Google позволяет обращаться к Data Commons тем же интерфейсом, который уже используют агенты для других источников. Это снижает количество вспомогательного кода при интеграции, поддерживает реестр обнаружения серверов и делает публичную статистику нативным источником данных при сохранении информации об источниках.
Примеры сценариев использования
- Исследовательский: «Какие данные по здоровью у вас есть для Африки?» — перечисление переменных, покрытия и источников.
- Аналитический: «Сравните ожидаемую продолжительность жизни, неравенство и рост ВВП для стран БРИКС.» — получение и нормализация рядов, выравнивание по версиям, возврат таблицы или графика.
- Генеративный: «Сгенерируй краткий отчёт о доходах и диабете по округам США.» — получение показателей, вычисление корреляций, включение доказательств источников.
Интеграция и реальные кейсы
- Gemini CLI / любой MCP‑клиент: устанавливаете пакет Data Commons MCP, указываете клиенту адрес сервера и отправляете NL‑запросы; клиент сам координирует вызовы инструментов.
- ADK‑агенты: используйте пример агента Google, чтобы составлять вызовы Data Commons вместе с собственными инструментами визуализации или хранения и возвращать результаты с источниками.
- Документация: доступна точка входа в MCP с быстрыми стартами и руководством пользователя.
Реальный пример и доступность
Google демонстрирует ONE Data Agent, созданного с помощью Data Commons MCP Server для кампании ONE. Агент позволяет аналитикам в области политики запрашивать десятки миллионов показателей финансирования здравоохранения на естественном языке, визуализировать результаты и экспортировать чистые наборы данных для дальнейшей работы.
Data Commons MCP Server уже доступен, есть quickstart для Gemini CLI и материалы для ADK. Репозиторий на GitHub содержит примеры, учебные материалы и ноутбуки.