<НА ГЛАВНУЮ

Anthropic превращает MCP в кодовые API и сокращает расход токенов

'Anthropic предлагает запускать сгенерированный моделью TypeScript против файловой версии MCP API, чтобы большие ответы инструментов не проходили через контекст модели и расход токенов резко снизился.'

Почему MCP‑агенты не масштабируются

Агенты, использующие Model Context Protocol, сталкиваются с практической проблемой масштабирования: описания инструментов и промежуточные результаты проходят через контекст модели. Когда в рабочем процессе много инструментов или большие полезные нагрузки, расход токенов, задержки и стоимость резко растут, а лимиты контекста быстро становятся узким местом.

Проблема прямых вызовов MCP‑инструментов

MCP — это открытый стандарт, который делает внешние системы доступными моделям через серверы, экспонирующие наборы инструментов. В обычной схеме агент загружает в контекст модели множество определений инструментов, каждое с описанием схемы и метаданными. Промежуточные результаты вызовов инструментов тоже стримятся обратно в контекст, чтобы модель могла принять решение о следующем шаге. В результате большие данные могут возвращаться через модель и затем передаваться снова, что сильно увеличивает расход токенов без изменения логики задачи.

Как Anthropic меняет модель с помощью исполнения кода

Anthropic предлагает другой подход: представить MCP‑серверы как кодовые API и запускать сгенерированный моделью код в песочнице. MCP клиент генерирует структуру файловой системы, которая отражает доступные серверы и инструменты. Для каждого инструмента создается тонкая обертка в виде файла, например servers/google-drive/getDocument.ts, который вызывает MCP инструмент с типизированными параметрами. Модель пишет TypeScript, импортирует эти обертки, управляет потоком вызовов и обрабатывает данные внутри среды выполнения. Большие промежуточные полезные нагрузки больше не проходят через модель.

Пример в действии

Ранее расшифровка долгой встречи из Google Drive могла сначала вернуться через модель и затем быть отправлена снова в Salesforce, что добавляло десятки тысяч токенов. С паттерном исполнения кода короткий скрипт TypeScript вызывает обертку Google Drive, обрабатывает транскрипт локально в среде выполнения и вызывает обертку Salesforce с итоговым резюме или небольшим примером. Модель видит только компактные результаты.

Количественный эффект

Anthropic приводит пример, где рабочий процесс сократил расход с примерно 150 000 токенов до около 2 000 токенов после перехода на файловую систему MCP API и цикл исполнения кода. Это сокращение составляет 98,7 процента для данного сценария и прямо уменьшает затраты и задержки.

Дизайнерские и эксплуатационные преимущества

Постепательное обнаружение инструментов: агенту не нужно загружать все определения инструментов заранее. Он может просматривать сгенерированную файловую структуру, перечислять доступные серверы и читать только нужные модули, что переводит каталоги инструментов из контекста модели в код.

Эффективная работа с данными: большие наборы остаются внутри среды выполнения. TypeScript может загрузить большую таблицу через обертку MCP, отфильтровать строки, посчитать агрегаты и передать модели только резюме или небольшие примеры.

Сохранение приватности: чувствительные поля можно токенизировать внутри среды выполнения. Модель видит плейсхолдеры, а MCP клиент хранит безопасное соответствие и восстанавливает реальные значения только при вызове downstream инструментов, что позволяет перемещать данные между серверами без утечки идентификаторов в модель.

Состояние и переиспользуемые навыки: файловая система позволяет сохранять промежуточные файлы и вспомогательные скрипты. Скрипт для преобразования таблицы в отчет можно поместить в каталог навыков и импортировать позже. Anthropic связывает эту идею с Claude Skills, где коллекции скриптов и метаданных формируют высшие уровни возможностей.

Безопасность и компромиссы

Перенос обработки в изолированную среду снижает расход токенов и задержки, но повышает требования к безопасности исполнения кода. Командам нужно тщательно контролировать биндинги, доступ в сеть и безопасную обработку секретов. Преобразование MCP в исполняемую поверхность API делает систему эффективнее, но возлагает новые обязанности на инженеров и операторов платформы.

Что это означает для разработчиков агентов

Представление MCP‑серверов как кодовых API — прагматичный путь решения ограничений контекстных агентов. Это сокращает накладные расходы по токенам, локализует тяжелую обработку данных и упрощает обнаружение и переиспользование инструментов. Для многих сценариев паттерн дает мгновенные выгоды по стоимости и задержке, одновременно меняя подход к проектированию и защите интеграций с моделями.

🇬🇧

Switch Language

Read this article in English

Switch to English