ShinkaEvolve: эволюция программ с LLM добивается SOTA в упаковке кругов примерно за 150 запусков

Что делает ShinkaEvolve

ShinkaEvolve от Sakana AI — это открытый фреймворк, который сочетает большие языковые модели (LLM) и эволюционный поиск для автоматического улучшения программ, решающих научные и инженерные задачи. Основная идея — достичь высокой эффективности по числу оценок, снижая количество запусков от тысяч до сотен.

Ключевые приёмы, которые снижают число запусков

Фреймворк экономит вычисления с помощью трёх взаимосвязанных механизмов:

Бенчмарки и результаты

Команда проверила ShinkaEvolve в четырёх областях и показала стабильные улучшения при маленьких бюджeтах:

Как устроен эволюционный цикл на практике

ShinkaEvolve хранит архив оцениваемых программ с фитнесом, публичными метриками и текстовой обратной связью. Каждый цикл включает:

  1. Выбор острова и родителей по адаптивной политике.
  2. Построение контекста мутации из топ-K программ и случайных “источников вдохновения”.
  3. Предложение правок через три оператора: диффы, полные переписывания и LLM-руководимые кроссоверы, с защитой неизменяемых областей кода метками.
  4. Фильтрация новизны и запуск только тех кандидатов, которые прошли судью.
  5. Обновление архива и статистики бандита по результатам выполнения, что влияет на выбор LLM в последующих поколениях.

Система также периодически генерирует мета-черновик с успешными стратегиями, который используется в подсказках для ускорения последующих поколений.

Конкретные инженерные выигрыши

ShinkaEvolve не просто применял заранее заданные методы. Были обнаружены следующие техники:

Сравнение с предыдущими системами

AlphaEvolve и подобные закрытые проекты показывали сильные результаты, но при значительно больших количествах оценок. ShinkaEvolve воспроизводит и превосходит результат по упаковке кругов при порядках меньших выборок и открывает весь стек под Apache-2.0. Абляции показывают, что адаптивный выбор родителей, фильтрация новизны и бандитная ансамбляция вносят существенный вклад в эффективность.

Где посмотреть и как запустить

Проект доступен под лицензией Apache-2.0 с публичным кодом, WebUI, примерами и ноутбуками. Технические детали и репозиторий находятся по адресу https://sakana.ai/shinka-evolve/.