Darwin Gödel Machine: Революция в AI с саморазвивающимся кодом и реальными бенчмарками

Ограничения традиционных AI-систем

Традиционные AI-модели ограничены статичными архитектурами, созданными человеком, и не способны самостоятельно совершенствоваться после запуска. В отличие от человеческого научного прогресса, который развивается итеративно, эти модели остаются фиксированными и не эволюционируют.

Представляем Darwin Gödel Machine

Darwin Gödel Machine (DGM) — инновационная AI-система, разработанная исследователями из Sakana AI, Университета Британской Колумбии и Института Вектора. В отличие от теоретической машины Гёделя, основанной на доказуемых модификациях, DGM использует эмпирическое обучение, самостоятельно изменяя свой код и опираясь на результаты реальных бенчмарков, таких как SWE-bench и Polyglot.

Использование foundation-моделей и эволюционного дизайна

DGM применяет замороженные foundation-модели для генерации и выполнения кода. Начиная с базового агента, способного к самоизменению, система итеративно создает новые варианты. Эти варианты оцениваются, и те, что успешно компилируются и показывают улучшения, сохраняются. Этот процесс напоминает биологическую эволюцию, поддерживая разнообразие и позволяя изначально менее удачным дизайнам развиваться в более совершенные.

Результаты бенчмарков и их подтверждение

Тестирование на SWE-bench показало рост производительности с 20.0% до 50.0%, на Polyglot точность увеличилась с 14.2% до 30.7%. Это доказывает способность DGM улучшать архитектуру и логику без участия человека. Сравнение с упрощенными версиями без возможности самоизменения или исследования подтвердило важность обеих функций для постоянного прогресса. DGM также превзошла вручную настроенные системы, такие как Aider, в нескольких сценариях.

Техническая значимость и вызовы

DGM переосмысливает концепцию машины Гёделя, заменяя формальные доказательства на итеративное улучшение, основанное на эмпирических данных. Он рассматривает улучшение AI как задачу поиска через пробу и ошибку архитектур агентов. Несмотря на высокую вычислительную сложность и пока что уступая экспертно настроенным системам, DGM предлагает масштабируемый путь к открытой эволюции AI, применимой в программной инженерии и других областях.

Перспективы создания общего AI с саморазвитием

Интеграция foundation-моделей, реальных бенчмарков и эволюционного поиска демонстрирует значительный прогресс и закладывает основу для более адаптивных AI-систем. Хотя текущие применения ограничены генерацией кода, будущие версии могут расшириться и приблизить нас к общему, саморазвивающемуся AI, ориентированному на человеческие цели.