Darwin Gödel Machine: Революция в AI с саморазвивающимся кодом и реальными бенчмарками
Darwin Gödel Machine — новая AI-система, которая самостоятельно улучшает кодовые агенты, эволюционируя их код с помощью foundation-моделей и реальных бенчмарков, достигая значительных результатов.
Ограничения традиционных AI-систем
Традиционные AI-модели ограничены статичными архитектурами, созданными человеком, и не способны самостоятельно совершенствоваться после запуска. В отличие от человеческого научного прогресса, который развивается итеративно, эти модели остаются фиксированными и не эволюционируют.
Представляем Darwin Gödel Machine
Darwin Gödel Machine (DGM) — инновационная AI-система, разработанная исследователями из Sakana AI, Университета Британской Колумбии и Института Вектора. В отличие от теоретической машины Гёделя, основанной на доказуемых модификациях, DGM использует эмпирическое обучение, самостоятельно изменяя свой код и опираясь на результаты реальных бенчмарков, таких как SWE-bench и Polyglot.
Использование foundation-моделей и эволюционного дизайна
DGM применяет замороженные foundation-модели для генерации и выполнения кода. Начиная с базового агента, способного к самоизменению, система итеративно создает новые варианты. Эти варианты оцениваются, и те, что успешно компилируются и показывают улучшения, сохраняются. Этот процесс напоминает биологическую эволюцию, поддерживая разнообразие и позволяя изначально менее удачным дизайнам развиваться в более совершенные.
Результаты бенчмарков и их подтверждение
Тестирование на SWE-bench показало рост производительности с 20.0% до 50.0%, на Polyglot точность увеличилась с 14.2% до 30.7%. Это доказывает способность DGM улучшать архитектуру и логику без участия человека. Сравнение с упрощенными версиями без возможности самоизменения или исследования подтвердило важность обеих функций для постоянного прогресса. DGM также превзошла вручную настроенные системы, такие как Aider, в нескольких сценариях.
Техническая значимость и вызовы
DGM переосмысливает концепцию машины Гёделя, заменяя формальные доказательства на итеративное улучшение, основанное на эмпирических данных. Он рассматривает улучшение AI как задачу поиска через пробу и ошибку архитектур агентов. Несмотря на высокую вычислительную сложность и пока что уступая экспертно настроенным системам, DGM предлагает масштабируемый путь к открытой эволюции AI, применимой в программной инженерии и других областях.
Перспективы создания общего AI с саморазвитием
Интеграция foundation-моделей, реальных бенчмарков и эволюционного поиска демонстрирует значительный прогресс и закладывает основу для более адаптивных AI-систем. Хотя текущие применения ограничены генерацией кода, будущие версии могут расшириться и приблизить нас к общему, саморазвивающемуся AI, ориентированному на человеческие цели.
Switch Language
Read this article in English