AutoDS от Allen Institute: революция в научных открытиях с помощью баесовского сюрприза
AutoDS от Института Аллена — новый движок, который самостоятельно проводит научные открытия, используя баесовский сюрприз и большие языковые модели для генерации и проверки гипотез без заранее заданных целей.
Представляем AutoDS: движок для автономных научных открытий
Институт искусственного интеллекта Аллена (AI2) разработал AutoDS (Автономное открытие через сюрприз), инновационный движок для открытых автономных научных исследований. В отличие от традиционных AI-ассистентов, которые работают с заранее определёнными целями или запросами, AutoDS самостоятельно генерирует, проверяет и улучшает гипотезы, измеряя и стремясь к «баесовскому сюрпризу» — строгой метрике подлинных открытий, выходящих за рамки заданных человеком задач.
От целенаправленных исследований к исследованию, движимому любопытством
Обычные методы автономных научных исследований сосредоточены на ответах на конкретные вопросы, генерируя гипотезы, относящиеся к заданной проблеме, и экспериментально их проверяя. AutoDS кардинально меняет этот подход, имитируя любопытство учёных. Он самостоятельно решает, какие вопросы задавать, какие гипотезы исследовать и как развивать предыдущие результаты без заранее заданных целей.
Преодоление огромного пространства гипотез и приоритизация их проверки — серьёзная задача. AutoDS формализует понятие «сюрприз» — количественную оценку изменения убеждений о гипотезе до и после получения эмпирических данных.
Измерение баесовского сюрприза с помощью больших языковых моделей
В основе AutoDS лежит новая методика оценки баесовского сюрприза. Для каждой гипотезы современные большие языковые модели (LLM), такие как GPT-4o, выступают в роли вероятностных наблюдателей, выражая свои убеждения в виде вероятностей до и после проверки. Эти распределения моделируются с помощью бета-распределений, основанных на множественных сэмплах от LLM.
AutoDS вычисляет дивергенцию Кульбака-Лейблера между апостериорным и априорным распределениями, чтобы измерить сюрприз. Только значимые сдвиги убеждений, например, смена оценки с вероятно истинной на вероятно ложную, считаются настоящими открытиями, что помогает системе сосредоточиться на существенных результатах, а не на незначительных обновлениях.
Эффективный поиск гипотез с помощью Монте-Карло дерева поиска
Для эффективного исследования огромного пространства гипотез AutoDS использует Монте-Карло дерево поиска (MCTS) с прогрессивным расширением. Каждый узел дерева — это гипотеза, ветвления представляют новые гипотезы, основанные на предыдущих результатах. Такой подход позволяет сбалансировать поиск новых идей и развитие перспективных направлений.
В отличие от жадных или лучевых методов, которые могут преждевременно сузить поиск или чрезмерно зациклиться, MCTS обеспечивает высокую эффективность открытий при ограниченных вычислительных ресурсах. Эксперименты на 21 датасете из биологии, экономики и поведенческих наук показали, что AutoDS обнаруживает на 5–29% больше удивительных гипотез, чем традиционные методы.
Модульная многоагентная архитектура LLM
AutoDS координирует работу нескольких специализированных LLM-агентов, каждый из которых отвечает за отдельный этап научного процесса:
- Генерация гипотез
- Проектирование экспериментов
- Программирование и выполнение
- Анализ результатов и корректировка
Для удаления дубликатов используется иерархическая кластеризация на основе текстовых эмбеддингов LLM и проверки семантической эквивалентности, чтобы в итоговом наборе были только уникальные открытия.
Соответствие человеческой экспертизе и интерпретируемость
В ходе оценки экспертами с учёными степенями MS/PhD было выявлено, что 67% гипотез, отмеченных AutoDS как удивительные, также были признаны таковыми экспертами. Метрика баесовского сюрприза лучше коррелировала с человеческой оценкой, чем альтернативные показатели, такие как предсказанная интересность или полезность.
Различные научные области демонстрировали разные типы сдвигов убеждений: например, подтверждающие утверждения требуют более сильных доказательств, чтобы считаться удивительными, чем новые опровержения.
Практическая реализация и перспективы
AutoDS показал более 98% точности реализации по оценке экспертов. В настоящее время используется API-ориентированный подход к LLM, что создаёт задержки, но есть и вариант программного поиска, который работает быстрее, хотя и с меньшей концептуальной глубиной.
Хотя AutoDS пока является исследовательским прототипом с планами на открытый исходный код, его архитектура и успешные эксперименты открывают перспективы для масштабируемых AI-систем, ведущих научные открытия.
Подробнее о проекте можно узнать в статье, на GitHub и в блоге. Вся заслуга принадлежит исследовательской команде AI2.
Switch Language
Read this article in English