Новости

26.10.2025

Стресс-тест спецификаций моделей: исследование Anthropic и Thinking Machines выявляет, где модели расходятся

‘Команда из Anthropic и Thinking Machines провела стресс-тест спецификаций с 300k+ сценариев ценностных компромиссов и показала, что сильные расхождения предсказывают проблемы в спецификациях.’

23.10.2025

Odyssey: 102-миллиардная модель Anthrogen для белков с Consensus вместо внимания и обучением через дискретную диффузию

‘Odyssey представляет подход с Consensus и дискретной диффузией для совместного моделирования последовательности и 3D-структуры, масштабируясь до 102B параметров и экономя данные.’

23.10.2025

PokeeResearch-7B: открытый 7B агент исследований на RLAIF и многонишевой логике рассуждений

‘PokeeResearch-7B — открытый 7B агент глубоких исследований, дообученный с RLAIF и RLOO, который запускает несколько независимых исследовательских нитей и синтезирует ответы, повышая точность на ряде бенчмарков. Код и веса доступны под Apache-2.0.’

22.10.2025

VISTA: самосовершенствующийся агент Google для оптимизации текст‑видео на этапе инференса

‘VISTA — многозвенная тестовая петля, которая итеративно улучшает подсказки и отбирает лучшие видео, повышая визуальное, аудио и контекстное соответствие и получая высокие оценки в автоматических и человеческих тестах.’