FILTER MODE ACTIVE

#foundation-модели

Найдено записей: 2

#foundation-модели08.09.2025

Преимущество RL: исследование MIT показало, что обучение с подкреплением снижает катастрофическое забывание по сравнению с SFT

'MIT доказали, что on-policy обучение с подкреплением сохраняет ранее приобретённые способности лучше, чем супервизированное дообучение, за счёт минимизации прямого KL-расхождения между базовой и адаптированной моделью.'

#foundation-модели06.06.2025

Darwin Gödel Machine: Революция в AI с саморазвивающимся кодом и реальными бенчмарками

Darwin Gödel Machine — новая AI-система, которая самостоятельно улучшает кодовые агенты, эволюционируя их код с помощью foundation-моделей и реальных бенчмарков, достигая значительных результатов.