Новости

09.09.2025

7 MCP-серверов, меняющих Vibe Coding

‘Краткий обзор семи MCP-серверов, расширяющих рабочие процессы Vibe Coding через интеграции с Git, БД, браузером, памятью и исследованиями.’

08.09.2025

Преимущество RL: исследование MIT показало, что обучение с подкреплением снижает катастрофическое забывание по сравнению с SFT

‘MIT доказали, что on-policy обучение с подкреплением сохраняет ранее приобретённые способности лучше, чем супервизированное дообучение, за счёт минимизации прямого KL-расхождения между базовой и адаптированной моделью.’

07.09.2025

Галлюцинации не магия: почему LLM уверенно ошибаются и как бенчмарки это поощряют

‘Исследование объясняет галлюцинации LLM как следствие статистики предобучения и показывает, что бинарные бенчмарки поощряют угадывание; изменение схем оценивания может снизить уверенные ошибки.’

06.09.2025

Yandex представляет ARGUS: трансформер для рекомендаций на миллиард параметров

‘Yandex представил ARGUS — фреймворк трансформеров для рекомендаций, способный работать с миллиардом параметров и моделировать месячные истории пользователей, что привело к заметному росту метрик.’

04.09.2025

DeepMind обнаружил предел эмбеддингов, который ломает RAG на больших объёмах

DeepMind показал, что одно-векторные плотные эмбеддинги имеют математический предел, из-за которого поиск в RAG-системах рушится при больших объёмах; LIMIT-бенчмарк демонстрирует это даже на маленьких задачах.