FILTER MODE ACTIVE

#самообучение

Найдено записей: 4

#самообучение15.07.2025

MetaStone-S1: Революция в AI-рассуждениях с помощью рефлексивной генеративной модели

MetaStone-S1 представляет инновационный рефлексивный генеративный подход, достигая уровня OpenAI o3-mini по рассуждениям при значительно меньших вычислительных ресурсах и открывая новые пути для эффективного AI.

#самообучение12.06.2025

CURE: Революция в генерации кода и юнит-тестов с помощью самообучающегося обучения с подкреплением в LLM

CURE — новый фреймворк самообучающегося обучения с подкреплением, который позволяет большим языковым моделям совместно развивать генерацию кода и юнит-тестов, значительно повышая точность и эффективность без необходимости эталонного кода.

#самообучение23.04.2025

Революция в LLM: Самообучающиеся языковые модели без меток с помощью Test-Time Reinforcement Learning

Исследователи из Университета Цинхуа и Шанхайской лаборатории ИИ представили TTRL — новый метод, позволяющий большим языковым моделям улучшать свои результаты без размеченных данных, используя самооценку и обучение с подкреплением во время инференса.