FILTER MODE ACTIVE

#Qwen2.5-Math

Найдено записей: 2

#Qwen2.5-Math28.05.2025

Удивительный рост математического мышления в Qwen2.5-Math при обучении на неверных и случайных наградах

Модели Qwen2.5-Math значительно улучшают математическое мышление даже при обучении с неправильными или случайными наградами, что выявляет уникальные особенности усиленного обучения.

#Qwen2.5-Math03.05.2025

Революция в математическом мышлении: как 1-shot reinforcement learning улучшает работу LLM

Исследователи показали, что обучение больших языковых моделей с помощью всего одного примера значительно улучшает их способности решать математические задачи, достигая результатов, сопоставимых с обучением на больших наборах данных.