FILTER MODE ACTIVE

#GSM-бенчмарки

Найдено записей: 1

#GSM-бенчмарки06.07.2025

AbstRaL: Повышение устойчивости LLM через абстрактное мышление и обучение с подкреплением

AbstRaL использует обучение с подкреплением для обучения LLM абстрактному мышлению, что значительно повышает их устойчивость и точность на изменённых задачах GSM8K по сравнению с традиционными методами.