#Qwen2.5-Coder-7B-PPO24.05.2025
Обучение с подкреплением помогает LLM превосходить традиционные компиляторы в оптимизации ассемблерного кода
Исследователи разработали метод обучения с подкреплением, который позволяет LLM превосходить традиционные компиляторы в оптимизации ассемблерного кода, достигая ускорения 1,47× и 96% успешного прохождения тестов на тысячах реальных программ.