FILTER MODE ACTIVE

#Nemotron

Найдено записей: 2

#Nemotron14.10.2025

Думай прежде, чем предсказывать: RLP от NVIDIA внедряет усиленное обучение в стадию предтренировки

'NVIDIA RLP вознаграждает «думание» перед предсказанием, давая плотный позиционный сигнал информационного прироста и улучшая результаты в задачах рассуждения при меньшем количестве данных.'

#Nemotron12.08.2025

ProRLv2: NVIDIA удлиняет RL до 3000 шагов и усиливает способность LLM к рассуждению

ProRLv2 увеличивает горизонт RL до 3000 шагов и демонстрирует значительные улучшения рассуждения в компактных языковых моделях, подтверждённые приростами по математике, кодированию и логике.