FILTER MODE ACTIVE

#DeepSeek-R1

Найдено записей: 5

#DeepSeek-R125.07.2025

Agentic-R1: ИИ, меняющий решение математических задач через объединение языка и инструментов

Agentic-R1, созданный на базе DualDistill, объединяет рассуждения на языке и использование инструментов, превосходя традиционные модели ИИ в решении математических задач по точности и эффективности.

#DeepSeek-R113.06.2025

Исследование Apple выявляет критические ошибки в AI-моделях рассуждения через тесты на головоломках

Исследователи Apple обнаружили фундаментальные слабости в больших моделях рассуждения AI с помощью контролируемых тестов на головоломках, выявив резкое падение производительности с ростом сложности задач.

#DeepSeek-R128.04.2025

Tina: Компактные модели USC с большими успехами в экономичном обучении с подкреплением

Исследователи USC представляют Tina — семейство компактных моделей рассуждения, использующих LoRA и обучение с подкреплением для эффективного достижения высоких результатов с минимальными затратами.

#DeepSeek-R126.04.2025

DEER: Обучение не требуется — динамический ранний выход для крупных языковых моделей рассуждений

Исследователи представили DEER — новый метод без обучения, позволяющий крупным языковым моделям рассуждений динамически завершать рассуждения раньше, сокращая вычисления и повышая точность.