FILTER MODE ACTIVE

#DeepSeek-R1

Найдено записей: 5

#DeepSeek-R101.10.2025

MLPerf Inference v5.1 (2025): что значат результаты для GPU, CPU и ускорителей ИИ

'MLPerf Inference v5.1 вводит DeepSeek-R1, Llama-3.1-8B и Whisper Large V3 и ужесточает интерактивные лимиты TTFT/TPOT; фильтруйте Closed, сценарий и качество для соответствия SLA.'

ЧИТАТЬ →

#DeepSeek-R125.07.2025

Agentic-R1: ИИ, меняющий решение математических задач через объединение языка и инструментов

Agentic-R1, созданный на базе DualDistill, объединяет рассуждения на языке и использование инструментов, превосходя традиционные модели ИИ в решении математических задач по точности и эффективности.

ЧИТАТЬ →

#DeepSeek-R113.06.2025

Исследование Apple выявляет критические ошибки в AI-моделях рассуждения через тесты на головоломках

Исследователи Apple обнаружили фундаментальные слабости в больших моделях рассуждения AI с помощью контролируемых тестов на головоломках, выявив резкое падение производительности с ростом сложности задач.

ЧИТАТЬ →

#DeepSeek-R128.04.2025

Tina: Компактные модели USC с большими успехами в экономичном обучении с подкреплением

Исследователи USC представляют Tina — семейство компактных моделей рассуждения, использующих LoRA и обучение с подкреплением для эффективного достижения высоких результатов с минимальными затратами.

ЧИТАТЬ →

#DeepSeek-R126.04.2025

DEER: Обучение не требуется — динамический ранний выход для крупных языковых моделей рассуждений

Исследователи представили DEER — новый метод без обучения, позволяющий крупным языковым моделям рассуждений динамически завершать рассуждения раньше, сокращая вычисления и повышая точность.

ЧИТАТЬ →