FILTER MODE ACTIVE

#Qwen

Найдено записей: 6

#Qwen04.11.2025

Cache-to-Cache (C2C): прямое общение LLM через слияние KV-Cache

'Cache-to-Cache (C2C) дает LLM возможность обмениваться смыслом через KV-Cache, улучшая точность на несколько процентов и снижая задержку примерно в 2 раза по сравнению с текстовым обменом.'

ЧИТАТЬ →

#Qwen31.10.2025

Автономный мультиагентный оркестратор данных на лёгких моделях Qwen

'Руководство демонстрирует, как лёгкие Qwen-агенты автоматически анализируют инжест, проверяют качество и оптимизируют инфраструктуру в мультиагентном конвейере данных.'

ЧИТАТЬ →

#Qwen03.10.2025

NeuTTS Air — 748M-модель для on-device TTS с мгновенным клонированием голоса

'Neuphonic выпустила NeuTTS Air — 748M-параметровую on-device TTS-модель, клонирующую голос за ~3 секунды и работающую локально через GGUF-квантизации для CPU-first синтеза.'

ЧИТАТЬ →

#Qwen03.10.2025

Tinker от Thinking Machines: низкоуровневый API для распределённой дообучения LLM с контролем над шагами

'Tinker предоставляет низкоуровневый API для написания пользовательских тренировочных циклов локально с выполнением на управляемых кластерах; акцент на LoRA и переносимых весах.'

ЧИТАТЬ →

#Qwen08.09.2025

Преимущество RL: исследование MIT показало, что обучение с подкреплением снижает катастрофическое забывание по сравнению с SFT

'MIT доказали, что on-policy обучение с подкреплением сохраняет ранее приобретённые способности лучше, чем супервизированное дообучение, за счёт минимизации прямого KL-расхождения между базовой и адаптированной моделью.'

ЧИТАТЬ →

#Qwen30.08.2025

Как собрать и запустить мозго‑подобного иерархического агента рассуждения локально на Hugging Face

Практическое руководство по запуску мозгообразного иерархического агента рассуждения локально с бесплатной моделью Hugging Face, используя планирование, кодовые решатели, критику и синтез.

ЧИТАТЬ →