FILTER MODE ACTIVE

#ASR

Найдено записей: 11

#ASR05.10.2025

Оценка голосовых ассистентов в 2025: от WER к задаче-успеху, перехватам и галлюцинациям под шумом

'Руководство по комплексной оценке голосовых ассистентов: выход за пределы WER к метрикам успеха задач, перехватам, галлюцинациям под шумом и перцептуальному качеству.'

#ASR09.09.2025

Qwen3-ASR Flash: единая модель Alibaba для многоязычного и шумоустойчивого распознавания речи

'Qwen3-ASR Flash — единая модель Alibaba для автоматического распознавания речи на 11 языках, поддерживающая вставку контекста и показывающая WER ниже 8% в шумных и музыкальных условиях.'

#ASR17.07.2025

NVIDIA представляет Canary-Qwen-2.5B: ведущая гибридная модель ASR-LLM с непревзойденной точностью и скоростью

Модель Canary-Qwen-2.5B от NVIDIA устанавливает новый рекорд точности распознавания речи и обеспечивает высокую скорость обработки. Открытая и лицензированная для коммерческого использования, она объединяет транскрипцию и понимание языка в одном решении.

#ASR17.07.2025

Mistral AI представляет Voxtral: лучшие открытые модели распознавания речи с продвинутым пониманием аудио

Mistral AI выпустила Voxtral — современные открытые модели распознавания речи, объединяющие транскрипцию и понимание языка с поддержкой длинного аудиоконтекста и нескольких языков.

#ASR06.05.2025

NVIDIA выпустила Parakeet TDT 0.6B: сверхбыстрая и точная модель распознавания речи с открытым исходным кодом

NVIDIA представила Parakeet TDT 0.6B — открытую модель ASR, которая транскрибирует час аудио за одну секунду и достигает лучших показателей точности, устанавливая новый стандарт в индустрии.