FILTER MODE ACTIVE

#TTS

Найдено записей: 12

#TTS23.01.2026

Qwen3-TTS: Открытый многоязычный TTS с реальным временем

Изучите Qwen3-TTS от Alibaba Cloud — многоязычную систему TTS с управлением голосом и мгновенной реакцией.

ЧИТАТЬ →

#TTS20.01.2026

Дизайн полностью стримингового голосового агента

Создайте голосового агента с низкой задержкой, используя стриминг ASR, LLM и TTS.

ЧИТАТЬ →

#TTS18.11.2025

Uni-MoE-2.0-Omni: открытая омнимодальная MoE на базе Qwen2.5-7B для текста, изображений, аудио и видео

'Uni-MoE-2.0-Omni — открытая омнимодальная MoE на Qwen2.5-7B, объединяющая текст, изображение, аудио и видео с динамической маршрутизацией экспертов и сильными результатами на множестве бенчмарков.'

ЧИТАТЬ →

#TTS01.10.2025

Liquid AI выпустила LFM2-Audio-1.5B: энд-то-энд аудио‑модель с задержкой менее 100 мс

'Liquid AI представила LFM2-Audio-1.5B — компактную энд-то-энд аудио‑языковую модель, демонстрирующую задержку менее 100 мс и поддержку ASR, TTS и разговорных агентов.'

ЧИТАТЬ →

#TTS24.09.2025

Превратите фото в видео с голосом без водяных знаков

'Руководство по превращению папки с фото в видео с озвучкой без водяных знаков: выбор инструментов, рабочий процесс и тонкости экспорта.'

ЧИТАТЬ →

#TTS23.09.2025

Генерация видео на базе ИИ: как из промпта получается готовый клип

'Детальный разбор того, как инструменты на базе ИИ превращают идеи в готовые видео, с практическими советами по процессам, правам и выбору инструментов.'

ЧИТАТЬ →

#TTS17.09.2025

Создайте голосового AI-ассистента в реальном времени с Hugging Face (Whisper + FLAN-T5 + Bark)

'Узнайте, как собрать голосового ассистента на Whisper (ASR), FLAN-T5 (LLM) и Bark (TTS) с простым Gradio-интерфейсом в Colab.'

ЧИТАТЬ →

#TTS25.08.2025

VibeVoice-1.5B: открытая TTS-модель Microsoft для 90 минут мультиспикерного синтеза

'Microsoft выпустил VibeVoice 1.5B — открытую TTS модель, способную генерировать до 90 минут выразительной речи с поддержкой до четырех говорящих и кросс языкового синтеза.'

ЧИТАТЬ →

#TTS23.08.2025

Голосовые агенты: как работают и 9 платформ, которые стоит знать в 2025

'Узнайте, как работают голосовые агенты на базе ИИ, какие компоненты важны и какие 9 платформ лидируют в 2025 году.'

ЧИТАТЬ →

#TTS05.07.2025

Kyutai представила стриминговую TTS-модель на 2 млрд параметров с задержкой 220 мс и обучением на 2,5 млн часов

Kyutai представила инновационную стриминговую TTS-модель с 2 миллиардами параметров и задержкой 220 мс, обученную на 2,5 миллиона часов аудио. Модель поддерживает одновременную работу с несколькими пользователями и подходит для реального времени.

ЧИТАТЬ →

#TTS03.06.2025

Как технологии текст-в-речь меняют современные платформы для онлайн-обучения

Технологии текст-в-речь с ИИ меняют онлайн-образование, делая его более доступным, увлекательным и персонализированным для учеников по всему миру.

ЧИТАТЬ →

#TTS01.06.2025

Революция в образовании: как технологии озвучивания текста улучшают доступность

Технология озвучивания текста меняет образование, делая учебные материалы доступными для студентов с особыми потребностями и разнообразными учебными стилями, способствуя инклюзивности и гибкости обучения.

ЧИТАТЬ →