FILTER MODE ACTIVE

#Mixture-of-Experts

Найдено записей: 13

#Mixture-of-Experts18.11.2025

Uni-MoE-2.0-Omni: открытая омнимодальная MoE на базе Qwen2.5-7B для текста, изображений, аудио и видео

'Uni-MoE-2.0-Omni — открытая омнимодальная MoE на Qwen2.5-7B, объединяющая текст, изображение, аудио и видео с динамической маршрутизацией экспертов и сильными результатами на множестве бенчмарков.'

#Mixture-of-Experts12.08.2025

Zhipu AI представила GLM-4.5V: открытая мультимодальная модель с контекстом 64К и режимом Thinking Mode

'GLM-4.5V от Zhipu AI — открытая мультимодальная модель с 106B параметрами в фоне и 12B активных параметров, поддержкой 64К токенов и режимом Thinking Mode для сложного визуально-текстового анализа.'

#Mixture-of-Experts05.08.2025

OpenAI представила революционные открытые языковые модели: gpt-oss-120B для мощных ноутбуков и gpt-oss-20B для смартфонов

OpenAI представила две мощные открытые языковые модели, gpt-oss-120B и gpt-oss-20B, позволяющие запускать передовой ИИ локально на ноутбуках и смартфонах с полной настройкой и приватностью.

#Mixture-of-Experts01.08.2025

SmallThinker: Прорывные эффективные LLM, разработанные для локальных устройств

'SmallThinker представляет семейство эффективных больших языковых моделей, специально разработанных для локального развертывания на устройствах с ограниченными ресурсами. Эти модели демонстрируют высокую производительность и скорость при низком потреблении памяти.'

#Mixture-of-Experts25.07.2025

Alibaba запускает Qwen3-MT: революционный мультиязычный перевод на основе обучения с подкреплением

Alibaba представила Qwen3-MT — инновационную мультиязычную модель машинного перевода с обучением с подкреплением, обеспечивающую качественный и экономичный перевод на 92+ языках.

#Mixture-of-Experts23.07.2025

Qwen Представляет Qwen3-Coder-480B-A35B-Instruct: Самую Мощную Открытую Агентную Модель Для Кода

Qwen выпустила Qwen3-Coder-480B-A35B-Instruct — самую мощную открытую агентную модель для кода с масштабной архитектурой, широкой поддержкой языков и новым открытым CLI-инструментом Qwen Code.

#Mixture-of-Experts06.05.2025

Как модели Mixture-of-Experts меняют эффективность и масштабируемость ИИ

Модели Mixture-of-Experts активируют только части сети, что позволяет создавать огромные модели с эффективным использованием вычислений. Эта технология меняет подход к задачам в области языка, зрения и рекомендаций.

#Mixture-of-Experts04.05.2025

IBM Представляет Granite 4.0 Tiny: Компактная Открытая Модель для Длинных Контекстов и Инструкций

IBM выпустила Granite 4.0 Tiny Preview — компактную открытую языковую модель, оптимизированную для задач с длинным контекстом и инструкциями с высокой эффективностью и производительностью.

#Mixture-of-Experts29.04.2025

Alibaba Представляет Qwen3: Прорыв в Масштабируемых Многоязычных Моделях с Гибридным Рассуждением

Alibaba представила Qwen3 — новое поколение больших языковых моделей с гибридным рассуждением, многоязычной поддержкой и эффективным масштабированием, задающее новые стандарты в производительности AI.