FILTER MODE ACTIVE

#Mixture-of-Experts

Найдено записей: 13

#Mixture-of-Experts18.11.2025

Uni-MoE-2.0-Omni: открытая омнимодальная MoE на базе Qwen2.5-7B для текста, изображений, аудио и видео

'Uni-MoE-2.0-Omni — открытая омнимодальная MoE на Qwen2.5-7B, объединяющая текст, изображение, аудио и видео с динамической маршрутизацией экспертов и сильными результатами на множестве бенчмарков.'

ЧИТАТЬ →

#Mixture-of-Experts20.10.2025

Локальная революция: запуск GPT-OSS-20B на NVIDIA RTX для приватных и мгновенных LLM

gpt-oss-20b в связке с оптимизациями NVIDIA RTX позволяет запускать мощные приватные LLM локально, обеспечивая мгновенные ответы и безопасное дообучение на устройстве.

ЧИТАТЬ →

#Mixture-of-Experts24.09.2025

Alibaba представила Qwen3-Max — MoE на 1T+ параметров с production thinking mode и заметными бенчмарками

'Alibaba выпустила Qwen3-Max — MoE-модель класса 1T+ с production-ready thinking mode и сильными стартовыми результатами в кодинге и агентных бенчмарках; доступна через Qwen Chat и Model Studio.'

ЧИТАТЬ →

#Mixture-of-Experts12.08.2025

Zhipu AI представила GLM-4.5V: открытая мультимодальная модель с контекстом 64К и режимом Thinking Mode

'GLM-4.5V от Zhipu AI — открытая мультимодальная модель с 106B параметрами в фоне и 12B активных параметров, поддержкой 64К токенов и режимом Thinking Mode для сложного визуально-текстового анализа.'

ЧИТАТЬ →

#Mixture-of-Experts05.08.2025

OpenAI представила революционные открытые языковые модели: gpt-oss-120B для мощных ноутбуков и gpt-oss-20B для смартфонов

OpenAI представила две мощные открытые языковые модели, gpt-oss-120B и gpt-oss-20B, позволяющие запускать передовой ИИ локально на ноутбуках и смартфонах с полной настройкой и приватностью.

ЧИТАТЬ →

#Mixture-of-Experts01.08.2025

SmallThinker: Прорывные эффективные LLM, разработанные для локальных устройств

'SmallThinker представляет семейство эффективных больших языковых моделей, специально разработанных для локального развертывания на устройствах с ограниченными ресурсами. Эти модели демонстрируют высокую производительность и скорость при низком потреблении памяти.'

ЧИТАТЬ →

#Mixture-of-Experts25.07.2025

Alibaba запускает Qwen3-MT: революционный мультиязычный перевод на основе обучения с подкреплением

Alibaba представила Qwen3-MT — инновационную мультиязычную модель машинного перевода с обучением с подкреплением, обеспечивающую качественный и экономичный перевод на 92+ языках.

ЧИТАТЬ →

#Mixture-of-Experts23.07.2025

Qwen Представляет Qwen3-Coder-480B-A35B-Instruct: Самую Мощную Открытую Агентную Модель Для Кода

Qwen выпустила Qwen3-Coder-480B-A35B-Instruct — самую мощную открытую агентную модель для кода с масштабной архитектурой, широкой поддержкой языков и новым открытым CLI-инструментом Qwen Code.

ЧИТАТЬ →

#Mixture-of-Experts03.07.2025

DeepSeek R1T2 Chimera: революция в LLM с ускорением на 200% и улучшенным выводом

DeepSeek-TNG представила R1T2 Chimera — новую Assembly-of-Experts LLM модель, которая работает вдвое быстрее R1-0528 и улучшает рассуждения, доступна под лицензией MIT.

ЧИТАТЬ →

#Mixture-of-Experts01.07.2025

Baidu представляет ERNIE 4.5: открытые LLM от 0.3B до 424B параметров

Baidu выпустила ERNIE 4.5 — серию открытых больших языковых моделей с параметрами от 0.3 до 424 миллиардов, обладающих продвинутой архитектурой и высокой производительностью в многоязычных задачах.

ЧИТАТЬ →

#Mixture-of-Experts06.05.2025

Как модели Mixture-of-Experts меняют эффективность и масштабируемость ИИ

Модели Mixture-of-Experts активируют только части сети, что позволяет создавать огромные модели с эффективным использованием вычислений. Эта технология меняет подход к задачам в области языка, зрения и рекомендаций.

ЧИТАТЬ →

#Mixture-of-Experts04.05.2025

IBM Представляет Granite 4.0 Tiny: Компактная Открытая Модель для Длинных Контекстов и Инструкций

IBM выпустила Granite 4.0 Tiny Preview — компактную открытую языковую модель, оптимизированную для задач с длинным контекстом и инструкциями с высокой эффективностью и производительностью.

ЧИТАТЬ →

#Mixture-of-Experts29.04.2025

Alibaba Представляет Qwen3: Прорыв в Масштабируемых Многоязычных Моделях с Гибридным Рассуждением

Alibaba представила Qwen3 — новое поколение больших языковых моделей с гибридным рассуждением, многоязычной поддержкой и эффективным масштабированием, задающее новые стандарты в производительности AI.

ЧИТАТЬ →