FILTER MODE ACTIVE

#MLLM

Найдено записей: 4

#MLLM19.06.2025

ReVisual-R1: Новый этап в мультимодальном рассуждении с открытой моделью на 7 миллиардов параметров

ReVisual-R1 — инновационная открытая мультимодальная языковая модель на 7 млрд параметров, которая достигает высоких результатов в комплексном рассуждении благодаря уникальному трехэтапному процессу обучения.

#MLLM10.06.2025

VeBrain: Революция в робототехнике с объединённым мультимодальным ИИ для зрения и управления

VeBrain представляет единую мультимодальную систему ИИ, которая сочетает визуальное рассуждение и управление роботами, демонстрируя выдающиеся результаты в сложных реальных задачах.

#MLLM25.05.2025

GRIT: Метод обучения мультимодальных моделей логическому мышлению с изображениями и текстом

GRIT представляет инновационный метод, который обучает мультимодальные языковые модели объединять рассуждения с изображениями и текстом, значительно улучшая точность визуального обоснования и рассуждений при минимальном объёме данных.

#MLLM29.04.2025

UniME: Двухэтапная система для улучшения мультимодального обучения представлений с использованием MLLM

UniME представляет двухэтапный фреймворк, значительно улучшающий мультимодальное обучение представлений за счёт текстовой дистилляции и обучения с сложными негативами, превосходя существующие модели на множестве бенчмарков.