FILTER MODE ACTIVE

#OCR

Найдено записей: 11

#OCR29.10.2025

DeepSeek превращает текст в изображения, чтобы решить проблему памяти AI

'DeepSeek показал метод хранения текста как изображений, чтобы упаковать больше контекста в модели при меньшем числе токенов. Это может снизить нагрузку на вычисления и помочь моделям дольше запоминать беседы.'

#OCR18.08.2025

Ovis 2.5: мульти-модальные LLM от Alibaba с нативным разрешением и улучшённым визуальным мышлением

'Ovis2.5 (9B и 2B) от Alibaba улучшает визуальное восприятие и мультимодальное рассуждение с помощью NaViT и опционального режима размышления, достигая топ-результатов среди открытых моделей ниже 40B.'

#OCR15.05.2025

ByteDance представляет Seed1.5-VL: прорывная модель для мульти-модального искусственного интеллекта

ByteDance представила Seed1.5-VL — мощную модель vision-language, которая достигает лучших результатов на многих бенчмарках и продвигает мульти-модальное понимание и рассуждение в ИИ.

#OCR24.04.2025

Meta AI представляет Web-SSL: масштабируемое обучение визуальным представлениям без языка

Meta AI представила Web-SSL — семейство масштабируемых визуальных моделей, обученных без языка. Они показывают конкурентные результаты на мультимодальных задачах и ставят под вопрос необходимость языкового обучения.