FILTER MODE ACTIVE

#Gemini-2.5

Найдено записей: 2

#Gemini-2.504.10.2025

TUMIX: смесь многoагентных моделей с использованием инструментов для улучшения сложного рассуждения

'TUMIX объединяет разнообразные инструментальные агенты и использует LLM-судью для ранней остановки, повышая точность на трудных задачах и снижая затраты на инференс.'

#Gemini-2.523.05.2025

MMLONGBENCH: Новый стандарт оценки долгоконтекстных моделей с визуально-языковым пониманием

Исследователи представили MMLONGBENCH — первый комплексный бенчмарк для оценки долгоконтекстных визуально-языковых моделей, выявляющий ключевые особенности и проблемы в их работе.