FILTER MODE ACTIVE

#Xbench

Найдено записей: 2

#Xbench24.06.2025

Кризис оценки ИИ: почему старые тесты не работают и что будет дальше

Традиционные бенчмарки перестают адекватно отражать реальные способности ИИ. Появляются новые методы оценки, такие как LiveCodeBench Pro и Xbench, которые предлагают более точное измерение возможностей моделей.

#Xbench23.06.2025

Китайская компания представила динамичный набор AI-бенчмарков для тестирования моделей

Китайская компания Hongshan Capital Global представила Xbench — постоянно обновляемый AI-бенчмарк, который оценивает модели на академических и практических задачах. Лидирует ChatGPT o3.