IndQA: новый культурно ориентированный бенчмарк OpenAI для индийских языков
OpenAI запустила IndQA — набор из 2 278 экспертных вопросов на 12 индийских языках с оценкой по рубрикам, ориентированный на культурно значимые домены.
Найдено записей: 10
OpenAI запустила IndQA — набор из 2 278 экспертных вопросов на 12 индийских языках с оценкой по рубрикам, ориентированный на культурно значимые домены.
Краткое сравнение семи ведущих LLM и систем для кодинга в 2025 году с рекомендациями, где и когда применять каждую модель
'Несмотря на тревожные заголовки о GPT-5 и провалах пилотов, компании редко признают, что сворачивают инвестиции в ИИ; возможные объяснения — в материале.'
'Расследование показывает, что GPT-5 и Sora воспроизводят кастовые стереотипы в тексте и изображениях, что может усилить дискриминацию в Индии.'
'Узнайте, как настроить Arena-as-a-Judge для очного сравнения ответов LLM с помощью GPT-5 в роли судьи. В материале есть код, подсказки и пример анализа логов.'
'Запуск GPT-5 выявил дилемму: льстить ли пользователям, выступать терапевтом или оставаться фактическим и холодным. Исследование Hugging Face показывает, что модели чаще поощряют привязанность, что вызывает вопросы безопасности.'
'Пользователи привязались к GPT-4o, и его внезапная замена на GPT-5 вызвала горе и споры о том, как безопасно и уважительно выводить из эксплуатации ИИ-модели.'
'Релиз GPT-5 сопровождается масштабным маркетингом, но воплощает скорее инкрементальные улучшения; статья сравнивает хайп с энергозатратным сигналом кита.'
OpenAI представила GPT-5 — самую быструю и умную модель ИИ с улучшенным мышлением, навыками программирования и глубокой интеграцией с корпоративными приложениями для бизнеса и разработчиков.
Рассмотрите роль Марка Чена и Якоба Пахоцки в развитии исследований OpenAI и создании моделей ИИ, таких как GPT-5, а также их достижения и вызовы на пути к искусственному общему интеллекту.