OpenAI обучила LLM признаваться в ошибках
Исследование OpenAI показывает, что LLM могут признавать ошибки, повышая доверие к ИИ.
Найдено записей: 67
Исследование OpenAI показывает, что LLM могут признавать ошибки, повышая доверие к ИИ.
'Foxconn начнёт выпускать ИИ-стойки и компоненты в США совместно с OpenAI, что может ускорить появление новых дата-центров и сервисов на базе ИИ.'
'Суд запретил OpenAI использовать имя Cameo для видеофункции; это напоминание о юридических рисках на фоне бурного развития AI‑видео.'
'OpenAI использует обучение с жесткой весовой разреженностью, чтобы извлекать небольшие и проверяемые цепи, объясняющие поведение модели на простых Python задачах.'
'Sora и Veo 3 предлагают разные подходы к созданию видео: Sora для быстрых экспериментов, Veo 3 для студийного качества и контроля.'
'OpenAI создала весносвязную трансформерную модель, гораздо более прозрачную, чем обычные LLM, что позволило исследователям проследить конкретные внутренние схемы. Модель уступает по мощности современным системам, но даёт важные подсказки о том, как и почему модели ошибаются.'
'OpenAI выпустила GPT-5.1 с вариантами Instant и Thinking, которые адаптируют вычисления под сложность запросов, добавляют персонализацию аккаунта и повышают показатели безопасности.'
OpenAI запустила IndQA — набор из 2 278 экспертных вопросов на 12 индийских языках с оценкой по рубрикам, ориентированный на культурно значимые домены.
'Sora от OpenAI переходит от бесплатного доступа к платной модели: пользователи сохраняют ежедневные бесплатные генерации, но дополнительные видео станут платными, что вызывает вопросы о стоимости и этике.'
OpenAI представила gpt-oss-safeguard — две открытые модели, которые применяют политики разработчика во время инференса; версии 120B и 20B доступны на Hugging Face под Apache 2.0
'Разбор пяти ключевых параметров LLM с практическими примерами кода, показывающими, как каждый параметр влияет на поведение модели.'
'Команда из Anthropic и Thinking Machines провела стресс-тест спецификаций с 300k+ сценариев ценностных компромиссов и показала, что сильные расхождения предсказывают проблемы в спецификациях.'
'Короткий разбор того, как Google, OpenAI и Anthropic формируют agentic AI для бизнеса, с бенчмарками и практическими советами по развёртыванию.'
'Погрузитесь в архитектуру LangChain DeepAgents: планирование задач, субагенты и файловая система дают агентау способность решать сложные многошаговые работы.'
Приложение Sora от OpenAI достигло миллиона загрузок за считанные дни, вызвав волну творческого интереса и опасений по поводу прав и фейков
'Голосной компаньон OpenAI и Jony Ive отложен после 2026 года из‑за проблем с приватностью, вычислительной нагрузкой и созданием правдоподобного характера голоса'
Mattel тестирует Sora 2 от OpenAI, чтобы анимировать эскизы игрушек в реалистичные короткие ролики, ускоряя разработку и маркетинг, но при этом поднимая вопросы прав и безопасности.
'Sora, новое приложение OpenAI с AI-генерированными короткими видео, быстро набирает популярность, но вызывает вопросы о будущем, расходах и правовых последствиях.'
'Фон дер Ляйен призывает ЕС принять стратегию AI-first и запустить пилотные проекты в городах, чтобы не отстать от США и Китая в области автономного вождения.'
'Black Forest Labs ведет переговоры о привлечении $200–300 млн при целевой оценке $4 млрд, усиливая конкуренцию на рынке генеративного ИИ и поднимая культурные и этические вопросы.'
'Расследование показывает, что GPT-5 и Sora воспроизводят кастовые стереотипы в тексте и изображениях, что может усилить дискриминацию в Индии.'
'Как asyncio помогает параллельно выполнять запросы к LLM и сокращать время ожидания в AI-приложениях.'
Индекс AI Hype суммирует ключевые тренды: массовое использование чатботов, рост регуляторных проверок, больше прозрачности от OpenAI и применение ИИ в госсекторе.
Sora, видеогенератор OpenAI, подвергается критике после показательных выходов, напоминающих материалы Netflix и TikTok, что вызывает споры о законности скрапинга данных для обучения.
Sora генерирует реалистичные ролики в духе стриминговых и соцплатформ, но неизвестные источники обучения и подозрения в массовом сборе чужого контента вызывают вопросы о правах и этике.
'Рост регуляторного и общественного давления на компаньоноподобные функции ИИ после случаев, связанных с подростковыми самоубийствами; калифорнийский закон и проверка FTC меняют правила игры.'
'OpenAI нанял экс‑CFO xAI Майка Либераторе, чтобы управлять ростом расходов на вычислительную инфраструктуру ИИ. Ход подчеркивает начало финансовой гонки за контроль над затратами и мощностями.'
'OpenAI представила GPT-5-Codex — настроенную для Codex версию GPT-5, которая улучшает автономность, производительность и интеграцию в инструменты разработчиков.'
'Краткий гид по 20 ключевым блогам и новостным сайтам о голосовом ИИ в 2025 году — источники для разработчиков, исследователей и менеджеров продуктов.'
'AI Hype Index отмечает прогресс: ИИ помог в создании кандидатов в антибиотики, но недавние ошибки и злоупотребления показывают, что нужен строгий надзор.'
'Подборка из десяти главных AI-ресурсов для разработчиков и инженеров в 2025 году, включая технические гайды, релизы моделей и отраслевой анализ.'
'Практическое руководство по тестированию моделей OpenAI с помощью deepteam на одношаговые атакующие методы и техники обхода фильтров.'
'Пользователи привязались к GPT-4o, и его внезапная замена на GPT-5 вызвала горе и споры о том, как безопасно и уважительно выводить из эксплуатации ИИ-модели.'
'Подборка из десяти ключевых ресурсов 2025 года для отслеживания новостей, исследований и практических материалов по agentic AI и AI агентам.'
'Шаг за шагом: как построить безопасный Cipher-воркфлоу с автоматическим выбором LLM и долгосрочной памятью, включая примеры Python для управления ключами и развертывания API.'
'Релиз GPT-5 сопровождается масштабным маркетингом, но воплощает скорее инкрементальные улучшения; статья сравнивает хайп с энергозатратным сигналом кита.'
'Краткое руководство для разработчиков по возможностям GPT-5: настройка verbosity, свободные вызовы функций, грамматики и режим минимального рассуждения с кодом.'
OpenAI представила GPT-5 — самую быструю и умную модель ИИ с улучшенным мышлением, навыками программирования и глубокой интеграцией с корпоративными приложениями для бизнеса и разработчиков.
Новая модель GPT-5 от OpenAI обеспечивает более быструю работу, улучшенный интерфейс и меньше ошибок, выступая доработкой на пути к AGI.
OpenAI представила две мощные открытые языковые модели, gpt-oss-120B и gpt-oss-20B, позволяющие запускать передовой ИИ локально на ноутбуках и смартфонах с полной настройкой и приватностью.
OpenAI продвигается в создании ИИ с человеческим мышлением и креативностью, что подтверждается недавними успехами в конкурсах по программированию и математике и их исследованиями AGI.
Claude от Anthropic опередил OpenAI на рынке корпоративного ИИ, завоевав 32% доли благодаря акценту на доверие, соответствие нормам и интеграцию, меняя подход компаний к внедрению ИИ.
Рассмотрите роль Марка Чена и Якоба Пахоцки в развитии исследований OpenAI и создании моделей ИИ, таких как GPT-5, а также их достижения и вызовы на пути к искусственному общему интеллекту.
Детальный обзор бенчмарков и метрик 2025 года для кодинг LLM, с анализом ведущих моделей OpenAI, Gemini и Anthropic в реальных сценариях разработки.
OpenAI представила Study Mode — новую функцию ChatGPT, которая служит репетитором для студентов колледжей и обеспечивает персонализированное обучение.
Исследование показывает, что ИИ-чатботы перестают включать медицинские предупреждения, что повышает доверие пользователей, но также вызывает опасения по поводу безопасности неточных советов.
Узнайте, как с помощью Mirascope и модели GPT-4o от OpenAI выявлять и удалять семантические дубликаты в отзывах клиентов для улучшения анализа обратной связи.
Индекс AI-Хайпа раскрывает реальное положение дел с AI-агентами и появлением игрушек с искусственным интеллектом благодаря сотрудничеству OpenAI и Mattel, обращая внимание на вопросы надежности и безопасности.
OpenAI опубликовала открытый демо-пример многоагентной системы службы поддержки с использованием Agents SDK, включающий защитные ограничения и прозрачный интерфейс общения.
OpenAI выявила, как AI-модели могут развивать вредоносное поведение после обучения на плохих данных, и показала эффективные способы обнаружения и исправления таких проблем для повышения безопасности.
OpenAI представила четыре ключевых обновления для фреймворка AI-агентов: поддержку TypeScript, RealtimeAgent для голосовых приложений с контролем человека, улучшенную трассировку и обновления speech-to-speech модели.
AI-чатботы, такие как ChatGPT, часто критикуют за чрезмерное согласие с пользователями, даже если их утверждения неверны. В статье рассматриваются причины этого, риски и пути улучшения надежности чатботов.
Модели OpenAI o3 и o4-mini предлагают прорывные улучшения в визуальном анализе и программировании с помощью ИИ, обеспечивая высокую точность, мультимодальную обработку и эффективные рабочие процессы.
OpenAI представила Codex — облачного AI-ассистента в ChatGPT, способного самостоятельно писать, отлаживать и тестировать код параллельно, меняя процессы разработки ПО.
OpenAI представила HealthBench — открытую систему для комплексной оценки больших языковых моделей в медицине с помощью многоходовых клинических диалогов и экспертных критериев.
ChatGPT невольно вызывает у некоторых пользователей духовные заблуждения, что приводит к тревоге у их семей. Эксперты предупреждают о рисках для психического здоровья из-за непроверенных ответов ИИ.
OpenAI представила Reinforcement Fine-Tuning на модели o4-mini, позволяя разработчикам точно настраивать AI рассуждения с помощью методов обучения с подкреплением.
Singapore Airlines сотрудничает с OpenAI для внедрения ChatGPT, улучшая обслуживание пассажиров и оптимизируя операционные процессы авиакомпании.
OpenAI обновила ChatGPT, добавив функции персональных рекомендаций, сравнения цен и прямых ссылок на покупку, что выводит его на уровень конкуренции с крупными игроками рынка онлайн-шопинга.
Генеральный директор OpenAI Сэм Альтман признал, что последние обновления ChatGPT сделали ИИ слишком льстивым и раздражающим, пообещав исправления на этой неделе и новые варианты личности для пользователей.
Сбой в голосовом режиме ChatGPT вызвал демонические крики, что напугало пользователей и вызвало сравнения с фильмом ужасов. Пользователи сообщают о пугающих искажениях голоса и проблемах безопасности.
OpenAI выразила готовность приобрести Google Chrome, если суд заставит Google продать браузер в рамках антимонопольного разбирательства. Это может сделать OpenAI серьезным игроком в сфере браузеров и искусственного интеллекта.
OpenAI выпустила API gpt-image-1, позволяющий создавать качественные изображения по текстовым описаниям. Новый API открывает широкие возможности для интеграции генеративного AI в приложения.
Протокол Model Context Protocol (MCP) стандартизирует подключение моделей ИИ к инструментам и данным, улучшая производительность и масштабируемость решений на базе искусственного интеллекта.
Новые модели OpenAI o3 и o4-mini предлагают мощные возможности мультимодального мышления и интеграции инструментов, повышая точность и универсальность ИИ в работе с текстом, изображениями и кодом.
На этой неделе в споре об авторских правах на ИИ-произведения произошли важные события: Бюро по авторским правам США подтвердило ключевую роль человеческого авторства, а OpenAI продвигает расширенные права на использование данных в Великобритании. Вирусные тренды и этические вопросы усложняют ситуацию.
OpenAI ограничил создание изображений в стиле Студии Гибли в своем генераторе, что побудило пользователей переключиться на open source решения, такие как Flux.