OpenAI представила Sora 2 и iOS‑приложение с «камео» по согласию
Чем примечателен Sora 2
OpenAI выпустила Sora 2 — модель для генерации видео и аудио по тексту, сосредоточенную на физической правдоподобности, управляемости в нескольких кадрах и синхронизированной речи и звуках. В отличие от одиночных «демо» клипов, Sora 2 нацелена на симуляционное качество: улучшенное моделирование мира, поддержание состояния между кадрами и встроенная синхронизация аудио.
Реализм и контроль
Sora 2 демонстрирует более точное моделирование мира, устраняя типичные ошибки вроде «телепортации» объектов и корректно воспроизводя физические взаимодействия, например отскоки при промахах. Модель сохраняет состояние между кадрами, что позволяет вносить последовательные правки по инструкциям, и генерирует нативное аудио, выровненное по времени с видео, включая речь, окружающие звуки и звуковые эффекты.
Камео и приложение на iOS
OpenAI запустила новое приглашения по приглашению iOS‑приложение Sora, сначала в США и Канаде, построенное вокруг системы камео. Пользователи записывают короткое видео с аудио в приложении для верификации личности и захвата внешности. Владельцы камео контролируют, кто может использовать их изображение, и могут отозвать или удалить любое видео, включая черновики, где они появляются. Приложение делает упор на совместное создание и ремиксы при сохранении согласия владельца внешности.
Безопасность и происхождение контента
OpenAI описывает поэтапный запуск с ограничениями и мерами по отслеживанию происхождения. На старте платформа ограничивает загрузку изображений с фотореалистичными людьми и полностью блокирует загрузку видео. Sora 2 не поддерживает video-to-video на старте, блокирует текст‑видео для публичных фигур и не допускает генераций с реальными людьми, если только пользователь не согласился через функцию камео. При появлении реального человека применяются дополнительные пороги классификаторов.
Все выходы содержат метаданные C2PA и видимую движущуюся водяную метку при скачивании. Внутренние инструменты детекции используются для оценки происхождения, что делает прослеживаемость и доказуемость источника ключевыми элементами запуска.
Родительский контроль и философия контента
Параллельно с Sora OpenAI представила родительские настройки через ChatGPT. Родители могут включать подростков в неперсонализированную ленту, управлять правами на личные сообщения и контролировать функцию непрерывной прокрутки. Эти меры соответствуют философии ленты Sora, где приоритет — создание, а не потребление.
Доступ, цена и планы
Приложение Sora для iOS доступно для загрузки, доступ открывается по приглашениям. Sora 2 на старте бесплатна при ограничениях по вычислениям. Подписчики ChatGPT Pro получают доступ к экспериментальному уровню Sora 2 Pro на sora.com; поддержка в приложении появится позже. Доступ по API планируется после потребительского релиза, а контент Sora 1 Turbo остается в пользовательских библиотеках.
Что это означает
Sora 2 сигнализирует о переходе к управляемым, готовым к продакшену инструментам медиа‑генерации. Комбинация согласия на использование внешности, метаданных происхождения и видимых водяных знаков вместе с консервативными ограничениями при запуске показывает, что OpenAI делает ставку на безопасность и прослеживаемость при масштабировании возможностей генерации видео и аудио.