Время на прочтение: 3 минут(ы)
OpenAI сделала большой шаг вперед, выпустив Sora — генератор видео, на основе искусственного интеллекта. Теперь вполне качественный ролик можно «надиктовать».
По словам компании, ИИ Sora может генерировать как реалистичные, так и фантастические сцены на основе текстовых инструкций продолжительностью до минуты. Если мы возьмем видеоролики, которые OpenAI разместил на своем сайте “без изменений” (т.е. мы видим результат первой выдачи, без дополнительного «допиливания» новыми запросами), то они действительно замечательны — и, возможно, помогут объяснить название системы искусственного интеллекта, что в переводе с японского означает “небо” (выше неба только космос).
Sora пока недоступна для широкой публики. На данный момент OpenAI заявила, что генератор видео будет доступен только так называемым red teamers, или специалистам по кибербезопасности, которые будут оценивать критические области на предмет вреда или рисков. OpenAI также предоставляет доступ некоторым художникам, дизайнерам и кинематографистам, чтобы получить обратную связь о том, как усовершенствовать модель ИИ, чтобы она стала “более полезной” для профессионалов и творческих работников.
При этом возможности создания коротких видеороликов, созданных с помощью искусственного интеллекта, безграничны. Как минимум, их длины достаточно для видеороликов в TikTok и YouTube, сказал Чжун-Ян Чжу, профессор Университета Карнеги-Меллон, который занимается исследованиями генеративного ИИ.
Sora также может быть использована для 3D-генерации, когда речь заходит о моделировании робототехники или самоуправляемых автомобилей, для которых требуется масса обучающих данных, учитывающих светофоры или автомобильные аварии. Само получение этих данных (видеозаписи реальных камер) и их приобретение является дорогостоящим — это, пусть и отчасти, объясняет, почему внедрение самоуправляемых автомобилей остается далекой перспективой.
Все ближе тот день, когда мы не сможем отличить видео, изображающее реальную жизнь, от видео, которое просто симулирует реальность.
Ответственность технологических компаний в новую эру искусственного интеллекта
Не станет сюрпризом, если Google и Microsoft также создадут аналогичные модели преобразования текста в видео. Поскольку инструменты генеративного ИИ становятся все более изощренными, технологические компании анонсируют множество обновлений, когда дело доходит до маркировки контента, созданного ИИ. Исследователи технологических компаний также работают над инструментами обнаружения ИИ для правоохранителей.
Громкое объявление OpenAI может обернуться неприятностями для компаний, работающих в сфере создания видео с искусственным интеллектом. Конкуренты включают Runway, которая привлекла более 234 миллионов долларов от таких компаний, как Google и Nvidia. Другая компани — Irrevertant Labs — привлекла финансирование более чем на 80 миллионов долларов. Когда генерального директора Irrevertant Labs спросили о Sora, Рахул Суд ответил:
Sora выглядит великолепно, это первый реальный конкурент тому, что мы создаем. Здорово видеть, что то, над чем мы работаем, возможно.
Компания еще не представила свой инструмент широкой публике, но уже “близка к этому”.
Итак, что же делает фейковое видео Sora такими хорошими?
Генератор видео с искусственным интеллектом поддерживается многоязычными моделями OpenAI, которые представляют собой массивные модели, обученные на миллионах гигабайт данных из Интернета, для создания нового контента.
Сейчас в индустрии искусственного интеллекта идет большая дискуссия о том, должны ли компании, работающие с искусственным интеллектом, кредитовать и платить людям, которые создают фильмы, видео, фотографии и анимацию, которые используются для обучения моделей искусственного интеллекта.
Другая проблема заключается в том, что OpenAI и другие отказываются быть более прозрачными в отношении того, как работают эти модели, ссылаясь на “конкурентные причины”.
Ложка дегтя
Приведет ли это к появлению дипфейк видео?
Конечно. Существует реальная обеспокоенность по поводу того, что, когда любой сможет получить в свои руки новейший инструмент OpenAI, то будет легче создавать глубокие подделки или оскорбительный контент. Уже было несколько громких негативных deep фейков, которые попали в основные СМИ, включая откровенные фотографии Тейлор Свифт на X и фальшивого президента Джо Байдена, советующих избирателям на первичных выборах в Нью-Гэмпшире оставаться дома и “сохранить свой голос”, в прошлом месяце.
Помимо этого, ИИ может также изменить индустрию кино. Создатели фильмов “хотят более точного контроля над анимацией, эмоциями”. Появление модели искусственного интеллекта для преобразования текста в видео также помогает понять, почему голливудские сценаристы и актеры бастовали, требуя обеспечения их прав и дополнительной оплаты на фоне роста генеративного ИИ, пока не стало слишком поздно.
Больше хороших новостей по теме
В мире усиливается регулирование ИИ
Использованы материалы:
https://openai.com/sora
https://www.cbsnews.com/news/openai-sora-text-to-video-tool/
https://www.newscientist.com/article/2417639-realism-of-openais-sora-video-generator-raises-security-concerns/
https://retrofuturista.com/openai-sora/