OpenAI представила новую нейросеть под названием Sora, которая умеет создавать целые видео по текстовому описанию. И это похоже на очередную революцию в развитии ИИ.
Sora — это диффузионная модель, которая способна «создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона». На сайте проекта сказано, что модель умеет понимать подсказки и знает, как ведут себя различные объекты в физическом мире.
Что важно, так это тот факт, что Sora генерирует целое видео сразу, а не покадрово. Это помогает избежать того, что было проблемой при использовании других подходов — изменения объекта при движении или перемещении камеры. https://www.youtube.com/watch?v=IW-NLYd8z80&t=13s
Sora пока ещё на стадии разработки, и OpenAI пока не планирует делать её широкодоступной. В частности, из-за опасения касательно безопасности. Сейчас компания, кроме прочего, работает над идеями по сокращению возможностей создания разжигающего ненависть контента, а также четкой маркировки видео, сгенерированного ИИ. https://www.youtube.com/watch?v=-eQzFLrIAxw&t=1s
Впрочем, уже сейчас OpenAI даёт доступ к Sora ряду художников, дизайнеров и режиссеров, чтобы получить отзывы о том, как продвигать модель, чтобы она была наиболее полезной для творчества.
Отдельно стоит сказать, что новость на сайте OpenAI появилась буквально полчаса назад, так что многих видео ещё нет на других платформах. Поэтому стоит зайти на сайт и посмотреть другие ролики, созданные Sora — их там весьма много.