Sora: OpenAI представила инструмент, который мгновенно превращает текст в видео 🎬✨
OpenAI анонсировала новый инструмент, способный создавать видео на основе текстовых описаний. Модель получила имя Sora, что в японском означает «небо», и умеет генерировать реалистичные видеоролики длительностью до одной минуты, строго следуя инструкциям пользователя по содержанию и стилю.
По данным компании, Sora может не только создавать видео с нуля, но и генерировать ролики на основе статичного изображения или расширять существующую запись новыми кадрами. В блоге OpenAI отмечается:
«Мы учим ИИ понимать и моделировать физический мир в движении, чтобы создавать инструменты, которые помогают людям решать задачи, требующие взаимодействия с реальностью».
Примеры и возможности 🖼️🎥
Одним из первых примеров работы Sora стал ролик по запросу:
«Трейлер фильма о приключениях 30-летнего космонавта в красном вязаном мотоциклетном шлеме, синим небом на фоне, соляной пустыней, в кинематографическом стиле, снятый на 35-мм плёнку с яркими цветами.»
Компания открыла ограниченный доступ к Sora для исследователей и видеокреаторов. Их задача — протестировать модель и выявить возможные способы обхода правил использования, которые запрещают создание контента с насилием, сексуальными сценами, оскорбительными изображениями, использованием чужих лиц или объектов интеллектуальной собственности.
При этом доступ к инструменту пока имеют только визуальные художники, исследователи и киношники. Однако генеральный директор Сэм Альтман показал пользователям в Twitter короткие клипы, созданные Sora. Все видео имеют водяной знак, подтверждающий, что они сгенерированы ИИ.
Как это работает и конкуренты ⚙️🤖
Sora — не первый опыт OpenAI в генеративных технологиях. В 2021 году компания представила генератор изображений DALL-E, а в ноябре 2022-го — чат-бот ChatGPT, который быстро набрал 100 миллионов пользователей.
Другие компании также разрабатывают инструменты для генерации видео, однако существующие модели обычно способны создавать лишь несколько секунд ролика, который не всегда соответствует запросу. Google и Meta✱ тоже работают над такими технологиями, но пока не выпускают их в открытый доступ.
На прошлой неделе OpenAI также начала эксперименты по расширению памяти ChatGPT, чтобы он мог лучше «запоминать» переписки пользователей.
Тренировка и авторские права 📚⚖️
OpenAI не раскрыла точные данные о том, сколько видео использовалось для обучения Sora, но сообщила, что в тренировочном наборе были как публично доступные видео, так и лицензированные материалы.
Компания уже сталкивалась с судебными исками по поводу возможного нарушения авторских прав при создании своих генеративных ИИ-инструментов, которые анализируют огромные массивы информации из интернета и создают контент, имитируя исходные данные.
Итоговое впечатление ✨
Sora открывает новые возможности для видеоконтента: от создания роликов с нуля по текстовому описанию до расширения существующих записей. Инструмент особенно интересен для художников, исследователей и создателей видеоконтента, которые хотят экспериментировать с визуальными историями без сложной технической подготовки.
Появление таких моделей обещает ускорить творческий процесс и сделать генерацию видео доступной широкой аудитории, сохраняя при этом контроль над качеством и безопасностью создаваемого контента. 🎬🖌️
* Упомянутые организации запрещены на территории РФ