Волшебство уже на пороге! Нейросеть Runway AI Gen-2 создает видео по текстовому описанию

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Нейросети сейчас самая модная тема. Они создают просто потрясающие изображения по текстовому описанию, они пишут музыку, тексты и код и обманывают людей. И вот сооснователи Stable Diffusion показали как второе поколение их нейросети Runway создаёт видео по текстовому описанию.


Видеоклипы, которые создаёт нейросеть Runway Gen-2 пока ограничены длительностью в три секунды. Но! Уже сейчас видна разница в качестве картинки и, если взять за основу прогресс, который прошёл генератор изображений Midjourney, то можно рассчитывать что итог Runway Gen-2 будет просто потрясающим. 

По соображениям безопасности и интересов бизнеса, новая нейросеть, в отличие от своего предшественника, Stable Diffusion, не будет изначально открытой для широкого доступа. Желающие первым прикоснуться к революционной технологии нужно будет через Discord присоединиться к списку ожидания на сайте Runway.

Runway AI Gen-2 не первые используют идею создавать видео по текстовому запросу, ранее этот вопрос исследовали Meta* и Google. Возможно, исследуют (и возможно что очень даже успешно) и сейчас.  Со слов исполнительного директора компании-разработчика Runway Gen-2 Кристобаля Валенсуэлы, отличие Runway в доступности для широких масс пользователей.

Способность ИИ создавать видеоматериалы по текстовому описанию может кардинально ускорить и облегчить создание видео. Такое снижение финансовых и трудовых затрат позволит множеству людей опробовать себя в качестве режиссёров или аниматоров.  Спецэффекты станут гораздо, гораздо более доступными, в итоге даже ребёнок может создавать свои собственные видео - будет повод подтянуть грамотность.

Впрочем, такая технологиче не может не вызывать опасений насчет возможности преступного использования и этических последствий искусственно созданного видео. Так что решение Runway ограничить первоначальный выпуск нейросети и не открывать ее исходный код подчеркивает важность упреждающего решения этих проблем.


Посмотрите на рекламный ролик нейросети, там виден весь прогресс. 

Что касается изображений, то вот как  нейросеть Midjorney создала дизайны фонариков в разных стилистиках, от каменного века, до Терминатора. Кстати, все картинки в этом тексте созданы именно в этой нейросети. 

  • * — Компания Meta (социальные сети Instagram и Facebook) - признана экстремистской организацией на территории Российской Федерации