Tencent представила ИИ-модель для создания 3D-видео из статичных фотографий

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Tencent разработала новую технологию искусственного интеллекта под названием HunyuanWorld-Voyager (Voyager AI), которая позволяет преобразовывать статичные фотографии в короткие трехмерные видеоролики. Система анализирует одиночное изображение и создает на его основе двухсекундные клипы с эффектом перемещения в трехмерном пространстве.

Технология работает путем извлечения данных о глубине из фотографии и преобразования их в трехмерные облака точек, что позволяет реконструировать сцену с сохранением геометрической согласованности. Пользователи могут задавать различные движения виртуальной камеры, включая панорамирование, масштабирование и изменение направления обзора.

Автор: Tencent Источник: www.teknoburada.net

Для обучения модели Voyager AI использовалась база данных из более чем 100 тысяч видеозаписей различного происхождения — от реальных съемок до сцен из игровых движков. Это позволило системе освоить принципы управления виртуальной камерой и корректного отображения трехмерного пространства.

Несмотря на то, что отдельные клипы ограничены двумя секундами, их можно объединять в более продолжительные последовательности длительностью до нескольких минут. Однако при сложных и длительных движениях камеры могут накапливаться ошибки в отображении.

Основным техническим ограничением технологии являются высокие требования к аппаратному обеспечению. Для обработки изображений даже в разрешении 540p требуется видеокарта с памятью не менее 60 ГБ, что существенно ограничивает доступность технологии для массового пользователя.

Voyager AI представляет значительный прогресс в области создания видеоконтента с помощью искусственного интеллекта, хотя пока не обеспечивает полностью интерактивный трехмерный опыт.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор белоснежной клавиатуры A4Tech Fstyler FK20

Дорогие клавиатуры не всем по карману, но есть клавиатуры, которые стоят недорого и обладают хорошим качеством сборки, а также имеют стильный внешний вид. В данном обзоре мы рассмотрим бюджетную...

Независимые эксперименты окончательно опровергли утверждение об обнаружении тёмной материи на Земле

Около 27 процентов всей массы и энергии во Вселенной приходится на темную материю. Она не испускает света, не отражает его и не участвует в электромагнитном взаимодействии. Единственный способ,...

Закон Вурхиза: физики объяснили, почему обгонять медленные машины в городе абсолютно бессмысленно

Вы нажимаете на газ, резко перестраиваетесь и с чувством глубокого удовлетворения оставляете тихохода позади. Всего пара рискованных маневров — и вы выигрываете драгоценные секунды. Но...

Пещера Вайтомо: почему в ней запрещено использовать фонари и другие источники света

В изучении пещер фонарик: лучший друг, главный помощник и штатный спасатель от сотрясений мозга, вызванных падениями в темноте. Короче, без него в пещеру лучше не соваться, если вы не видите в...

Пять лет назад мы потеряли смартфоны LG: история падения главного конкурента Samsung

Когда-то давно эти смартфоны вовсю конкурировали с Samsung и занимали своё место в списке А-брендов. Именно они первыми предложили 2 ГБ оперативной памяти, вытянутый экран и ультраширик в качестве...