Tencent представила ИИ-модель для создания 3D-видео из статичных фотографий

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Tencent разработала новую технологию искусственного интеллекта под названием HunyuanWorld-Voyager (Voyager AI), которая позволяет преобразовывать статичные фотографии в короткие трехмерные видеоролики. Система анализирует одиночное изображение и создает на его основе двухсекундные клипы с эффектом перемещения в трехмерном пространстве.

Технология работает путем извлечения данных о глубине из фотографии и преобразования их в трехмерные облака точек, что позволяет реконструировать сцену с сохранением геометрической согласованности. Пользователи могут задавать различные движения виртуальной камеры, включая панорамирование, масштабирование и изменение направления обзора.

Автор: Tencent Источник: www.teknoburada.net

Для обучения модели Voyager AI использовалась база данных из более чем 100 тысяч видеозаписей различного происхождения — от реальных съемок до сцен из игровых движков. Это позволило системе освоить принципы управления виртуальной камерой и корректного отображения трехмерного пространства.

Несмотря на то, что отдельные клипы ограничены двумя секундами, их можно объединять в более продолжительные последовательности длительностью до нескольких минут. Однако при сложных и длительных движениях камеры могут накапливаться ошибки в отображении.

Основным техническим ограничением технологии являются высокие требования к аппаратному обеспечению. Для обработки изображений даже в разрешении 540p требуется видеокарта с памятью не менее 60 ГБ, что существенно ограничивает доступность технологии для массового пользователя.

Voyager AI представляет значительный прогресс в области создания видеоконтента с помощью искусственного интеллекта, хотя пока не обеспечивает полностью интерактивный трехмерный опыт.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Детальное изучение мозга чемпиона по памяти раскрыло нейробиологию его трюков

Рабочая память человека имеет свои физиологические ограничения. Исторически в когнитивной психологии этот предел описывался формулой «семь плюс-минус два элемента». Вы можете легко удержать в...

Эффект странника: как навыки ориентации в пространстве породили у человека геометрическое мышление

Со времен Платона геометрия считалась высшим проявлением абстрактного мышления. В диалоге «Менон» философ просит необразованного мальчика-раба удвоить площадь квадрата — и тот, опираясь...

Каньон Антилопы: почему он самый извилистый и фотогеничный в мире

В Аризоне, на землях индейцев навахо, находится место, любимое фотографами со всего мира. Каньон Антилопы вы наверняка хоть раз видели на заставке своего компьютера. Microsoft вносила его виды в...

Почему кофе и чай бодрят: взгляд с точки зрения науки

Вы когда-нибудь замечали, что после чашки кофе фокусировка внимания резко обостряется, но уже через полчаса ясность мысли начинает неумолимо угасать? Эти «американские горки» связаны с конкретными...

Как гора выше Эвереста остаётся невидимой: 75% высоты Мауна-Кеа скрыто океаном

Говоря о горных вершинах, достигающих наибольших высот, невозможно не вспомнить об Эвересте. Эта гора возносится в небо на 8848 метров над уровнем моря, и этот рекорд закреплён в школьных учебниках...