Швейцарские учёные создали систему SVI для генерации длительных видео без потери качества

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи из лаборатории визуального интеллекта для транспорта (VITA) Федеральной политехнической школы Лозанны разработали систему Stable Video Infinity (SVI), способную генерировать связные видеоролики продолжительностью несколько минут.

Существующие модели генерации видео ограничены созданием коротких фрагментов длительностью от 5 до 20 секунд. Причина этого ограничения — эффект дрейфа, при котором сцены и персонажи постепенно теряют исходные характеристики, а видео утрачивает визуальную согласованность. Большинство современных моделей начинают давать сбои уже после 30 секунд генерации.

Для устранения этой проблемы команда VITA применила метод «переобучения с использованием повторяющихся ошибок». Принцип работы заключается в том, что возникающие в процессе генерации искажения и деформации намеренно возвращаются в модель для дополнительного обучения. Профессор Александр Алахи, руководитель лаборатории, описывает подход как тренировку пилота в условиях турбулентности вместо идеальной погоды. Модель учится распознавать собственные ошибки и корректировать их в реальном времени, что обеспечивает стабильность при длительной генерации.

Автор: VITA Источник: www.notebookcheck.net

Дополнительно команда представила инструмент LayerSync, предназначенный для синхронизации внутренней логики нейросети при создании видео, изображений и аудио. Метод позволяет модели согласовывать работу различных слоёв в процессе генерации мультимедийного контента.

Система SVI распространяется с открытым исходным кодом. Репозиторий проекта на GitHub получил более 2000 звёзд от разработчиков. Результаты исследования были представлены на Международной конференции по изучению представлений (ICLR) 2026 года.

Источник: Notebookcheck

нет
Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Обзор беспроводной механической клавиатуры YUNZII B75 PRO MAX с LCD дисплеем и энкодером

Очередная новинка от зарекомендовавшего себя производителя YUNZII на рынке механических клавиатур привлекает внимание своим качеством и продуманным дизайном. Корпус клавиатуры B75 PRO MAX выполнен...

Сбалансированные смартфоны с ценой меньше 10 тысяч рублей: подборка моделей из розницы и онлайн-магазинов

Наступила весна, а вместе с ней пришло время и для новых подборок смартфонов. Первая из них, как и всегда, затрагивает самый начальный ценовой сегмент «до 10 тысяч рублей», где, вопреки...

Обзор кофемашины Felfri FCM-007

В стремлении облегчить утренний ритуал моей жены, которая особенно ценит чашку ароматного кофе с нежной молочной пенкой, я принял решение преподнести ей в подарок кофемашину. Основными критериями...

Как платить в Китае? Как пополнить и пользоваться Алипей, Юнионпей и Вичат

В этом материале дам подробную инструкцию, как зарегистрировать и пополнить Алипей Alipay, Юнионпей Unionpay и Вичат Wechat, а также как и что с них оплачивать. Разумеется, вы можете привести с...

Инструкция по выживанию в XXI веке: 4 главных навыка, которые спасут вашу карьеру в мире будущего

Недавно я рассказывал о том, как будет выглядеть наш мир в обозримом будущем. Сегодня мы рассмотрим те качества, на которые стоит сделать акцент, чтобы не оказаться в числе "ненужных людей".