Вступление
В опубликованном ранее материале о Leonardo.AI мы рассказали о возможностях этого сервиса (сервисов) в плане генерации изображений [см. наш обзор от 19 марта]. Теперь обратимся к теме создания видео с помощью набора инструментов, входящих в состав этого ИИ-помощника. Следует сказать, что среди них есть лишь одна оригинальная разработка команды Leonardo (Motion), но это не должно смущать пользователя, поскольку в отношении видео сервисы наследуют всё тот же принцип интеграции функциональности.
Доступ к соответствующим инструментам предоставлен сразу в главном вертикальном меню.
Мы решили не обжевывать специфику работы моделей, а заняться сугубо практическим делом — сравнением их возможностей.
Условия
После раздумий и нескольких раундов предварительного тестирования было решено остановиться на четырех испытательных сюжетах: диалог двух героев в кадре, макро, спорт (гонки) и генерация видео на основе предложенной фотографии. Поскольку все существующие модели лучше всего понимают английский язык, соответствующие задания (промпты) приводим в том виде, в котором они использовались, а ниже представляет перевод на русский язык.
Диалог (Платон и Сократ)
Plato and Socrates sit on the grass beneath olive trees in a peaceful ancient Greek grove, engaged in a calm philosophical conversation. Plato appears younger, composed, and contemplative; Socrates older, rugged, and expressive. Both wear simple ancient Greek robes in white and beige tones. Soft natural sunlight filters through the leaves, casting gentle moving shadows. A light breeze subtly moves the olive branches and fabric. Realistic human anatomy, detailed faces, natural lip movement, subtle hand gestures, coherent motion, stable composition, cinematic realism, historically inspired setting, no modern objects, no text, no subtitles, no watermark.
(Платон и Сократ сидят на траве под оливковыми деревьями в древнегреческой роще, ведя спокойную философскую беседу. Платон выглядит моложе, сдержаннее и задумчивее; Сократ старше, мужественнее и выразительнее. Оба одеты в простые древнегреческие одежды белых и бежевых тонов. Мягкий солнечный свет пробивается сквозь листья, отбрасывая нежные движущиеся тени. Легкий ветерок едва заметно колышет ветви олив и ткань одежды. Реалистичная человеческая анатомия, детализированные лица, естественное движение губ, тонкие жесты рук, плавное движение, стабильная композиция, кинематографический реализм, исторически вдохновленная обстановка, отсутствие современных предметов, текста, субтитров и водяных знаков).
Макро (колибри)
Extreme macro close-up shot of a hummingbird drinking nectar from a vibrant flower. The tiny bird hovers mid-air with wings beating rapidly, creating a soft motion blur. Its long slender beak is inserted deep into the blossom, tongue lapping nectar. Iridescent emerald-green and ruby-red feathers shimmer in the sunlight. Crystal-clear water droplets and pollen particles float in the air. Shallow depth of field, creamy bokeh background of blurred greenery. Natural daylight, cinematic quality, ultra-detailed, slow motion, shot on RED camera with 100mm macro lens, photorealistic, National Geographic style, no text, no subtitles, no watermark.
(Макроснимок колибри, пьющей нектар из яркого цветка. Маленькая птичка зависает в воздухе, быстро взмахивая крыльями, создавая мягкое размытие движения. Ее длинный тонкий клюв глубоко вонзен в цветок, язык слизывает нектар. Переливающиеся изумрудно-зеленые и рубиново-красные перья мерцают на солнце. Кристально чистые капли воды и частицы пыльцы парят в воздухе. Малая глубина резкости, эффект мягкого боке на фоне размытой зелени. Естественный дневной свет, кинематографическое качество, сверхдетализация, замедленная съемка, снято на камеру RED с макрообъективом 100 мм, фотореалистично, в стиле National Geographic, без текста, субтитров, водяных знаков).
Спорт (гонки «Формула-1»)
Formula 1 cars exiting a covered corner on a race track. Static camera placed at the outside of the corner exit. The cars drive toward the camera and then move left along the track. No camera movement. Realistic track environment, accurate car proportions, coherent motion, realistic tire grip, broadcast racing footage style, high detail.
(Автомобили «Формулы-1» выезжают из крытого поворота на гоночной трассе. Статичная камера расположена с внешней стороны выхода из поворота. Машины едут навстречу камере, а затем смещаются влево вдоль трассы. Движение камеры отсутствует. Реалистичная трасса, точные пропорции автомобилей, плавное движение, реалистичное сцепление шин, стиль гоночной съемки, высокая детализация).
Видео по фото (дети на подиуме)
Мы использовали нашу фотографию с демонстрации моделей детской одежды (камера Sony A7M4, объектив Sony 24-105 mm F4 G OSS, при 40 мм, F4, 1/250 c, ISO 640).
A group of eight children laughing and jumping in the air on podium against a white background. Children are dressed in playful, eclectic outfits with bold patterns and colors, such as neon green, black, and white. White balloons are scattered around them. The overall mood is joyful and energetic, capturing a sense of fun and celebration.
Группа из восьми детей смеется и прыгает в воздухе на подиуме на белом фоне. Дети одеты в игривые, эклектичные наряды с яркими узорами и цветами, такими как неоново-зеленый, черный и белый. Вокруг них разбросаны белые воздушные шары. Общее настроение радостное и энергичное, передающее ощущение веселья и праздника.
При последующей оценке полученных результатов (от одного балла до пяти) использовали следующие критерии:
- Сцена (режиссерское решение)
Построение кадра, композиция, действие, освещение. - Детали (прорисовка подробностей)
Воспроизведение мелких деталей изображения, текстур объектов, фактуры ткани. - Рисунок (цвета и полутона)
Цветовой баланс, адекватность цветового решения, спектральный состав, переходы полутонов, градации яркости. - Динамика (корректность движения объектов)
Движения героев и объектов в кадре, перемещения камеры, зумирование, панорамирование.
Во всех случаях использовали стандартное соотношение сторон видео 16:9.
Приводим результаты моделей в алфавитном порядке по группам, но в составе каждой из групп самые современные версии будут первыми (сначала Seedance 2.0, затем Seedance 1.0). Начинаем.
Hailuo 2.3
Официальный сайт: https://hailuoai.video/
Модель создана китайским стартапом MiniMax, зарегистрированным в 2022 г.
MiniMax предлагает AI-сервисы для генерации не только видео, но еще и изображений, речи, музыки. В 2025 г. онлайн-службы стартапа обработали 236 млн пользовательских запросов. Совокупный доход компании составил 79 млн. долларов США (см. финансовые результаты здесь).
В Leonardo.AI у модели Hailuo 2.3 есть три блока дополнительных настроек:
Vibe (стиль): Clay (керамика), Color Sketch (цветная зарисовка), Logo (логотип), Papercraft (бумажная модель), Pro Photo (профессиональное фото), Sci-Fi (фантастика), Sketch (набросок), Stock Footahe (стоковое фото).
Lighting (освещение): Backlight (контровое), Candle Lit (свеча), Chairoscuro (цветовой контраст), Film Haze (дымка), Foggy (туман), Golden Hour (на восходе или на закате), Hardlight (жесткий свет), Lens Flare (рефлексы линз), Light Art (светопись), Low Key (низкий ключ, недодержка), Luminous (свечение), Mystical (таинственный свет), Rainy (дождь), Soft Light (мягкий свет), Volumetric (объемное освещение).
Color (цветовое решение): Autumn (осень), Complementary (усиление цветов), Cool (холодные тона), Dark (темные тона), Earthy (желтоватые тона), Electric (сине-фиолетовые тона), Iridiscent (радужные), Pastel (пастельные), Split (разделение изображения пополам), Terracotta Teal (терракотовые тона), Ultraviolet (лиловые), Vibrant (живые цвета), Warm (теплые тона).
В рамках нашего обзора мы не станем рассматривать эти возможности, потому что материал и без того сильно загроможден примерами и оценками. К тому же аналогичные опции помимо Hailuo доступны лишь еще одной модели (об этом ниже), и для сравнения всех остальных неприменимы.
Опции генерации
Длительность: 6 или 10 с
Качество: 768p или 1080p
Соотношение сторон: 1:1, 16:9, 9:16
Наши установки: 768p, длительность 10 c, стоимость — 224 токена
Результаты — время, затраченное на создание видео (в секундах)
Диалог (Платон и Сократ) — 102 с
Горизонт завален вправо. Детализация подчеркнуто низкая. Цветовое решения сомнительное. Динамика представлена лишь мановениями правой руки Сократа.
- Сцена — 3
- Детали — 3
- Рисунок — 4
- Динамика — 3
Макро (колибри) — 91 с
Нежное размыте фона. Хорошая резкость. Удачные цвета. Много претензий к птице. Что у нее с лапами? Что за жидкость выделяется (и откуда?), а потом капает с обрезанных лап? Почему хвост втрое короче, чем нужно? Раскраска оперения, кстати, тоже неподобающая.
- Сцена — 3
- Детали — 4
- Рисунок — 4
- Динамика — 3
Спорт («Формула-1») — 136 с
Сильно заметно влияние сглаживания, из-за него страдает не только детализация, но и резкость. Картинка производит впечатления явно искусственной.
- Сцена — 2
- Детали — 1
- Рисунок — 3
- Динамика — 2
Видео по фото (дети на подиуме) — 92 с
Лица исковерканы. Насыщенность и контраст умеренные. Движения схематичные. Поведение воздушных шаров сомнительное: они появляются и исчезают, иногда «приклеены» к рукам.
- Сцена — 2
- Детали — 1
- Рисунок — 2
- Динамика — 2
Kling Video 3
Kling — детище китайской компании Kuaishou, расположенной в Пекине. С начала своего основания в 2011 г. компания занималась национальным сервисом видео наподобие YouTube.
Совокупный доход в 2024 г. составил 17 млрд долл. США.
У семейства моделей Kling есть официальный сайт (https://kling.ai/)
Модель Kling Video 3 позволяет создавать ролики длительностью от 3 до 15 с со звуком.
Качество: 720p, 1080p
Соотношение сторон: 1:1, 16:9, 9:16
Наши установки: 720p, 8 c; стоимость — 1008 токенов
Диалог (Платон и Сократ) — 56 с
ИИ по своему разумению создал диалог философов. Socrates: «The unexamined life is not worth living.» Plato: «We must always seek the truth.» Первая фраза действительно приписывается Сократу и в понятном переложении выглядит так: «Если не исследовать жизнь, то незачем и жить». Платон отвечает совершенно формально, и это выглядит как пустая «затычка» диалога, вставленная ни к селу, ни к городу: «Мы всегда должны искать истину». Впрочем, в восемь секунд трудно поместить что-то действительно ценное. К тому же в промпте мы вообще не упомянули о теме их разговора, так как могли рассчитывать на звуковое сопровождение лишь в единичных случаях. Детализация картинки богатая, фактура ткани легко определяется. Поэтому, кстати, у нас возникает протест против одежд Платона — это какое-то современное облачение вовсе не из древнегреческого обихода. Цвета естественные, светотональные переходы мягкие. Динамика в кадре уместная, движение камеры плавное, добавляющее осмысленности в переходе диалога от Сократа к Платону.
- Сцена — 4
- Детали — 5
- Рисунок — 5
- Динамика — 4
Макро (колибри) — 72 с
Условие «супермакро» несколько подпортило композицию (птица обрезана). Однако динамика естественная. Размытие фона отличное. Детализация превосходная (перья, волоски на чашелистике цветка). Цветопередача хорошая, насыщенность деликатно подчеркнута лишь на лепестках, и колибри не выглядит попугаем.
- Сцена — 4
- Детали — 5
- Рисунок — 5
- Динамика — 5
Спорт («Формула-1») — 72 с
Композиционно кадр построен удачно. Хорошо отработан S-образный маневр болидов при прохождении двух противоположно ориентированных последовательных виражей. Скорости маловаты: такие маневры совершаются на 70—85 км/ч, а опыт подсказывает, что глаз видит лишь что-то около 40—50 км/ч. Цветовое решение неплохое, но на отбойнике слева белые полосы осещены «медным» вечерним светом, а аналогичная белизна полос на переднем плане справа несколько «подсинена» — так не бывает. Детализация отличная (за исключением графической бессмыслицы с рекламными надписями на болидах), размытие фона при движении камеры реалистичное.
- Сцена — 5
- Детали — 5
- Рисунок — 4
- Динамика — 4
Видео по фото (дети на подиуме) — 96 с
Заметен эффект «slo-mo» (замедленной съемки). Детализация отличная. Насыщенность и контраст несколько избыточные, но это не вызывает отвращения. Движения естественные. Поведение воздушных шаров сомнительное: они должны либо подниматься вверх, либо падать на подиум, но некоторые почему-то висят в воздухе.
- Сцена — 4
- Детали — 5
- Рисунок — 4
- Динамика — 4
Kling Video o3 Omni
Длительность: от 3 до 15 с
Качество: 720p, 1080p
Соотношение сторон: 1:1, 16:9, 9:16
Наши установки: 720p, 8 c; стоимость — 1792 токена
Диалог (Платон и Сократ) — 45 с
Аудиосопровождение более удачное, чем в предыдущем случае. Socrates: «What is the nature of virtue?» Plato: «It is the harmony of the soul.» Сократ: «Что есть добродетель?» Платон: «Это гармония души».
Цветовое решение удачное, но загар у Сократа, как и блик на его лысине, несколько назойливы. Одеяния философов не древнегреческие, в современные. Детализация картинки хорошая, фактура ткани в Платона определяется, а у Сократа ткань на переднем плане выпадает из зоны резкости. Цвета удачные, хотя — повторимся — для одежд они нетипичные. Светотональные переходы мягкие, естественные для рассеянного дневного освещения в тени. Динамика в кадре плавная, гармоничная, движение камеры, веток и листьев оливы обогащают кадр.
- Сцена — 5
- Детали — 4
- Рисунок — 5
- Динамика — 4
Макро (колибри) — 78 с
Отличное, плавное размытие фона, приятное глазу колористическое решение, великолепная детализация. Композиционно решено неплохо, но птица (как и ранее) не поместилась в кадр из-за более высокого приоритета супермакро. Язык у колибри должен выглядывать лишь из самого кончика клюва (который нам не виден), а не сбоку. Это промах.
- Сцена — 4
- Детали — 5
- Рисунок — 5
- Динамика — 4
Спорт («Формула-1») — 61 с
Такое же, как и ранее, удачное решения в виде S-образного маневра. Те же недостатки динамики (скорости маловаты). Цветопередача точная, детализация отличная (кроме все тех же рекламных надписей на корпусах). Особенно радует прорисованное марево горячего воздуха над болидами.
- Сцена — 5
- Детали — 5
- Рисунок — 5
- Динамика — 4
Видео по фото (дети на подиуме) — 87 с
Лица «пластиковые», детализация понижена. Движения приемлемы, но недостаточно естественные. Воздушные шары не подвержены действию гравитации.
- Сцена — 4
- Детали — 3
- Рисунок — 4
- Динамика — 3
Kling 2.6
Длительность: 5 или 10 с
Качество: 1080p
Соотношение сторон: 1:1, 16:9, 9:16
Наши установки: 1080p, 10 c; стоимость — 700 токенов
Диалог (Платон и Сократ) — 198 с
Отвратительная театральность: волосы у обоих, борода у Сократа. Прямо-таки сценический гротеск! Цветовое решение неудачное: загар у Сократа с зеленоватый отливом. Одеяния вызывают неприятные ассоциации. Светотональные переходы мягкие. Динамика в кадре непонятная.
- Сцена — 1
- Детали — 3
- Рисунок — 3
- Динамика — 3
Макро (колибри) — 134 с
Сюжетно сцена построена скучно. Движения крыльев слишком медленные, чтобы удержать птицу напротив цветка. Резкими выглядят только капли воды, слишком крупные, чтобы образовать взвесь в воздухе, и потому нереалистичные. В целом генерация неудачная.
- Сцена — 3
- Детали — 1
- Рисунок — 3
- Динамика — 2
Спорт («Формула-1») — 148 с
Решение композиционно скучное. Трибуны пусты — ни одного зрителя. Детализация низкая. Цвета синят и даже, кажется, тяготеют к лиловым тонам.
- Сцена — 3
- Детали — 3
- Рисунок — 3
- Динамика — 3
Видео по фото (дети на подиуме) — 67 с
Лица проработаны плохо, детализация низкая. Движения приемлемые, но недостаточно естественные. Воздушные шары ведут себя, в целом, адекватно, но не могут избавить от ощущения, что видео искусственное.
- Сцена — 3
- Детали — 2
- Рисунок — 4
- Динамика — 3
LTX-2.3 Pro
Модели LTX video созданы компанией Lightricks, которая была создана в 2013 г., базируется в Израиле (Иерусалим и Хайфа) и имеет представительства в Лондоне, Нью-Йорке и Чикаго.
По состоянию на 2021 г. активы компании оценивались в 1,8 млрд долл. США. В 2025 г. Lightricks посещало 50 млн. пользователей ежемесячно.
Длительность: 6, 8 или 10 с
Качество: 1080p, 1440p, 2160p
Соотношение сторон: 16:9, 9:16
Наши установки: 720p, 8 c; стоимость — 480 токенов
Диалог (Платон и Сократ) — 114 с
Герои не соответствуют исторической эпохе. Платон выглядит как персонаж современной «мыльной оперы». Полуулыбки обоих подходят великосветскому smalltalk, но никак не философской беседе. Детализация приемлемая. Светотональное решение неплохое.
- Сцена — 3
- Детали — 4
- Рисунок — 4
- Динамика — 4
Макро (колибри) — 99 с.
Фон размыт недостаточно сильно, его структура мешает сосредоточению на главном объекте. Единственная лапа у птицы то ли надломлена, то ли зацепила что-то по пути. Капель воды слишком много, и их неправильная форма и мутное содержимое превращают воду в пластик. Цвета недостаточно активные. Тональные переходы примитивные. Детализация невысокая.
- Сцена — 3
- Детали — 3
- Рисунок — 3
- Динамика — 3
Спорт («Формула-1») — 144 с
Полоса движения, маркировка ее краев, ширина полосы, отбойники не соответствуют нормам. Композиция формальная, динамика вялая. Детализация удовлетворительная, но логотипы на обвесах болидов изуродованы. Светотональное решение не слишком удачное.
- Сцена — 3
- Детали — 4
- Рисунок — 3
- Динамика — 2
Видео по фото (дети на подиуме) — 84 с
Лица проработаны хорошо. Шары ведут себя соответственно гравитации. Использован прием замедленной съемки, и это сделано удачно. Контраст и насыщенность цветов хорошие.
- Сцена — 4
- Детали — 4
- Рисунок — 5
- Динамика — 5
LTX-2.3 Fast
Длительность: от 6 до 20 с (шаг 2 с)
Качество: 1080p (от 6 до 20 с), 1440p (от 6 до 10 с), 2160p (от 6 до 10 с)
Соотношение сторон: 16:9, 9:16
Наши установки: 1080p, 8 c; стоимость — 320 токенов
Диалог (Платон и Сократ) — 73 с
Вместо олив в кадре видны то ли осины, то ли березы. Облик персонажей не соответствует эпохе. Одежда напоминает скорее японские кимоно, чем древнегреческие туники. Сюжетное решение слабое. Платон задает вопрос: «Что есть истина?», который накладывается поверх неразборчивых слов героя как реплика переводчика. Сократ отвечает на это довольно глупо: «Это поиск», затем встает, что можно трактовать как выражение неприязни. Поиск безусловно предшествует нахождению истины, но не может быть ее характеристикой.
- Сцена — 2
- Детали — 4
- Рисунок — 4
- Динамика — 4
Макро (колибри) — 96 с
Фон плохо размыт, его структура не дает сосредоточиться на логическом центре кадра. У птицы не две лапы, а одна. Ее клюв оказывается то позади цветка, то перед ним, но никак не там, где можно пить нектар. Крылья стрекозы не имеют ничего общего с крыльями колибри, равно как и раскраска птицы. Цветовая гамма упрошена. Контрастность высокая, полутоновые переходя определить трудно. Детализация не слишком впечатляющая.
- Сцена — 2
- Детали — 3
- Рисунок — 3
- Динамика — 2
Спорт («Формула-1») — 233 с
Камешки на покрытии трека на переднем плане означают немедленную остановку гонок. Детализация посредственная, тональные переходы и цветность приемлемы.
- Сцена — 2
- Детали — 3
- Рисунок — 3
- Динамика — 4
Видео по фото (дети на подиуме) — 37 с
Динамика удовлетворительная, хотя воздушные шары ведут себя странно. Проработка лица приемлемая. Цвета хорошие, тональные переходы несколько стерты из-за высокой контрастности картинки.
- Сцена — 4
- Детали — 3
- Рисунок — 4
- Динамика — 4
Motion 2
Модели Motion — оригинальная разработка специалистов из Leonardo.AI.
Поэтому у модели очень много разнообразных опций настроек.
Длительность: не указана (в тестовых генерациях — 5 с)
Качество: 480p, 720p
Соотношение сторон: 2:3, 4:5, 16:9, 9:16
Есть стилевые блоки (те же, что и в модели Hailuo 2.3):
Vibe (стиль): Clay (керамика), Color Sketch (цветная зарисовка), Logo (логотип), Papercraft (бумажная модель), Pro Photo (профессиональное фото), Sci-Fi (фантастика), Sketch (набросок), Stock Footahe (стоковое фото).
Lighting (освещение): Backlight (контровое), Candle Lit (свеча), Chairoscuro (цветовой контраст), Film Haze (дымка), Foggy (туман), Golden Hour (на восходе или на закате), Hardlight (жесткий свет), Lens Flare (рефлексы линз), Light Art (светопись), Low Key (низкий ключ, недодержка), Luminous (свечение), Mystical (таинственный свет), Rainy (дождь), Soft Light (мягкий свет), Volumetric (объемное освещение).
Color (цветовое решение): Autumn (осень), Complementary (усиление цветов), Cool (холодные тона), Dark (темные тона), Earthy (желтоватые тона), Electric (сине-фиолетовые тона), Iridiscent (радужные), Pastel (пастельные), Split (разделение изображения пополам), Terracotta Teal (терракотовые тона), Ultraviolet (лиловые), Vibrant (живые цвета), Warm (теплые тона).
Включены так же модули управления движением:
Motion Control
Motion Elements
Наши установки: 720p, длительность 8 c; стоимость — 300 токенов
Диалог (Платон и Сократ) — 68 с
Облик героев не соответствует эпохе. Цветность несостоятельна. Детализация неплохая, но фактура ткани несколько стерта. Платон молчит, и это исключает диалог.
- Сцена — 2
- Детали — 4
- Рисунок — 4
- Динамика — 2
Макро (колибри) — 65 с
Драматургически сцена курьезна. Голова и шея птицы остаются совершенно неподвижными, в то время как тело изгибается. Не птица, а змея! Цветок имеет парадоксальное строение: вместо пыльников на тычинках бутоны. Цвет очень назойлив. Композиция формальная.
- Сцена — 2
- Детали — 3
- Рисунок — 3
- Динамика — 2
Спорт («Формула-1») — 68 с
Выезд на трек с прилегающей полосы в такой ситуации чреват катастрофой с фатальным исходом. Это сразу ставит крест на генерации. О динамике говорить не приходится (болиды — не самокаты, хотя и те перемещаются быстрее). Детализация низкая.
- Сцена — 1
- Детали — 2
- Рисунок — 2
- Динамика — 1
Видео по фото (дети на подиуме) — 66 с
Лица изуродованы компрессией. Детализация низкая. Тональные решения исковерканы компрессией. Притяжение Земли не действует на воздушные шары, хотя те несомненно наполнены отнюдь не гелием.
- Сцена — 2
- Детали — 1
- Рисунок — 2
- Динамика — 2
Seedance 2.0
Модели Seedance созданы китайским ИТ-гигантом Bytedance — тем самым, кому принадлежат популярные TikTok, CapCat и другие сервисы, популярные в КНР.
В 2024 г. прибыль компании составила 155 млрд долл. США. В «первой серии» наших рассказов о Leonardo.AI мы поведали о модели генерации изображений Seedream, которые также созданы Bytedance.
Длительность: от 4 до 15 с (шаг 1 с)
Качество: 480p, 720p, 1080p
Соотношение сторон: 21:9, 16:9, 4:3, 1:1, 3:4, 9:16
Наши установки: 720p, длительность 8 c
Стоимость — 2419 токенов
Диалог (Платон и Сократ) — 150 с
Провокационное решение, наводящее на мысли о евангельском сюжете. Облик героев не соответствует географии и эпохе. Артикуляция опережает произносимые слова. Суть диалога более-менее состоятельна. Платон: «Разве знание не есть воспоминание о формах?» Сократ: «Формы — это суть всего сущего» («формы» следует понимать как «представления»).
- Сцена — 2
- Детали — 5
- Рисунок — 5
- Динамика — 3
Макро (колибри) — 131 с
Главная логическая ошибка: колибри не движет челюстями, когда пьет нектар из цветка, и клюв у нее при этом не раскрывается. Капли влаги слишком крупные, чтобы образовать устойчивую взвесь и не только не падать на землю, но подниматься вверх. Однако детализация отличная, размытие фона мягкое, нежное, цвета переданы очень хорошо.
- Сцена — 2
- Детали — 5
- Рисунок — 5
- Динамика — 2
Спорт («Формула-1») — 129 с
Композиция и сценическое решение удачны, но просчет кадров неудовлетворителен: заметны дерганья болидов, как если бы видео было менее 15 кадров в секунду (в параметрах файла указано 24 кадра/с). Светотональные переходы и колористика неплохие.
- Сцена — 5
- Детали — 4
- Рисунок — 4
- Динамика — 2
Видео по фото (дети на подиуме) — в генерации отказано (не должно быть живых людей на фото).
Использован результат нейрогенерации.
Для него создан промпт следующего содержания:
Aliens from outer space, in the form of giant jellyfish with clusters of thin tentacles, invade the Earth. They hurl fireballs downwards, causing fires.
Пришельцы из космоса в виде гигантских медуз с пучками тонких щупалец вторгаются на Землю. Они бросают вниз огненные шары, вызывая пожары.
Длительность генерации — 136 с
Огненные шары летят как угодно, даже изменяя траекторию у поверхности земли. Герой стоит совершенно неподвижно, как памятник, и даже пальто на нем не колышется. Детализация «на троечку». Картинка в кадре не может подняться над искусственным происхождением оригинала.
- Сцена — 2
- Детали — 3
- Рисунок — 3
- Динамика — 3
Seedance 2.0 Fast
Длительность: от 1 до 15 с (шаг 1 с)
Качество: 480p, 720p
Соотношение сторон: 21:9, 16:9, 4:3, 1:1, 3:4, 9:16
Наши установки: 720p, 8 c; стоимость — 1935 токенов
Диалог (Платон и Сократ) — 112 c
Режиссура едва ли не самая интересная среди других генераций. Диалог вполне состоятелен. Сократ: «Скажи, Платон, в чем суть добродетельного человека?» Платон: «В том, что он познал себя». Единственная сюжетная «плюха» — современная кожаная сумка с латунными кольцами для плечевого ремня под рукой у Сократа. Динамика удачная: движутся руки и головы, работает мимика персонажей, колышутся ветви, камера производит наезд на беседующих.
- Сцена — 5
- Детали — 5
- Рисунок — 5
- Динамика — 4
Макро (колибри) — 102 c
Модель не знает, что у колибри не традиционный раскрывающийся клюв, а хоботок. В остальном очень хорошая работа. Детализация превосходная, цвета и полутона удачные, размытие фона нежное.
- Сцена — 4
- Детали — 5
- Рисунок — 5
- Динамика — 5
Спорт («Формула-1») — 112 c
Болид выезжает из ангара (вряд ли имеется в виду пит-стоп). Детализация хороша, работа с полутонами на высоте. Цвета активные, но не назойливые. Движения болида естественные (даже невозможность вписаться в правый изгиб трека при повороте).
- Сцена — 4
- Детали — 5
- Рисунок — 5
- Динамика — 5
Видео по фото (дети на подиуме) — в генерации отказано (не должно быть живых людей на фото).
Использован результат нейрогенерации.
Для него использован промпт следующего содержания:
Aliens from outer space, in the form of giant jellyfish with clusters of thin tentacles, invade the Earth. They hurl fireballs downwards, causing fires.
Пришельцы из космоса в виде гигантских медуз с пучками тонких щупалец вторгаются на Землю. Они бросают вниз огненные шары, вызывая пожары.
Длительность генерации — 167 с
Фигура, стоящая спинок к зрителю на переднем плане, снова неподвижна. Правда, полы пальто чуть колышутся. Рисунок без особенностей. Детализация удовлетворительная. Однако бомбит только «медуза» в центре, от остальных вниз тянется пламя, но земли не достигает.
- Сцена — 3
- Детали — 3
- Рисунок — 3
- Динамика — 4
Seedance 1.0 Pro
Длительность: 4, 6, 8 или 10 с
Качество: 480p, 720p, 1080p
Соотношение сторон: 16:9, 4:3, 1:1, 9:16
Наши установки: 720p, 8 c; стоимость — 410 токенов
Диалог (Платон и Сократ) — 63 с.
Люди примерно одного возраста, хотя Сократ был на 40-45 лет старше Платона. Платон не произнес ни слова. Сократ говорит с такой горячностью, которая вряд ли может быть оправдана темой философской беседы. Изображение очень контрастное, детали в тенях не определяются. Впрочем, и в других местах их явно недостаточно. Из-за высокого контраста насыщенность цветов чрезмерная.
- Сцена — 3
- Детали — 3
- Рисунок — 3
- Динамика — 3
Макро (колибри) — 60 с.
Слишком высокий контраст. Недостаточно размытие фона пестротой рисунка не позволяет сосредоточится на основном сюжете. Птица машет крыльями, как бабочка, и по временам делает короткие паузы, во время которых ее тело должно было бы смещаться вниз, но этого не происходит. Из такого цветка колибри ничего пить не может. Видео выглядит утрированным и назойливым.
- Сцена — 3
- Детали — 3
- Рисунок — 2
- Динамика — 2
Спорт («Формула-1») — 93 с
Очередной сюжетный казус: первый болид выезжает на трек прямо сквозь боковой отбойник, второй болид появляется из ничего за первым и далее едет прямо, вылетая с трека. Детализация и цветовое решение неплохи, но контраст, как и ранее, чрезмерный.
- Сцена — 1
- Детали — 3
- Рисунок — 3
- Динамика — 2
Видео по фото (дети на подиуме) — 98
Лица уродливо размазаны, воздушные шары растворились в воздухе. Движения однообразные.
- Сцена — 3
- Детали — 1
- Рисунок — 2
- Динамика — 2
Seedance 1.0 Lite
Длительность: 4, 6, 8 или 10 с
Качество: 480p, 720p, 1080p
Соотношение сторон: 16:9, 4:3, 1:1, 9:16
Наши установки: 720p, 8 c; стоимость — 300 токенов
Диалог (Платон и Сократ) — 55 с
Вновь персонажи не соответствуют ожидаемым: примерно равны по возрасту, лица европейцев. Платон (если слева Платон) цедит несколько слогов сквозь зубы, Сократ (если справа Сократ) что-то вяло отвечает. О детализации говорить не приходится. Тональные решения заурядные.
- Сцена — 3
- Детали — 1
- Рисунок — 2
- Динамика — 2
Макро (колибри) — 124 с
Фон размыт недостаточно и несколько мешает. Птица сделана приемлемо, но крылья у нее странные. Цвета хорошие, активные. Детализация посредственная.
- Сцена — 4
- Детали — 3
- Рисунок — 4
- Динамика — 3
Спорт («Формула-1») — 58 с
Болиды, выезжающие с обочины на трек — это обыкновенная глупость ИИ. Детализация посредственная. Тональный рисунок слабоват. Цвета блеклые.
- Сцена — 1
- Детали — 3
- Рисунок — 2
- Динамика — 2
Видео по фото (дети на подиуме) — 61 с
Как и в предыдущем случае, лица уродливы (хотя в меньшей степени), прыжки детей выглядят уныло. Детализация хромает. Единственный «полу-успех» — воздушные шары, которые ведут себя более натурально, чем раньше.
- Сцена — 3
- Детали — 2
- Рисунок — 3
- Динамика — 2
Sora 2 Pro
Модели Sora — разработки OpenAI. Первое поколение было выпущено для пользователей ChatGPT Plus и ChatGPT Pro в США и Канаде в декабре 2024 г., а второе — в конце сентября 2025 года. Но уже 24 марта 2026 г. OpenAI объявила об окончании работы приложения 26 апреля 2026 г., а API — 24 сентября 2026 г. В составе Leonardo.AI пока доступны обе модели.
Длительность: 4, 8 или 12 с
Качество: 720p, 1080p
Соотношение сторон: 16:9, :16
Наши установки: 720p, 8 c; стоимость — 2400 токенов
Диалог (Платон и Сократ) — 279 с
Облик Сократа вызывает смех. Его лицо — маска древнегреческой комедии с неестественной мимикой. Но лицо хотя бы отражает возраст, а тело философа запросто позаимствовано у другого человека, вероятно, тридцатилетнего. Картинка, как говорят фотографы, «мыльная»: нет ни одной резкой детали. Именно поэтому тональные переходы выглядят неплохо.
- Сцена — 3
- Детали — 1
- Рисунок — 2
- Динамика — 3
Макро (колибри) — 281 с
Оказывается, колибри может зависать в воздухе, не работая крыльями. Впрочем, даже когда она ими работает, это как-то неубедительно. Лапы представляют собой нечто странное. Цветовое решение и размытие заднего плана хороши, но резкости нет нигде.
- Сцена — 2
- Детали — 1
- Рисунок — 2
- Динамика — 1
Спорт («Формула-1») — 257 с
Болиды не могут ездить по дерну — их тут же развернет. Резкость отсутствует, детализация неудовлетворительная.
- Сцена — 1
- Детали — 1
- Рисунок — 2
- Динамика — 2
Видео по фото (дети на подиуме) — 326
Лица обезображены. Движения скучные. Резкости нет. Цвета приемлемые. Плюс один балл за смену кадра, но это единственный позитивный момент.
- Сцена — 3
- Детали — 1
- Рисунок — 1
- Динамика — 2
Sora 2
Длительность: 4, 8 или 12 с
Качество: 720p, 1080p
Соотношение сторон: 16:9, :16
Наши установки: 720p, 8 c; стоимость — 2400 токенов
Диалог (Платон и Сократ) — 112 с
Помимо отсутствия нативной резкости картинка отличается еще и непомерными артефактами сжатия. Ни детализацию, ни резкость оценить нельзя. Цвета скучные.
- Сцена — 2
- Детали — 1
- Рисунок — 1
- Динамика — 2
Макро (колибри) — 115 с
Бедная, бедная физика! Птица перестает взмахивать крыльями, но не падает. Изобразительно решение можно было бы назвать удачным, если бы не традиционное для модели Sora «мыло».
- Сцена — 2
- Детали — 2
- Рисунок — 2
- Динамика — 1
Спорт («Формула-1») — 119 с
Модель решила удовлетворить сенсорное голодание зрителя и направила болиды прямо в камеру. На практике выезд уже первого болида на дерн привел бы к столкновению с теми, кто идет за ним. Детализация неудовлетворительное. Контраст слишком высок. Динамика хорошая, но кинематическое неправдоподобие портит впечатление от генерации.
- Сцена — 2
- Детали — 2
- Рисунок — 2
- Динамика — 4
Видео по фото (дети на подиуме) — 197 с
Как и у прежней модели, лица уродливые, видна «пластмассовость» поверхности из-за артефактов сжатия. Даже смена кадра, за которую модель стоило бы похвалить, не делает генерацию пригодной.
- Сцена — 3
- Детали — 1
- Рисунок — 2
- Динамика — 4
Veo 3.1 Fast
Модели Veo созданы Google DeepMind. В мае 2024 г. была анонсирована мультимодальная модель Veo. В декабре 2024 г. вышла Veo 2, поддерживающая генерацию в 4K и обладающая «более адекватной физикой». В мае 2025 г. Google выпустила Veo 3, которая генерирует аудиодорожки (диалоги, звуковые эффекты и окружающий шум) в соответствии с визуальным рядом. Генеральный директор Google DeepMind Демис Хассабис описал это как момент, когда генерация видео с помощью ИИ вышла за рамки эпохи немого кино.
Длительность: от 6 до 20 с шагом в две секунды
Качество: 720p, 1080p, 2160p
Соотношение сторон: 16:9, 9:16
Наши установки: 720p, 8 c; стоимость — 1200 токенов
Диалог (Платон и Сократ) — 87 с
Socrates: “How can we know the good if we only study it’s shadows, Plato?” Plato: “We must ascend to the higher forms beyond the shadows of the cave.” Сократ: «Как познать благо, если мы видем лишь его тени, Платон?» Платон: «Мы должны подняться на высший уровень над тенями пещер». Диалог поначалу осмыслен, но последние слова («над тенями пещер») должен произносить Платон в одиночку, а артикуляция работает на обоих лицах. Это крайне неприятно.
Детализация превосходная. Цветовое решение неудачное: солнце, судя по всему, еще довольно высоко в небе, а спектр света сильно отдает «закатной медью». Яркая поляна позади философов явно привлекает больше внимания, чем их лица в тени. По возрасту Платон староват (он был моложе Сократа лет на сорок).
- Сцена — 4
- Детали — 5
- Рисунок — 5
- Динамика — 4
Макро (колибри) — 70 с
Похоже, колибри не пьет нектар, а «постригает» цветок изнутри: видно, как оттуда летят какие-то клочки. Это сопровождается звуком, похожим на стрекотание ножниц. Размытие фона недостаточное для супермакро, особенно при учете значительного удаления стеблей и листьев на заднем плане. Детализация высокая, но на перьях выглядит нарочито. Освещение неестественное. Если ИИ имел в виду свет сзади справа (см. контуры птицы и листьев), то либо передний план должен быть темнее, либо фон — светлее.
- Сцена — 1
- Детали — 4
- Рисунок — 3
- Динамика — 3
Спорт («Формула-1») — 68 с
Результат неудачный. Решение — совершенная небывальщина: одна группа болидов движется навстречу другой. Это ЧП. Детализация неплохая, но лого везде бессмысленные. Такое видео ни на что не годится, даже для видеожаб.
- Сцена — 1
- Детали — 4
- Рисунок — 4
- Динамика — 2
Видео по картинке
три попытки с фотографией плюс две с картинкой, созданной ИИ. Все закончились неудачей — «Failed to Generate». Ставим нули.
- Драматургия — 0
- Детализация — 0
- Цвета и полутона — 0
- Динамика — 0
Veo 3.1 Lite
Длительность 4, 6 или 8 с
Качество: 720p, 1080p, 2160p
Соотношение сторон: 16:9, 9:16
Наши установки: 720p, 8 c; стоимость — 400 токенов
Диалог (Платон и Сократ) — 96 с
Socrates: «But what is truth, Plato, if not the shadow of the forms we perceive?» Plato: «Yet Socrates, the shadow holds it own truth in this world.» Сократ: «Но что есть истина, Платон, если не тень ее форм?» Платон: «И всё же, Сократ, у теней есть своя истина в этом мире.» Диалог лишен логической связки. То есть вторая фраза не является продолжением первой. Оба философа озвучены одним голосом. Детализация хорошая, цветность сомнительная, но за игру с глубиной резкости — специальная похвала.
- Сцена — 4
- Детали — 5
- Рисунок — 4
- Динамика — 4
Макро (колибри) — 188 с
Постановка отвратительная: клюв колибри работает как ножницы (хотя это просто хоботок), что-то выстригает из цветка, потом зачем-то выдергивает несколько пыльников и зависает в воздухе, не взмахивая крыльями. Цвета отличные, детализация отменная, размытие фона очень качественное.
- Сцена — 1
- Детали — 5
- Рисунок — 5
- Динамика — 2
Спорт («Формула-1») — 136 с
Разворот на месте и движение болидов в обратную сторону нельзя назвать иначе, как сумасшествием ИИ. При этом детализация в этом сюжете едва ли не примерная, отличная цветопередача с яркими пятнами солнечного света, хорошая контрастность.
- Сцена — 1
- Детали — 5
- Рисунок — 4
- Динамика — 2
Видео по картинке получить не удалось. Две попытки с фото и две с произведением ИИ завершились провалом. В этой номинации модель получает ноль баллов.
- Драматургия — 0
- Детализация — 0
- Цвета и полутона — 0
- Динамика — 0
Итоги
Ниже представляем сводную таблицу оценок каждой из моделей отдельно по четырем номинациям и с общим баллом, являющимся простой суммой без каких-либо весовых коэффициентов.
| Сюжет | Время, с | Оценки, баллы | Сумма баллов | Всего баллов | |||||
|---|---|---|---|---|---|---|---|---|---|
| Сцена | Детали | Рисунок | Динамика | ||||||
| Hailuo 2.3 | Диалог | 102 | 3 | 3 | 4 | 3 | 13 | 42 | |
| Макро | 91 | 3 | 4 | 4 | 3 | 14 | |||
| Спорт | 136 | 2 | 1 | 3 | 2 | 8 | |||
| По фото | 92 | 2 | 1 | 2 | 2 | 7 | |||
| Kling Video 3.0 | Диалог | 56 | 4 | 5 | 5 | 4 | 18 | 72 | |
| Макро | 72 | 4 | 5 | 5 | 5 | 19 | |||
| Спорт | 72 | 5 | 5 | 4 | 4 | 18 | |||
| По фото | 96 | 4 | 5 | 4 | 4 | 17 | |||
| Kling Video o3 Omni | Диалог | 45 | 5 | 4 | 5 | 4 | 18 | 69 | |
| Макро | 78 | 4 | 5 | 5 | 4 | 18 | |||
| Спорт | 61 | 5 | 5 | 5 | 4 | 19 | |||
| По фото | 87 | 4 | 3 | 4 | 3 | 14 | |||
| Kling 2.6 | Диалог | 198 | 1 | 3 | 3 | 3 | 10 | 43 | |
| Макро | 134 | 3 | 1 | 3 | 2 | 9 | |||
| Спорт | 148 | 3 | 3 | 3 | 3 | 12 | |||
| По фото | 88 | 3 | 2 | 4 | 3 | 12 | |||
| LTX-2.3 Pro | Диалог | 114 | 3 | 4 | 4 | 4 | 15 | 57 | |
| Макро | 99 | 3 | 3 | 3 | 3 | 12 | |||
| Спорт | 144 | 3 | 4 | 3 | 2 | 12 | |||
| По фото | 84 | 4 | 4 | 5 | 5 | 18 | |||
| LTX-2.3 Fast | Диалог | 73 | 2 | 4 | 4 | 4 | 14 | 51 | |
| Макро | 96 | 2 | 3 | 3 | 2 | 10 | |||
| Спорт | 233 | 2 | 3 | 3 | 4 | 12 | |||
| По фото | 37 | 4 | 3 | 4 | 4 | 15 | |||
| Motion 2.0 | Диалог | 68 | 2 | 4 | 4 | 2 | 12 | 35 | |
| Макро | 65 | 2 | 3 | 3 | 2 | 10 | |||
| Спорт | 68 | 1 | 2 | 2 | 1 | 6 | |||
| По фото | 66 | 2 | 1 | 2 | 2 | 7 | |||
| Seedance 2.0 | Диалог | 150 | 2 | 5 | 5 | 3 | 15 | 52 | |
| Макро | 131 | 2 | 5 | 5 | 2 | 14 | |||
| Спорт | 129 | 2 | 4 | 4 | 2 | 12 | |||
| По фото* | 126 | 2 | 3 | 3 | 3 | 11 | |||
| Seedance 2.0 Fast | Диалог | 112 | 5 | 5 | 5 | 4 | 19 | 70 | |
| Макро | 102 | 4 | 5 | 5 | 5 | 19 | |||
| Спорт | 112 | 4 | 5 | 5 | 5 | 19 | |||
| По фото* | 167 | 3 | 3 | 3 | 4 | 13 | |||
| Seedance 1.0 Pro | Диалог | 95 | 3 | 3 | 3 | 3 | 12 | 39 | |
| Макро | 92 | 3 | 3 | 2 | 2 | 10 | |||
| Спорт | 93 | 1 | 3 | 3 | 2 | 9 | |||
| По фото | 98 | 3 | 1 | 2 | 2 | 8 | |||
| Seedance 1.0 Lite | Диалог | 55 | 3 | 1 | 2 | 2 | 8 | 40 | |
| Макро | 124 | 4 | 3 | 4 | 3 | 14 | |||
| Спорт | 58 | 1 | 3 | 2 | 2 | 8 | |||
| По фото | 61 | 3 | 2 | 3 | 2 | 10 | |||
| Sora 2 Pro | Диалог | 297 | 3 | 1 | 2 | 3 | 9 | 28 | |
| Макро | 281 | 2 | 1 | 2 | 1 | 6 | |||
| Спорт | 257 | 1 | 1 | 2 | 2 | 6 | |||
| По фото | 326 | 3 | 1 | 1 | 2 | 7 | |||
| Sora 2 | Диалог | 112 | 2 | 1 | 1 | 2 | 6 | 33 | |
| Макро | 115 | 2 | 2 | 2 | 1 | 7 | |||
| Спорт | 119 | 2 | 2 | 2 | 4 | 10 | |||
| По фото | 197 | 3 | 1 | 2 | 4 | 10 | |||
| Veo 3.1 Fast | Диалог | 87 | 4 | 5 | 5 | 4 | 18 | 40 | |
| Макро | 70 | 1 | 4 | 3 | 3 | 11 | |||
| Спорт | 68 | 1 | 4 | 4 | 2 | 11 | |||
| По фото | неудача | 0 | 0 | 0 | 0 | 0 | |||
| Veo 3.1 Lite | Диалог | 96 | 3 | 3 | 3 | 4 | 13 | 36 | |
| Макро | 188 | 1 | 4 | 4 | 4 | 13 | |||
| Спорт | 136 | 1 | 3 | 3 | 3 | 10 | |||
| По фото | неудача | 0 | 0 | 0 | 0 | 0 | |||
Те же данные представим на диаграмме.
Ее довольно сложно оценивать в тексте, еще сложнее — на экране смартфона. Можем порекомендовать скачать картинку и открыть ее отдельно.
Для простоты выявления победителей сначала взглянем на итоговые суммы баллов по всем номинациям.
Призовые места распределились так:
- Первое место — Kling Video 3.0
- Второе место — Seedance 2.0 Fast
- Третье место — Kling Video o3 Omni
Если же посмотреть на распределение оценок по отдельным номинациям, можно выявить предпочтительные сюжеты для генерации у разных моделей. Так, создание видео по текстовому промпту (диалог, макро и спорт) лучше поручить Seedance 2.0 Fast, а генерацию видео по фотографии — LTX-2.3 Pro (первое место) Kling Video 3.0 (второе место) и LTX-2.3 Fast (третье место).
Мы бы не стали тратить время на работу с моделями Sora и Veo хотя бы потому, что им не хватает «общей эрудиции» нейросетей. В то же время Hailuo 2.3 и Kling Video 2.6 вполне могут показать более впечатляющие результаты, если поэкспериментировать с промптами.
Строго говоря, за исключением вопиющего случая с Sora (генерация во власти артефактов компрессии, резкости нет по всему полю кадров) остальные модели можно заставить работать лучше. Вот только времени на это может потребоваться слишком много.




















