Как рисовать картинки в одинаковом стиле в DALL-E

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Инструкция | Оффтопик

Эта статья — пошаговый гайд, который поможет скопировать персонажа, стиль картинки или общий прицип построения кадра в DALL-E.

Гайд пригодится, если вам нужны фотографии для статьи, презентации или рекламных креативов.

Как копировать стиль сгенерированной картинки

В DALL-E есть параметр gen_ids, который отвечает за конкретный стиль изображений в конкретном чате. Если его узнать, вы сможете повторять стиль в разных картинках точь-в-точь.

Работать с ним намного проще, чем каждый раз писать в промпте «сделай в таком-то стиле» или «нарисуй такую же картинку». Да и без gen_ids нейронка не будет полностью соблюдать задание и каждый раз будет додумывать что-то от себя.

Чтобы скопировать стиль, вам нужно:

  1. Сгенерировать картинку, а потом написать: Please give me the gen_ids. Бот выдаст параметры обоих изображений.
  2. Написать новый промпт и в конце добавить in the style of image [Gen_ids понравившейся картинки].

Благодаря параметру gen_ids вы сможете генерировать абсолютно разные картинки, с разными персонажами и окружением, но они все равно будут похожи между собой.

Важно! Параметр gen_ids сохраняется только в текущем чате. Если вы начнете новую беседу с ботом, он уже не будет знать о вашем стиле.

Давайте протестируем на примере случайного промпта. Например, такого:

Промпт. Минималистичный графический стиль середины 20-го века. Плоские цвета и геометрические формы. Персонаж должен быть в костюме с галстуком, сидит за столом с бумагами и печатной машинкой. Простые и чистые линии, цвета: зеленый, коричневый и белый.

Получилось такое фото:

Теперь попросим gen_ids. И сгенерируем три новые картинки:

  1. a car on a tow truck, a forest in the background in the style of image rhi7WK2PstFsqiCd
  2. woman riding a bike in the style of image rhi7WK2PstFsqiCd
  3. a woman behind the table in the style of image rhi7WK2PstFsqiCd
Такие картинки у меня получились

Видно, что картинки сильно похожи по стилю на референс. При этом я сильно сэкономил себе время и вместо описания стиля просто добавлял gen_ids.

Как рисовать картинки с одним персонажем

Стиль мы скопировали. Теперь пойдем дальше и попробуем скопировать персонажа. Здесь все работает просто: к начальной генерации добавляем 0001 в конце, а к следующим картинкам — первоначальный промпт + доп. детали + 0002 (и к каждой новой фотке +1) + Gen_ids. Давайте для примера нарисуем мужчину, а потом переоденем его.

Промпт. Иллюстрация, мужчина середины 20-го века. Смотрит в объектив, улыбается. Персонаж в футболке, сидит за столом с бумагами и печатной машинкой 0001

Теперь запрашиваем Gen_ids фотографии. А дальше — меняем первоначальный запрос, добавляем к нему 0002 и Gen_ids. Получается так:

Промпт: Иллюстрация, мужчина середины 20-го века. Смотрит в объектив, улыбается. Персонаж в костюме с галстуком, сидит за столом с бумагами и печатной машинкой 0002 в стиле изображения 3tgqDFvrsME0Kx73

Важно! Чтобы промпт работал без ошибок, не меняйте его основу. Например, вам нужен 20-летний парень с короткими светлыми волосами — всегда просите нарисовать его. Не меняйте эмоции одновременно с одеждой, возрастом и волосами. Велик шанс, что второй персонаж будет сильно отличаться от первого.

Как генерировать картинки на основе одного и того же сюжета

А теперь разом сгенерируем 4 картинки с одним и тем же персонажем/героем, но в разном окружении. Делается это просто: прописываем промпт, а в конце добавляем, чтобы бот рисовал объект в 4 разных окружениях, в разное время и т. д. В общем, чтобы в промпте была смена окружения.

Главное — описывать объекты в промптах максимально точно. Иначе нейронка будет что-то додумывать.

Промпт:

Для человека — Generate four pictures of the same [для человека раса и пол] at ages 10, 25, 50, and 90

Для предмета — four different pictures of the same [максимально точное описание объекта] in [опишите 4 окружения, например, страны]

Я для примера сгенерирую машину в разные времена года: лето, осень, зиму и весну.

Важно! Иногда бот может выдавать коллажи из фото. Т. е., одну большую фотку, которая разделена на 4 секции. Чтобы это исправить, просто запросите повторную генерацию. Или напишите «нет, мне нужно 4 отдельных фото, которые ты сканируешь подряд».

Вот, каких 4 Порше у меня получилось.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Коммерческий автор, пишу о бизнесе, финансах, инвестициях и IT. Рассказываю о нейросетях в диджитале. Больше интересного контента о нейросетях в телеграм-канале «Нейроцех»

Сейчас на главной

Новости

Публикации

Обзор игровой эргономичной беспроводной мышки Rapoo VT3 Max

Ключевой вопрос для современной мыши: превосходство в игровых характеристиках или комфорт при многочасовой работе? А что, если стремиться к идеалу, объединив передовую начинку с продуманной...

Обзор детского обучающего планшета XPPen Doodle Learning Board

Любой девайс будет лучше, если вставить в него экран. Поэтому даже простая игрушка для детей, но с экраном становится более интересной. Вот и я тоже решил пощупать, что ж за новинка вышла у...

Сделано в России? Да! Обзор новых часов Morzo с самым «маникюрным» циферблатом

Независимый российский бренд Morzo представил новую модель часов, и она традиционно вышла совершенно отличной. В первую очередь отличной от всего того, что бренд показывал раньше.

Необычный дизайн и «бесконечная» память: каким был смартфон Nextbit Robin, вышедший 10 лет назад

Представьте себе, что вам больше не нужно беспокоиться о количестве памяти в смартфоне. Даже если ваш накопитель на условные 256 Гигабайт близок к заполнению, все «лишние» файлы просто уйдут в...

Реальное место с рабочего стола Windows: древний мост Пуэнте-Нуэво в городе Ронда

Вы точно видели этот каменный мост над глубоким ущельем, даже если никогда не были в Испании. Это изображение есть на рабочем столе в свежих версиях операционной системы Windows. Обои рабочего...