Как сгенерировать загадки к сюжетам сказок при помощи нейросетей

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | ИИ, сервисы и приложения

Персонажи сказок в объективе нейросети были довольно распространённой темой на заре большой популярности нейросетей. Моё увлечение генерированием картинок началось значительно позднее, а идея создать персонажей в своём стиле пришла только в начале года. Но я не хотел повторять персонажей в разном стиле, я решил создать что-то с первого взгляда не связанное и добавить в кадр автомобили. Что из этого получилось, и как можно повторить, расскажу в данной статье.

Вариация на тему «Красной шапочки»
Автор: Grolribasi

Правила игры

Я не умею рисовать, но у меня хорошо работает фантазия и я могу сформулировать запрос, что я хотел бы увидеть. Нейросети — отличный инструмент, который помогает творить при помощи фантазии и текстовых описаний.

Сначала я генерировал просто для себя, жены и близких знакомых, но потом решил выложить картинки у себя в телеграм-канале, где тема нашла отклик среди подписчиков. Потом я вложил ещё, а потом затея переросла в увлекательную игру по угадыванию зашифрованных названий сказок. У всех генераций было три базовых правила:

  1. Мир должен быть современным и максимально реалистичным.
  2. В кадре обязательно должны быть машины или техника.
  3. Параллели не должны быть слишком очевидны.

При первом взгляде на картинки в большинстве случаев нельзя понять, что это сказки. Так и должно быть, так и задумано, потому что это загадки, а любая загадка строится на допущении, сравнении, порой даже на абсурде. Загадки должны быть неочевидными, в противном случае отгадывать будет нечего. Картинка, в которой зашифрована сказка должна мотивировать решающего её поразмышлять.

Вероятно, вы помните, как на первой волне популярности нейросетей часто генерировали персонажей сказок: сказка читалась с первого взгляда. Я решил избрать подход тонких намёков и переосмыслений. Некоторым решающим показалось, что правильные ответы слишком натянуты и это действительно так. В некоторых случаях нужно иметь фоновые знания, в других нужно уметь мыслить метафорически, в других — обращать внимание на детали. Правильное решение может выдать какая-нибудь деталь, ситуация или метафорическая трактовка картинки. Это загадки, требующие решения, а не «персонажи сказок в объективе нейросети».

Первая сказка

Красная BMWшечка
Автор: Grolribasi Источник: creator.nightcafe.studio

Это иллюстрация к сказке «Красная шапочка». Думаю, что найти на изображении намёки совсем не трудно. Небольшое переосмысление оригинального сюжета: пригородная заправка, укутанная лесом со всех сторон, страшный механик вместо серого волка, невинная девочка и красная БМВ. Мне кажется, что марка автомобиля и модель отлично вписываются в подтекст сказки. С промптом тоже не было особых проблем, идея пришла сразу.

Посмотреть промпт:
A scene at the countryside gas station station with Douglas fir trees in the background. A young 18yo girl standing straight next to her red BMW Z4 convertible. She is dressed in a red mini skirt and black t-shirt with a picture of a basket full of small cherry pies. She is lost and a little scared. A 30yo tall thin bearded car mechanic guy with grey hair, dressed in grey jeans and t-shirt holding a wrench. He is grim and scary. The scene is dark and mysterious, with a hint of fairytale style. The girl and the man are looking each other in the yes.

Сгенерировано в: Ideogram 2.0

Девушка на монстр-траке

После успешного выступления на арене
Автор: Grolribasi Источник: creator.nightcafe.studio

Несмотря на то, что на картинке почти прямым текстом написано название сказки (BEAST на монстр-траке переводится как «чудовище»), отгадать зашифрованную сказку получается не у всех. Это нормально, ведь огромный монстр-трак и современная арена со зрителями не говорит, что это на самом деле «Красавица и Чудовище». Но когда знаешь ответ, решение кажется очевидным: привлекательная девушка на монстр-траке да ещё и в цветах известной диснеевской экранизации: она его усмирила, полюбила таким, какой он есть и жили они долго и счастливо. Это была довольно быстрая генерация, идея пришла сразу и была тут же реализована.

Посмотреть промпт:
A mysterious, dark fairytale scene at the big stadium arena: crowds of spectators are watching a gorgeous, pretty young woman standing on the front wheel of a huge blue Ford monster truck with big white horns on the front hood. The monster truck has white and yellow stripes and a word «BEAST» written on the side. The woman is looking towards the camera, laughing, and waving her arms in a victorious gesture. The woman is dressed in yellow pants and a long yellow cape

Сгенерировано в: Flux Schnell + Clarity Upscaler

Банда на дороге

Банда байкеров на дороге
Автор: Grolribasi Источник: creator.nightcafe.studio

У этой генерации сложная история, потому что числительные — бич нейросетей. Числа больше 5 получаются плохо почти у всех моделей. И чем больше число, тем больше шансы на ошибку, особенно, если нужно получить разные свойства объектов на картинке. Я не полностью доволен генерацией, потому что на картинке заметен классический нейросетевой налёт, но остальные варианты были ещё хуже.

Снова ответ не очевиден, потому что ситуация не намекает на сказку. Группа людей на дороге, можно сказать банда и одна девушка. Но определённые намёки всё же есть: во-первых, хрустальный гроб на крыше, во-вторых, количество мужчин, гномов (низкорослые люди в реалистичном сеттинге у нейросети получаются плохо). Если знать, что здесь зашифрована сказка и попробовать подумать, ответ придёт быстро — это «Белоснежка и семь гномов».

Посмотреть промпт:
A post-apocalyptic scene at the Alpine road. A woman and seven bikers standing next to an old derelict hearse car. On top of the hearse stands a crystal coffin. The woman is beautiful and young woman with long black straight hair and pale skin. The bikers are bearded midget men in leather jackets. The whole atmosphere of the scene is dark, mysterious, and post-apocalyptic fairytale style.

Сгенерировано в: Flux Pro + Clarity Upscaler

Полицейский и нарушитель

Случай в европейской стране
Автор: Grolribasi

Следующий уровень сложности, это менее известная сказка и более сложный ребус. Идея родилась быстро, но с реализацией пришлось повозиться, нейросеть не хотела ставить машины боком. В один момент я уже отчаялся и набросал эскиз для нейросети своими руками в пэинте, получилось интересно, но не то, что хотелось бы. Однако после небольшого редактирования промпта, результат получился почти идеальный.

Здесь зашифрована старая немецкая сказка «Гамельнский крысолов», потому что на полицейской машине написано по-немецки и сама машина явно марки Мерседес. А вот с «крысами» сложнее, пришлось немного переосмыслить сюжет, и уменьшить количество крыс до одной. Где крыса? Это вторая машина — рэт род. Так называют хот роды в ржавом стиле. Полицейский поймал рэт род, рэт в переводе значит «крыса», полицейский поймал крысу, сказка немецкая, значит «Гамельнский крысолов».

Не совсем прямое следование тексту и смыслу сказки, но здесь работает тот же принцип, что и у ребусов: если вы знакомы с загаданным, вы, скорее всего, отгадаете. Если же сказка вам не знакома, то смысла гадать нет.

Посмотреть промпт:
A scene at the roadside. An oldschool rusty rat rod pulled over by Deutsch Polizei car. The Polizei car is Audi station wagon in white, blue, and yellow color. On the side of the Audi «POLIZEI» is written. A Polizei man in black uniform standing next to the rat rod talking to the rat rod driver. The scene has a mysterious fairytale style vibe.

Сгенерировано в: Ideogram 2.0

Участница автомобильного дерби

Победительница
Автор: Grolribasi Источник: creator.nightcafe.studio

Девушка на этой генерации — результат долгой цепочки генераций. Первый вариант был с цифрой 7 на двери машины синего цвета, что очень сильно путало. К тому же не было ощущения шоу, арены, бала. После обратной связи я немного переделал картинку, получилась арена, но результат всё ещё не был удовлетворительным. Была сцена, было шоу, но машины не были похожи на машины для дерби.

Финальный вариант получился поздним вечером довольно неожиданно, когда я попробовал другую модель с тем же промптом. Здесь есть и правдоподобно лишённая бьющихся частей машина с правдоподобной посредственной раскраской и неразборчивыми письменами, а также сцена, с другими участниками.

Конечно же, загаданная сказка — это «Золушка». По сказке простая девушка с низов общества стала принцессой, благодаря магии и хрустальной туфельке. Но в глубинном смысле «Золушка» ломает стереотипы о стеснительных и бедных девушках. Генерация получилась такой же: авто дерби считается сельским увлечением для реднеков, но хрупкая девушка не постеснялась принять в нём участие и победила. Девушка поднялась с колен, превзошла своё происхождение. Но тут обошлось без магии, всё решили собственные навыки. Намекает на Золушку в картинке цифра 12 на боку машины, «тыквенный» цвет и сверкающий (почти хрустальный) трофей.

Посмотреть промпт:
In a bustling demolition derby arena, bathed in warm, golden light, a young woman stands triumphantly next to the battered pumpkin and white demolition derby car, laughing joyously as she waves a victorious hand in the air. She clutches a gleaming glass trophy in her other hand, her boots gleaming against the dented and graffiti-scarred metal of the car. The car, devoid of windows and door handles, boasts a massive dent on its side and the number «12» boldly painted in black on one of its doors, while the rustic charm of her blue jeans complements the chaotic backdrop of cheering spectators and other derbies cars.

Сгенерировано в: Google Imagen

Грузовик в деревне

Кошмар Греты Тумберг
Автор: Grolribasi Источник: creator.nightcafe.studio

Над этой генерацией пришлось подумать, было сложно поймать правильную идею, которая бы вписалась в сюжет сказки и при этом имела бы смысл в современном мире. Но даже когда идея была поймана, была сложность с тем, чтобы заставить дым идти из правильного места. Очень часто нейросети рисуют выхлоп отдельно от труб, из которых он должен выходить. Человек-то понимает, а машина — нет.

Правильный ответ — любой из трёх: «Горшочек каши» / «Сладкая каша» / «Горшочек, не вари». На картинке изображён дымящий грузовик. Дым идёт из выхлопных труб, можно сказать, из двигателя. В двигателе есть цилиндры, которые на сленге называют «горшками». Получается, горшки дымят, то есть «варят», то есть изобилие. Если не знать, что это загадка, что есть такая сказка, догадаться невозможно, и в этом вся прелесть.

Посмотреть промпт:
A scene of a big heavy-duty truck driving through a small medieval German village. Thick black smoke coming from the side pipes. The village is covered in a layer of smoke from the truck. The villagers are terrified, begging the truck to stop smoking. The atmosphere of the picture is ominous and thought provoking.

Сгенерировано в: Flux PRO v1.1 Ultra + Clarity Upscaler

Две машины

Синий Mercedes и розовая BMW
Автор: Grolribasi

Вариантов реализации получилось два. Первый был слишком очевидный, поэтому пришлось придумать менее простой. Но с его реализацией надо было попотеть. Нейросети легко генерируют что-то идеальное, симметричное и с отличной детализацией, но когда дело доходит до мелких несовершенств или дефектов, дела обстоят хуже. Здесь это меня и подвело. За машиной должен был тянуться след масла, но нейросеть не осилила такое сложное понятие, поэтому нарисовала след от покрышек. Не так хорошо, как след масла, но лучше, чем ничего или следы непонятной природы, исходящие от обеих машин.

Здесь зашифрована сказка «Ганзель и Гретель». Догадаться достаточно легко, если приглядеться к символам: синий цвет у машины «мальчика» и розовый цвет у «девочки». За одной машиной остаётся след. Здесь нет ведьмы, но есть лесная дорога.

Посмотреть промпт:
A view from the back of two cars driving down the country road: blue Mercedes and pink BMW. On the road behind the blue Mercedes a long trace of black engine oil is visible. The atmosphere of the image is mysterious and fairytale style. Country road with majestic Douglas pine trees on the side of the road.

Сгенерировано в: Google Imagen

Итог

Мне понравилось генерировать сказки в современной интерпретации с автомобилями. Это одновременно увлекательный и сложный процесс, требующий креативного подхода и переосмысления оригинального сюжета. А ещё чтение сказок пробуждает в людях что-то доброе и детское. Я определённо буду придумывать ещё.

Изображение в превью:
Автор: Grolribasi
Источник: creator.nightcafe.studio
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Пишу под ником Grolribasi, люблю посты на нишевые темы, чтобы в них разобраться.
Веду канал в телеграме: @grolchannel

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

От LUCA до человека: как механизм выживания первых клеток Земли управляет метаболизмом сегодня

Синтез белка — самый ресурсоемкий биохимический процесс в любой живой клетке. Когда питательные вещества во внешней среде заканчиваются, клетка сталкивается с физической необходимостью...

Почему нельзя держать рыб в круглом аквариуме? 5 причин выбрать другую форму

Круглый аквариум выглядит эффектно: прозрачный шар, минимализм, «золотая рыбка из детства». Он часто появляется в фильмах, рекламе и интерьерах как символ стиля и простоты. Но за этой эстетикой...

В Музее Времени и Часов открылась «секретная» выставка: здесь показывают опытные образцы легендарного НИИ Часпром

Несмотря на то, что фактически НИИ Часпром существует и в наши дни, аббревиатура для многих даже часовых любителей - загадка. Мало кто знает или помнит, что научно исследовали...

Если магнитный щит Земли снова упадет до 5%: как повторение магнитной аномалии Лашамп повысит облучение экипажей самолетов в 75 раз

На высотах от 10 до 12 километров, где пролегают маршруты современных коммерческих авиалайнеров, плотность атмосферы значительно ниже, чем на уровне моря. Из-за этого самолеты и их пассажиры...

Ученые долго не понимали, как тело чувствует холод: ответ нашли в термодинамике нервных рецепторов

Способность живых организмов ощущать температуру окружающей среды — одна из базовых функций нервной системы, особо важная для выживания. У млекопитающих за распознавание холода отвечает...