Как сгенерировать загадки к сюжетам сказок при помощи нейросетей
Персонажи сказок в объективе нейросети были довольно распространённой темой на заре большой популярности нейросетей. Моё увлечение генерированием картинок началось значительно позднее, а идея создать персонажей в своём стиле пришла только в начале года. Но я не хотел повторять персонажей в разном стиле, я решил создать что-то с первого взгляда не связанное и добавить в кадр автомобили. Что из этого получилось, и как можно повторить, расскажу в данной статье.
Правила игры
Я не умею рисовать, но у меня хорошо работает фантазия и я могу сформулировать запрос, что я хотел бы увидеть. Нейросети — отличный инструмент, который помогает творить при помощи фантазии и текстовых описаний.
Сначала я генерировал просто для себя, жены и близких знакомых, но потом решил выложить картинки у себя в телеграм-канале, где тема нашла отклик среди подписчиков. Потом я вложил ещё, а потом затея переросла в увлекательную игру по угадыванию зашифрованных названий сказок. У всех генераций было три базовых правила:
- Мир должен быть современным и максимально реалистичным.
- В кадре обязательно должны быть машины или техника.
- Параллели не должны быть слишком очевидны.
При первом взгляде на картинки в большинстве случаев нельзя понять, что это сказки. Так и должно быть, так и задумано, потому что это загадки, а любая загадка строится на допущении, сравнении, порой даже на абсурде. Загадки должны быть неочевидными, в противном случае отгадывать будет нечего. Картинка, в которой зашифрована сказка должна мотивировать решающего её поразмышлять.
Вероятно, вы помните, как на первой волне популярности нейросетей часто генерировали персонажей сказок: сказка читалась с первого взгляда. Я решил избрать подход тонких намёков и переосмыслений. Некоторым решающим показалось, что правильные ответы слишком натянуты и это действительно так. В некоторых случаях нужно иметь фоновые знания, в других нужно уметь мыслить метафорически, в других — обращать внимание на детали. Правильное решение может выдать какая-нибудь деталь, ситуация или метафорическая трактовка картинки. Это загадки, требующие решения, а не «персонажи сказок в объективе нейросети».
Первая сказка
Это иллюстрация к сказке «Красная шапочка». Думаю, что найти на изображении намёки совсем не трудно. Небольшое переосмысление оригинального сюжета: пригородная заправка, укутанная лесом со всех сторон, страшный механик вместо серого волка, невинная девочка и красная БМВ. Мне кажется, что марка автомобиля и модель отлично вписываются в подтекст сказки. С промптом тоже не было особых проблем, идея пришла сразу.
Сгенерировано в: Ideogram 2.0
Девушка на монстр-траке
Несмотря на то, что на картинке почти прямым текстом написано название сказки (BEAST на монстр-траке переводится как «чудовище»), отгадать зашифрованную сказку получается не у всех. Это нормально, ведь огромный монстр-трак и современная арена со зрителями не говорит, что это на самом деле «Красавица и Чудовище». Но когда знаешь ответ, решение кажется очевидным: привлекательная девушка на монстр-траке да ещё и в цветах известной диснеевской экранизации: она его усмирила, полюбила таким, какой он есть и жили они долго и счастливо. Это была довольно быстрая генерация, идея пришла сразу и была тут же реализована.
Сгенерировано в: Flux Schnell + Clarity Upscaler
Банда на дороге
У этой генерации сложная история, потому что числительные — бич нейросетей. Числа больше 5 получаются плохо почти у всех моделей. И чем больше число, тем больше шансы на ошибку, особенно, если нужно получить разные свойства объектов на картинке. Я не полностью доволен генерацией, потому что на картинке заметен классический нейросетевой налёт, но остальные варианты были ещё хуже.
Снова ответ не очевиден, потому что ситуация не намекает на сказку. Группа людей на дороге, можно сказать банда и одна девушка. Но определённые намёки всё же есть: во-первых, хрустальный гроб на крыше, во-вторых, количество мужчин, гномов (низкорослые люди в реалистичном сеттинге у нейросети получаются плохо). Если знать, что здесь зашифрована сказка и попробовать подумать, ответ придёт быстро — это «Белоснежка и семь гномов».
Сгенерировано в: Flux Pro + Clarity Upscaler
Полицейский и нарушитель
Следующий уровень сложности, это менее известная сказка и более сложный ребус. Идея родилась быстро, но с реализацией пришлось повозиться, нейросеть не хотела ставить машины боком. В один момент я уже отчаялся и набросал эскиз для нейросети своими руками в пэинте, получилось интересно, но не то, что хотелось бы. Однако после небольшого редактирования промпта, результат получился почти идеальный.
Здесь зашифрована старая немецкая сказка «Гамельнский крысолов», потому что на полицейской машине написано по-немецки и сама машина явно марки Мерседес. А вот с «крысами» сложнее, пришлось немного переосмыслить сюжет, и уменьшить количество крыс до одной. Где крыса? Это вторая машина — рэт род. Так называют хот роды в ржавом стиле. Полицейский поймал рэт род, рэт в переводе значит «крыса», полицейский поймал крысу, сказка немецкая, значит «Гамельнский крысолов».
Не совсем прямое следование тексту и смыслу сказки, но здесь работает тот же принцип, что и у ребусов: если вы знакомы с загаданным, вы, скорее всего, отгадаете. Если же сказка вам не знакома, то смысла гадать нет.
Сгенерировано в: Ideogram 2.0
Участница автомобильного дерби
Девушка на этой генерации — результат долгой цепочки генераций. Первый вариант был с цифрой 7 на двери машины синего цвета, что очень сильно путало. К тому же не было ощущения шоу, арены, бала. После обратной связи я немного переделал картинку, получилась арена, но результат всё ещё не был удовлетворительным. Была сцена, было шоу, но машины не были похожи на машины для дерби.
Финальный вариант получился поздним вечером довольно неожиданно, когда я попробовал другую модель с тем же промптом. Здесь есть и правдоподобно лишённая бьющихся частей машина с правдоподобной посредственной раскраской и неразборчивыми письменами, а также сцена, с другими участниками.
Конечно же, загаданная сказка — это «Золушка». По сказке простая девушка с низов общества стала принцессой, благодаря магии и хрустальной туфельке. Но в глубинном смысле «Золушка» ломает стереотипы о стеснительных и бедных девушках. Генерация получилась такой же: авто дерби считается сельским увлечением для реднеков, но хрупкая девушка не постеснялась принять в нём участие и победила. Девушка поднялась с колен, превзошла своё происхождение. Но тут обошлось без магии, всё решили собственные навыки. Намекает на Золушку в картинке цифра 12 на боку машины, «тыквенный» цвет и сверкающий (почти хрустальный) трофей.
Сгенерировано в: Google Imagen
Грузовик в деревне
Над этой генерацией пришлось подумать, было сложно поймать правильную идею, которая бы вписалась в сюжет сказки и при этом имела бы смысл в современном мире. Но даже когда идея была поймана, была сложность с тем, чтобы заставить дым идти из правильного места. Очень часто нейросети рисуют выхлоп отдельно от труб, из которых он должен выходить. Человек-то понимает, а машина — нет.
Правильный ответ — любой из трёх: «Горшочек каши» / «Сладкая каша» / «Горшочек, не вари». На картинке изображён дымящий грузовик. Дым идёт из выхлопных труб, можно сказать, из двигателя. В двигателе есть цилиндры, которые на сленге называют «горшками». Получается, горшки дымят, то есть «варят», то есть изобилие. Если не знать, что это загадка, что есть такая сказка, догадаться невозможно, и в этом вся прелесть.
Сгенерировано в: Flux PRO v1.1 Ultra + Clarity Upscaler
Две машины
Вариантов реализации получилось два. Первый был слишком очевидный, поэтому пришлось придумать менее простой. Но с его реализацией надо было попотеть. Нейросети легко генерируют что-то идеальное, симметричное и с отличной детализацией, но когда дело доходит до мелких несовершенств или дефектов, дела обстоят хуже. Здесь это меня и подвело. За машиной должен был тянуться след масла, но нейросеть не осилила такое сложное понятие, поэтому нарисовала след от покрышек. Не так хорошо, как след масла, но лучше, чем ничего или следы непонятной природы, исходящие от обеих машин.
Здесь зашифрована сказка «Ганзель и Гретель». Догадаться достаточно легко, если приглядеться к символам: синий цвет у машины «мальчика» и розовый цвет у «девочки». За одной машиной остаётся след. Здесь нет ведьмы, но есть лесная дорога.
Сгенерировано в: Google Imagen
Итог
Мне понравилось генерировать сказки в современной интерпретации с автомобилями. Это одновременно увлекательный и сложный процесс, требующий креативного подхода и переосмысления оригинального сюжета. А ещё чтение сказок пробуждает в людях что-то доброе и детское. Я определённо буду придумывать ещё.
Источник: creator.nightcafe.studio





0 комментариев
Добавить комментарий