Эксперимент: как нейросеть справится с визуализацией известных русских пословиц и поговорок

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Оффтопик

Сегодня нейросети на слуху у каждого человека, даже если он никак не связан с IT, не ведет свой блог, не публикует посты в соц.сетях и не является авторам текстов для интернет изданий.

Нейросети могут все! Написать программный код, статью или даже ВУЗовский диплом. Ну а сгенерировать иллюстрацию – вообще без проблем. Главное сделать запрос, который наиболее точно, четко и конкретно отражает желаемую иллюстрацию. Но это будет, так сказать, «прямой запрос». А если запрос с аллегорией, «вторым смыслом», юмором или закавыкой? Насколько «качественно» и адекватно нейронная сеть справится с такой задачей? Решил проверить это на примере создания нейросетью иллюстраций на тему известных русских пословиц и поговорок.

Автор: pixabay

Заморачиваться с «англоязычными» нейросетями не стал, так как запрос сначала надо будет перевести на английский. Ага, попробуйте получить «адекватный» перевод пословицы с русского на английский. Слова будут те же, а вот скрытый смысл, подтекст и изюминка пропадут. Поэтому решил провести эксперимент с «русскоязычной» нейросетью от Сбера для генерации картинок из текста. ruDALL-E, хоть и является мульти язычной,  но "заточена" под русский язык. Что нам и надо. Еще пара плюсов – не требует регистрации, бесплатная (по крайней мере пока). Да и сам процесс составления запроса и выбор настроек для генерации изображения прост до безобразия. Есть как десктопная, так мобильная версии нейросети (называется «Салют»).

Заходим на сайт https://rudalle.ru. Вводим текстовый запрос для генерации картинки (для примера я сделал запрос «Кошка на окне ест сметану»).

Выбираем из предлагаемого списка предпочтительное разрешение для будущей картинки (можно запросить как вертикальное или горизонтальное расположение изображения, так и квадратное).

Выбираем опять же из предлагаемого списка стиль, в котором будет выполнена картинка. Всего стилей двадцать. Я посчитал, что для генерации иллюстраций пословиц и поговорок наиболее уместен будет стиль «Мультфильм».

После этого кликаем на «Отправить» и для того, чтобы нейросеть убедилась, что вы человек, а не робот, с помощью ползунка выравниваем предлагаемую картинку.

Всё. Начинается генерация. Процесс занимает приблизительно от тридцати секунд до одной минуты.

Получаем результат! Не шедевр, конечно, но довольно прилично, на мой взгляд. Картинкой сразу со страницы результата можно поделиться в соц.сетях или скачать её.

Ну а теперь перейдем непосредственно к эксперименту. Было сгенерировано десять картинок, текстовыми запросами для которых являлись известные русские пословицы и поговорки. Чтобы при просмотре читателями результатов эксперимента создать небольшую интригу, сами пословицы и поговорки, на которые были нейросетью созданы картинки, я спрятал под спойлером после каждой картинки. А теперь попробуйте угадать по какой пословице или поговорке ИИ сгенерировал иллюстрацию.

Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Не место человека красит, а человек место.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - хорошо)
Заставь дурака Богу молиться, он и лоб расшибёт.
Пословица или поговорка, на основе которой создана иллюстрация (результат - неудовлетворительно)
Всяк кулик своё болото хвалит.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Без труда не вытянешь (вытащишь) и рыбку из пруда.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - отлично)
Не буди лихо, пока оно тихо.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - хорошо)
В тихом омуте черти водятся.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Лучше синица в руках, чем журавль в небе.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - хорошо)
Работа не волк, в лес не убежит.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Бог не выдаст — свинья не съест.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Дареному коню в зубы не смотрят.

Как кажется лично мне, нейросеть справилась с задачей суммарно на твердую троечку с плюсом. Пара картинок, на мой взгляд, вообще «очень далека» не только от смысла «второго дна», присущего данному словесному жанру, но и даже от ключевых слов запроса. Правда необходимо учесть, что текстами запросов были не четкие и однозначные описания требуемого изображения, а народная фольклорная мудрость. А работу же выполнял хоть и интеллект, но все же искусственный.

13 комментариев

Добавить комментарий

А
да так и есть
https://rudalle.ru/check_kandinsky2/dd37a3916d594ec2ba5f00a172049766#
правообладатель ПАО СберБанк©, 2023 год, все права защищены
mixtrum
В том и была «цель» эксперимента. Вывод: на данный момент времени нейросеть (по крайней мере от Сбера) не может выдать адекватную картинку по запросу, имеющему «скрытый» смысловой подтекст. Оно и понятно. Эксперимент, правда, в данном случае, звучит слишком громко. Скорее проверка идеи и удовлетворение любопытства :-)
Nic9
Наверно хорошее развлечение для умственно отсталых…
Ploh
Ой, не стал бы я так огульно ярлыки вешать, тем более в такой светлый день добра и радости. Скорее хорошее развлечение для таких людей, о которых Вы пишите, это самому не написав ни одной статьи оставлять под статьями других авторов такие комментарии для поднятия своего эго исключительно в своих же глазах.
H
Для того, чтобы быть критиком не обязательно самому написать «Войну и мир».
mixtrum
Для того, чтобы быть настоящим профессиональным критиком надо знать и уметь больше автора. Для того, чтобы быть критиком-троллем не надо ничего — хайп и злобность превыше всего.
Sawaru
Честно говоря, кадинский, хреновастенькая нейросеть. Явно проблемы с материалами обучения. Оптимальным выглядит разрешение 768х768, пробовал генерировать, при разрешении выше, но артефактов, субъективно, становится больше.
По мне лучше использовать fusionbrain, там ты хотя бы можешь попробовать стереть кусок и сгенерировать заново.
Бот в телеграмме, позволяет например смешивать картинки.

Вообще блин, сетка иногда даже в запрос не попадает, генерирует фигню какую-то. Очень часто какие-то проблемы с лицами, в частности с глазами. Но порой справляется не плохо. Короче им бы сети больше качественных материалов скормить и до обучить.

mixtrum
Однозначно, что нейросеть Сбера не может похвастаться корректной обработкой запросов, содержащих устойчивые выражения. По крайней мере… пока.
Sawaru
Да там даже с обычным запросами бывает беда. Он мне как то в место котика, выдал хорька или нечто похожее. Или в место мужчины подсунул женщину. Был ещё момент, когда в место киберпанка он выдал, просто картинку с буквами.
mixtrum
Дела запрос «красивая стройная девушка с цветами». Картинка получилась — класс. Девушка действительно вышла красивой, цветы — прелесть. Но вот на руке, которой девушка держала букет, шесть пальцев. Наверное жила в районе Чернобыля…
Sawaru
Да с пальцами, у большинства проблемы. Кстати девушки у данной сети получаются по лучше.
А вот с парнями чаще дефекты вылезают.
.
Это по мимо того, что он банально порой рисует каких то чудовищ, в плане какие-то элементы врастают в лицо.
.
Я бы сказал, что нынче нейросеть на уровне беты. Работает, что уже хорошо, но есть очевидные проблемы.
M
С трудом догадался про разбитый лоб, остальное мимо…
Ploh
Аллегории, блин.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как люди попали в Южную Америку: новое исследование ставит под сомнение ключевой памятник континента

На протяжении почти пятидесяти лет археология Нового Света опиралась на один памятник. Стоянка Монте-Верде на юге Чили считалась главным и самым надежным доказательством того, что люди оказались в...

Как заставить звук проходить сквозь стены: новый материал направляет сигнал изнутри, оставаясь невидимым для внешних волн

Управление звуком всегда опиралось на создание физических преград. Звук это механическая волна, чередование зон высокого и низкого давления, которое распространяется в пространстве. Чтобы направить...

Ежегодное ТО газового котла. Разбираемся, за что «газовщики» берут деньги?

На днях с моими родителями случилась неприятная история — начал «скрежетать» газовый котел. Вызвали мастера, который определил, что данная проблема требует замены насоса, причем сумма за...

✦ ИИ  Между забвением и «понтами»: почему наручные часы отказываются умирать

Наручным часам уже лет тридцать безапелляционно пророчат неминуемую смерть. Начались подобные «упаднические» разговоры с появления массовых карманных компьютеров вроде легендарных Palm, грозивших...

Десять лет назад вышел смартфон, который мог спасти HTC от краха — HTC 10: почему у него ничего не получилось

Один из пионеров рынка Android, компания HTC, очень быстро растеряла свои позиции. Сначала люди недооценили аппарат One M8, который мало отличался от предыдущего M7, а затем стали ругать...

Победа «лопаты»: как Galaxy Note заставил Apple переделать iPhone, а Samsung научила мир любить большие телефоны

Если бы вы оказались в начале 2010-х и спросили любого техногика, каким должен быть идеальный смартфон, ответ был бы почти единогласным. Правила игры казались высеченными в граните, а...