Почему нас так раздражают изображения, созданные искусственным интеллектом (нейросетями)?
Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
Если автор пообещал вам публикацию на iXBT.com (а не в блогах iXBT.com), то сообщите об этом, пожалуйста, на почту abuse@corp.ixbt.com
Количество изображений в интернете, созданных Искусственным Интеллектом (нейросетями), растёт в геометрической прогрессии. Поначалу это вызывало удивление и интерес, но по мере роста их числа в Сети интерес стал угасать и стало расти раздражение от этих ИИ-картинок.
Что именно нас раздражает, и почему их стало так много в интернете, разберёмся далее в материале. И дело здесь не только в недостатках самих изображений, но и в сопутствующих вопросах (обоснованность их использования).
Также будет кратко рассмотрен вопрос об авторских правах на изображения, созданные ИИ.
Раздражение от картинок, созданных искусственным интеллектом
Раздражение от ИИ-изображений всё чаще выплёскивается наружу. Позвольте привести цитату из одного из комментариев в блогах ixbt.com от пользователя с ником JRQ:
Раньше в браузерах была функция отключения загрузки картинок… делалось это ради экономии трафика… пора опять возвращать эту функцию, чтобы не видеть этих сгенерированных искусственным «интеллектом» картинок.
JRQ
Что же нам так не нравится? Попробуем разложить «по полочкам».
1. Анатомические неточности
Начнём с самого жуткого недостатка картинок, созданных искусственным интеллектом: ошибок в анатомии живых существ. Казалось бы, ИИ должен обучаться на изображениях в интернете, и потому точно должен знать, сколько у человека пальцев, рук и ног. Но нет! Уже годами нейросети рисуют людей то с шестью пальцами, то с тремя ногами.
Самый крутой, на мой взгляд, шедевр — на следующей картинке, где у девушки на обеих руках по семь пальцев:
Изображение, созданное искусственным интеллектом. Девушка с семью пальцами на каждой руке и тяжелой формой косоглазия
К счастью, положение рук на картинке оказалось таким, что точно посчитать количество пальцев невозможно (иначе ещё не ясно, сколько бы их оказалось).
С животными тоже бывают проблемы. В следующем случае на просьбу нарисовать кота, бегущего по траве, была нарисована картинка с настолько быстро бегущим котом, что он потерял часть хвоста:
К этому надо добавить, что зрачки у кота оказались такими круглыми, как это обычно бывает при плохом освещении. А при таком хорошем, как на картинке, зрачки должны быть узкими щелочками.
Дополнительно надо отметить, что не совсем естественно получилось изображение ограниченной глубины резкости, которую попытался сымитировать ИИ подобно настоящим фотоаппаратам. Изображение становится расплывчатым слишком быстро по мере удаления от главного объекта имитации фотосъёмки: в фокусе получилась лишь узкая полоска травы. А на настоящих фотографиях падение резкости происходит более плавно.
«До кучи» можно придраться и к тени от кота на траве: Солнце на изображении светит либо слева, либо слева и спереди; и тень должна уходить не только вправо, но и вдаль от зрителя.
Все эти мелочи, помимо оторванного хвоста, приводят к потере реалистичности картинки, иногда не столько осознаваемой, сколько ощущаемой зрителем.
2. Переграмуренные картинки
Предыдущие картинки с девушками, если исправить на них анатомические неточности, можно было бы принять за хорошую студийную фотосъёмку.
Но часто нейросети генерируют такие перегламуренные картинки, что за версту видно, что это — не фотографии (но и не рисунки), например:
Лицо у девушки до такой степени отполированное, как у артисток с рекламы крема «Черный жемчуг» (начиная с Лолиты Милявской, если кто помнит). Впрочем, это была скорее заслуга не крема, а видео- и графических редакторов. :)
Такой гламур тоже может раздражать читателя (зрителя) картинки. И не только может, но и раздражает.
Кстати, обратите внимание на прогресс: на одной из рук уже ровно пять пальцев! :)
К «плюсам» этой картинки надо отнести то, что она, тем не менее, оказалась очень кстати в том материале, откуда она взята. Материал был посвящён проблеме спама и мошенничества, и гипертрофированный испуг девушки очень подходил к теме материала. К сожалению, ИИ-картинки часто присутствуют в материалах совершенно некстати.
Для коллекции — ещё пара перегламуренных девушек, созданных ИИ:
Можно, конечно, попросить нейросеть изобразить и не очень красивую даму, но результат получается всё равно неестественным. Я попробовал создать картинку по запросу «Жуткая тётка, вся в слезах и в помаде». Тётка получилась, действительно, жуткая, но всё равно «не настоящая». Результат приводить не буду, чтобы не портить настроение читателям. :)
3. Технические (а также архитектурные и т. п.) ошибки
Нейросети создают «криво» не только изображения живых существ, но и неодушевлённых предметов.
Следующая картинка будет ещё более странная; а история её такова.
Запрос на изображение был сложным. Не удовлетворившись количеством и качеством стоп-кадров из фильма «Жестокий романс» в интернете, на которых есть участвовавшие в съёмках колёсные пароходы, я попросил нейросеть изобразить пароход «Святая Ольга» из этого фильма.
Колесный пароход «Святая Ольга» из фильма «Жестокий романс» (так он выглядит по мнению нейросети)
Пароход в итоге оказался не колёсным, а обычным; с искривлённой то ли трубой, то ли наблюдательной площадкой («марсом»).
«До кучи», название парохода оказалось неизвестным, поскольку написано было на неизвестном науке языке. :)
Географические и архитектурные ошибки нейросетей — тоже не редкость.
Запрос для создания следующей картинки был тоже не простым и касался одного из культовых мест Первопрестольной — Серебряного Бора (остров на реке с красивым парком). Запрос был таким: «Серебряный Бор, снег, иней, Москва-река, вид зимой».
Серебряный Бор, снег, иней, Москва-река, вид зимой — так это себе представляет искусственный интеллект
Но не всё так плохо. Зато некоторые нейросети уже умеют понимать иносказательные выражения. Например, по запросу «Барашки на воде», нейросеть создала не баранов, купающихся в воде, а, действительно, барашки на воде:
Причины чрезмерного наплыва ИИ-картинок в интернете
Причин этого многогранного явления — много. Попытаемся выделить основные.
Возможно, Вы будете смеяться, но первой причиной я бы назвал лень. Для того, чтобы проиллюстрировать какую-то статью, то, если всё делать по-честному, будут доступны три возможности: сделать фотографию/рисунок самому (или заказать); найти в интернете подходящую картинку из легальных источников (иногда это может стоить денег); создать изображение в нейросети. Угадайте с одного раза, что проще всего?!
Вторая причина — крайне серьёзная, юридическая. Кроме знаменитых патентных троллей, в природе (в том числе и в России) развелись и тролли по авторским правам на изображения (особенно — на фотографии). Если при иллюстрировании статьи вольно или невольно использовать чужое изображение, то к Вам просто запросто прилетит иск. Особенно это касается юридических лиц — на них идёт просто адская охота: тысячи исков ежегодно. С физическими лицами ситуация другая: юридической возни с ними в разы больше, а потенциальный доход с них в разы меньше, поэтому с ними обладатели авторских прав судятся значительно реже, — только с самыми бессовестными.
И тут находится превосходный выход — делать нужные изображения с помощью искусственного интеллекта.
«Изюминка» здесь состоит в том, что по внутренним алгоритмам нейросетей, даже одна и та же нейросеть по одному и тому же запросу никогда не сделает одинаковые картинки! То есть, сделав такую картинку, Вы никогда не получите иск по поводу авторских прав (таких же картинок ни у кого не будет).
Третья причина — самая уважительная: если надо создать изображение того, чего нет в природе и что невозможно сфотографировать. В качестве примера можно привести первую картинку в этой статье.
А вот и ещё один пример: сказочно-фантастический. Эта картинка была создана по шутливому запросу «Кукуха поехала»:
Кукуха поехала (создано нейросетью). И ведь не поспоришь: действительно, поехала!
А что с авторскими правами на изображения, созданные искусственным интеллектом (нейросетями)?!
Определённо можно сказать, что законодательство в этой сфере «недопилено». Многими юристами высказывается мнение, что авторские права могут распространяться только на произведения, созданные Человеком.
Однако, пока что это — только теория. А на практике же на эти изображения распространяется «Пользовательское соглашение» (оно же «Лицензионное соглашение»), которое составляют владельцы нейросетей. Оно имеет силу Договора, и за его нарушение тоже может «прилететь».
Каковы могут быть условия Пользовательских соглашений?
Да самые разные!
Самое простое, пожалуй, у нейросети Kandinsky (fusionbrain.ai, PDF). Согласно этому соглашению, авторские права на изображения, созданные нейросетью, принадлежат пользователю, их создавшему. Цитата:
6.2. Исключительные права на Контент принадлежат Пользователю.
Пользовательское соглашение сайта fusionbrain. ai
Коротко и ясно. Кстати, из этого проистекает, что просто взять и использовать чужое изображение в своих целях нельзя, хоть оно и создано Искусственным Интеллектом.
Но бывают и гораздо более сложные случаи: отдельные нейросети могут запрещать, например, коммерческое использование изображений (либо разрешать его по отдельному тарифному плану), запрещать изменение изображений и т. п. Надо читать «Пользовательские соглашения», хоть это и не принято!
Итоги и выводы
Как и всякий инструмент, создание картинок нейросетями может быть применено на благо, а может и во вред.
Основные претензии к таким изображениям заключаются как в проблемах самих изображений, так и в практике их применения.
Основные проблемы изображений, созданных нейросетями, заключаются в их выше рассмотренных недостатках: неправильная анатомия или технические ошибки, перегламуренность, неспособность сформировать текст. У разных нейросетей (их уже очень много) всё перечисленное может быть выражено в совершенно разной степени.
Причём, в большинстве случаев, читатель (зритель) может почти с первого взгляда определить, настоящая это картинка (рисунок или фото), или созданная нейросетью. Часто даже невозможно чётко сформулировать, что в картинке не так, но всё равно понятно, что она — из нейросетей.
Проблемы с применением изображений, созданных искусственным интеллектом, заключаются в том, что их сейчас вставляют везде — к месту и не к месту. Часто вместо картинки из нейросети лучше было бы вставить фотографию или рисунок; но авторы статей торопятся, «гонят вал» (или экономят деньги); вот и идут массово в публикациях мало уместные картинки, созданные нейросетями.
Всем спасибо за внимание!
Изображение в превью:
Автор: YandexART
Источник: ya.ru