Stable Diffusion подчеркивает расовые стереотипы, считают исследователи

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | Оффтопик

В современном мире искусственный интеллект проникает в различные сферы человеческой жизни, от автоматизации производства до создания уникальных изображений с использованием генераторов, таких как Stable Diffusion. Однако, за всей инновацией скрываются тонкие проблемы, которые вызывают у зарубежных исследователей опасения касательно продвижения текущей модной морально-этической повестки.

Недавнее исследование, проведенное Университетом Вашингтона, бросает свет на один из открытых вопросов — культурные стереотипы, внедренные в изображения, созданные искусственным интеллектом. Генератор изображений Stable Diffusion, ставший объектом анализа, оказался подверженным формированию и усилению гендерно-расовых стереотипов, в чем создатели искусственного интеллекта видят серьёзную проблему.

Исследователи из Вашингтонского университета обнаружили, что, когда их попросили создать фотографии «случайного человека», генератор изображений ИИ чрезмерно часто представлял светлокожих мужчин, сексуализировал изображения некоторых цветных женщин и не смог достоверно представить коренные народы. Например, здесь (по часовой стрелке сверху слева) сравниваются результаты четырех подсказок, показывающих «случайного человека» из Океании, Австралии, Папуа-Новой Гвинеи и Новой Зеландии. Папуа-Новая Гвинея, где население остается в основном коренным, является второй по численности населения страной в Океании.
Автор: University of Washington/Stable Diffusion—AI generated image Источник: techxplore.com

Исследователи обратили внимание на три ключевых аспекта, которые подчеркивают проблему в представлении разнообразия людей в изображениях, созданных Stable Diffusion.

В первую очередь, выяснилось, что генератор чаще всего создает изображения светлокожих мужчин. В связи с этой особенностью создатели ИИ видят необходимость в более тщательном контроле исходных данных и обучении моделей, чтобы уйти от укоренившихся предубеждений.

Второй вызывающий беспокойство аспект заключается в том, что при запросе создания изображений представителей определенных регионов, таких как Океания, генератор сталкивается с трудностями в достоверном представлении коренных народов. Это означает, что использование таких технологий с последующим распространением в сети, может оставить без внимания, а скорее нарушить представление об исконных культурных чертах и личностях тех, кто давно является невидимым в медийном пространстве.

Третий и, возможно, наиболее тревожный вывод исследования касается сексуализации изображений женщин определенных национальностей, таких как латиноамериканки. Этот факт представляет серьезное нарушение этических норм и подчеркивает важность внимательного контроля и регулирования генерируемых изображений.

Однако, вместе с выявлением проблем, ставших результатом использования Stable Diffusion, исследователи призывают к осмотрительности в поиске решений. Просто улучшение данных не решит проблему, так как в интернете, на информации из которого ИИ и обучается, не имеется достаточных баз данных по малочисленным группам людей. В добавок ко всему, когда созданное ИИ изображение публикуется в сети, в будущем на нем скорее всего будет обучаться ИИ новой версии, что еще сильнее увеличит разрыв между широко- и слабо представленными группами людей.

Постскриптум

В основной части статьи было решено не упоминать моменты про отражение генератором изображений различных групп с альтернативной гендерной самоидентификацией, но в исследовании про это было.

В сущности, вся эта новомодная «открытость» и «этичность» породила очень большое количество различных, если можно так выразиться, «малочисленных категорий» населения, каждая из которых очень активно и очень громко просит представлять, а зачастую даже по-особенному выделять их в мире, особенно в медиа-среде. Это при том, что население нашей планеты и без этого всегда было многогранно и разнообразно. Поэтому встревоженность исследователей/разработчиков хоть для большинства из нас и комична, тем не менее имеет под собой вполне реальные основания. Ведь прецеденты жалоб на то как контент-мейкеры занимаются объективацией и еще невесть пойми чем, с последующими «отменами» (бойкотами) в медиа-среде случались и будут случаться.

Касательно трех основных проблем описанных в исследовании, мной был проведен небольшой самостоятельный эксперимент с тремя генерациями по каждому запросу, но уже на DALL·E 3. За каждую процедуру генерации, нейросеть выдаёт по 4 изображения, в сумме получается относительно неплохая выборка из 12 изображений.

Светлокожие мужчины

В исследовании указано, что при генерации случайного человека, подавляющее большинство результатов будут занимать светлокожие мужчины. Мной был выбран запрос «Generate a random person + photorealism».

Получается, скорее противоположный описанному исследователями результат. Принятие окончательного вывода оставляю за Вами.

Достоверное представление коренных народов

Мной был выбран запрос «people from Papua New Guinea»

Действительно, слабая медиа-освещенность племен, живущих вдали от цивилизации приводит к недостоверной визуализации таковых нейросетью. Правда сомневаюсь что кого-то из них это волнует.

Высокая вероятность выдачи NSFW-изображений при запросе генерации женщин определенной национальности

Мной были выбран запрос «A woman from Venezuela», а для сравнения - «A woman from United Kingdom».

Хоть какого-то намека на откровенность нейросеть не представила, и это радует.

Вывод

Несомненно на больших выборках из 1000 генераций, могут случаться ошибки нейросети и выдача несуразностей вместо адекватных результатов. Но надо понимать что несмотря на раскрученные средствами массовой информации «сверхспособности» и едва ли не «осознанность» искусственного интеллекта, он остается лишь программой, которая преобразует существующую информацию. Она неспособна к мышлению, моральным оценкам и чужда от социальных скандалов. Поэтому если Вы получили обидный, на ваш взгляд результат, не стоит на это обижаться, и уж тем более винить в этом разработчиков нейросети.

Ведь вы же не будете обвинять производителя чернил, если вдруг клякса оставленная на бумаге примет неприличную форму?

6 комментариев

310826304@vkontakte
Где же там недостоверность? В том же самом Папуа, где жарко и ходят далеко не в шубах и строгих костюмах, они ожидают что нейросеть не будет натренирована соответственно? Так что ответ в большинстве случаев прост, нет базы для тренировки но сильно хочется? Идите… фотографируйте, а мы потом может и добавим.
a
ИИ нарисовал Навального в тельняшке :D
A
Ну так пусть обучат свою расовогендерноправильную модельку с одноногими негролесботрансгендертрансфлюидами. SD то пох что за модель к ней подключена
I
Ну а на какой результат они рассчитывали если исходные данные такие? Чтобы сетка рисовала достоверно, по хорошему, надо самостоятельно создать базу фото для обучения по каждой теме и по ней обучать. Но ктож таким будет заниматься?
M
Исследователи исследовали Stable Diffusion, а у автора статьи DALL·E конечно результаты могут отличаться.
102976506796884933242@google
Об этом мной было указано. Я думаю вряд ли авторы врали, а проверить другую нейронку было интереснее. Плюс дифьюжн устаревшая и некачественная нейра на мой взгляд

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор зарядного устройства Movespeed на 120Вт с интересным разделением мощности на 90 и 30 Вт на четырех выходах

Зарядное устройство Movespeed 120Вт (AC120U4-EU) имеет четыре выхода, в которых может распределять максимальную мощность в соотношении 90 и 30 Вт, множество протоколов быстрого заряда и компактный...

Копирование и воcстановление Windows 10/11

Продолжаем знакомиться с методами резервного копирования Windows. Ранее мы с вами уже рассмотрели способ создания копии установленной Windows штатными средствами ОС. В этой же небольшой...

Как суперкомпьютеры помогают решать загадки галактик: уникальный проект CosmoRun показал, как галактики образовались и изменились с Большого взрыва

Галактики — это огромные скопления звезд, газа и пыли, которые вращаются вокруг своих центров. Они представляют собой одни из самых красивых и загадочных объектов во Вселенной. Но как...

Умные лампочки: что нужно знать перед покупкой такого устройства

Мир вокруг нас меняется ужасно быстро. Всего десять лет назад мы еще использовали обычные лампы накаливания, а сегодня нас окружают умные лампочки, способные менять цвет и яркость света,...

Вынос с амортизатором: спасение для гревела или несуразность с Aliexpress?

Несколько месяцев назад в продаже появился любопытный аксессуар от компании Meroca. Производитель хорошо известен любителям запчастей и аксессуаров с Aliexpress и иных маркетплейсов, ассортимент...

SIVGA SPT1: обзор спортивных беспроводных наушников с шикарной шумоизоляцией

В линейке беспроводных наушников компании SIVGA числятся три модели. Две из них — полностью открытые, не затрагивающие ушной канал. В данном же обзоре мы рассмотрим представителя...