Ограничения в работе ИИ назвали источником его творческих способностей

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Ученые Мейсон Камб и Сурья Гангули из Стенфорда, США сообщили о результатах работы по изучению появления новых образов в генераторах изображений. По их данным, творческий эффект возникает из-за базовых свойств алгоритмов, а не из-за скрытого творческого навыка.

Автор: freepik Источник: ru.freepik.com

Современные генераторы, включая DALL·E, Imagen и Stable Diffusion, используют пошаговое очищение от шума. Алгоритм сначала превращает картинку в случайный набор пикселей, а затем поэтапно восстанавливает форму и детали. Долгое время считалось, что такой процесс ведет к копированию примеров из обучающей выборки. Исследование указывает на другое объяснение: новизна вытекает из двух простых механизмов.

Первый механизм — обработка по небольшим блокам. Система работает не со всем изображением сразу, а с его маленькими частями. Второй — свойство смещения: если изначально сдвинуть изображение на несколько пикселей, то и результат сдвигается так же. В сочетании эти принципы не дают модели увидеть весь кадр целиком. Поэтому алгоритм достраивает недостающие связи между фрагментами. Отсюда и типичные промахи ранних версий, например, лишние пальцы на руках.

Автор: rawpixel.com Источник: ru.freepik.com

Чтобы проверить гипотезу, авторы собрали упрощенную математическую схему под названием ELS. В ней оставили только обработку по частям и эффект смещения. Даже такая модель воспроизвела поведение сложных систем примерно на 90%. По словам Камба, когда алгоритм вынужденно работает кусками, новые комбинации деталей появляются сами собой как следствие динамики процесса. Эксперты отмечают, что человек тоже собирает новое из знакомых кирпичиков опыта, поэтому сходство подходов возможно.

Автор: freepik Источник: ru.freepik.com

Результаты важны для практики. Они помогают понять, почему генераторы создают оригинальные сцены и где возникают типовые ошибки. Это может повлиять на проектирование будущих моделей и на дискуссию о природе человеческого и машинного творчества.

Источник: Hi-Tech Mail

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Победа «лопаты»: как Galaxy Note заставил Apple переделать iPhone, а Samsung научила мир любить большие телефоны

Если бы вы оказались в начале 2010-х и спросили любого техногика, каким должен быть идеальный смартфон, ответ был бы почти единогласным. Правила игры казались высеченными в граните, а...

Обзор моющего пылесоса для мебели Felfri FWVC-002 с 5 насадками и 3 баками для жидкости

Моющий пылесос для мебели Felfri FWVC-002. Мощность 600Вт, а сила всасывания 18кПа. Есть 5 насадок в комплекте. Есть 3 резервуара для жидкости. Есть возможность сухой и влажной уборки

И для металла, и для поп-музыки. Гибридные наушники, которые смогли. Обзор TRN Shell

Похоже что мои поиски наушников с хорошим звуком завершились. 4 драйвера для высоких, средних и низких частот и отзывы, что звук как у гораздо более дорогих модели. Путь к этим гибридным TRN Shell...

Анатомия фастфуда: почему куриные стрипсы стоят вдвое дороже наггетсов

Представьте эту до боли знакомую сцену. Вы стоите у светящегося меню в ресторане быстрого питания или задумчиво разглядываете морозильный ларь в супермаркете. Перед вами два, казалось бы,...

Эта рыба умеет ходить по суше: 5 видов, которые выглядят как баг в реальности

Принято считать, что жизнь рыб строго ограничена водной средой. Однако эволюция сформировала виды, способные не только выживать на открытом воздухе, но и целенаправленно передвигаться по суше. Они...