Ограничения в работе ИИ назвали источником его творческих способностей

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Ученые Мейсон Камб и Сурья Гангули из Стенфорда, США сообщили о результатах работы по изучению появления новых образов в генераторах изображений. По их данным, творческий эффект возникает из-за базовых свойств алгоритмов, а не из-за скрытого творческого навыка.

Автор: freepik Источник: ru.freepik.com

Современные генераторы, включая DALL·E, Imagen и Stable Diffusion, используют пошаговое очищение от шума. Алгоритм сначала превращает картинку в случайный набор пикселей, а затем поэтапно восстанавливает форму и детали. Долгое время считалось, что такой процесс ведет к копированию примеров из обучающей выборки. Исследование указывает на другое объяснение: новизна вытекает из двух простых механизмов.

Первый механизм — обработка по небольшим блокам. Система работает не со всем изображением сразу, а с его маленькими частями. Второй — свойство смещения: если изначально сдвинуть изображение на несколько пикселей, то и результат сдвигается так же. В сочетании эти принципы не дают модели увидеть весь кадр целиком. Поэтому алгоритм достраивает недостающие связи между фрагментами. Отсюда и типичные промахи ранних версий, например, лишние пальцы на руках.

Автор: rawpixel.com Источник: ru.freepik.com

Чтобы проверить гипотезу, авторы собрали упрощенную математическую схему под названием ELS. В ней оставили только обработку по частям и эффект смещения. Даже такая модель воспроизвела поведение сложных систем примерно на 90%. По словам Камба, когда алгоритм вынужденно работает кусками, новые комбинации деталей появляются сами собой как следствие динамики процесса. Эксперты отмечают, что человек тоже собирает новое из знакомых кирпичиков опыта, поэтому сходство подходов возможно.

Автор: freepik Источник: ru.freepik.com

Результаты важны для практики. Они помогают понять, почему генераторы создают оригинальные сцены и где возникают типовые ошибки. Это может повлиять на проектирование будущих моделей и на дискуссию о природе человеческого и машинного творчества.

Источник: Hi-Tech Mail

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор электрической мясорубки FELFRI FF-MG-10

Для приготовления большинства мясных блюд, а также множества других рецептов, практически невозможно обойтись без мясорубки. Этот кухонный прибор значительно упрощает процесс переработки продуктов...

Какими были смартфоны 20 лет назад: обзор ASUS P525 на базе Windows Mobile 5

Двадцать лет назад рынок смартфонов условно делился на несколько категорий. В первую входили собственно смартфоны — по сути, те же мобильные телефоны, только с расширенной функциональностью за счёт...

Новости по банковской карте Egypt Post Visa Easy Pay

Банковскую карту Visa Easy Pay почты Египта по-прежнему может получить иностранец с обычной туристической визой и это фактически единственная карта, которую относительно просто может получить...

Самый одинокий дом в мире: кто и для чего его построил на острове Эллидаэй в Исландии

Остров Эллидаэй в Исландии — это небольшой необитаемый клочок суши в архипелаге Вестманнаэйяр, расположенном у южного побережья страны. Площадью всего около 0,45 км², он является одним...

Обзор TWS наушников Haylou Flowbuds N55 – что дают ANC и LDAC в бюджетном сегменте

Haylou Flowbuds N55 — это модель с упором на функции: адаптивное шумоподавление, поддержка LDAC и заявленная длительная работа от аккумулятора. Набор для своего сегмента привычный, но...

Обзор УШМ Интерскол УШМВ-125/1300Э: с бесщеточным двигателем 1,3 кВт и электронной поддержкой оборотов

В январе этого года купил себе бесщеточную сетевую УШМВ-125/1200Э от Интерскол. Плавный запуск, электронная регулировка мощности и удобство в работе оценил не только я, но и соседи по гаражному...