Может ли ИИ понять оптические иллюзии? Квантовая нейросеть делает первые шаги

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Наука и космос

Мир оптических иллюзий — это удивительная площадка, где человеческий мозг сталкивается с парадоксальными образами, ставящими под сомнение привычные представления о реальности. Как ни странно, именно эти «обманки» зрения могут стать ключом к пониманию того, как работает наше сознание и как воссоздать его принципы в искусственном интеллекте (ИИ).

Сегодняшние системы ИИ, основанные на машинном зрении и нейронных сетях, успешно справляются с распознаванием и классификацией объектов. Однако перед ними встает непреодолимый барьер, когда речь идет о восприятии оптических иллюзий, таких как куб Неккера или ваза Рубина. В то время как человек без труда переключается между двумя возможными интерпретациями этих фигур, алгоритмы ИИ «спотыкаются», не в силах воспроизвести столь гибкий процесс восприятия.

ИИ и оптические иллюзии, иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com
В чем же причина такой «слепоты» искусственного интеллекта?

Она кроется в фундаментальных различиях между искусственными и биологическими нейронами. Алгоритмы ИИ не учитывают психологические и нейрологические аспекты человеческого зрения. Более того, последние исследования указывают на то, что наше восприятие неоднозначных фигур может быть связано с квантовыми эффектами, такими как суперпозиция состояний.

a) Куб Неккера: При ответе на вопрос «Затененная грань куба находится спереди или сзади?» происходит случайное переключение между двумя стабильными перцептивными состояниями, соответствующими передней (|0⟩) и задней (|1⟩) граням куба. (b) Ваза Рубина: «Вы видите двух людей, смотрящих друг на друга (|0⟩), или вазу (|1⟩)?». (c) Согласно традиционной теории, переход от одного перцептивного состояния к другому является бинарным (пунктирная линия), т. е. от |0⟩ к |1⟩ и наоборот. Однако текущие исследования показывают, что человек может видеть суперпозицию состояний |0⟩ и |1⟩ (сплошная кривая).
Автор: Ivan S. Maksymov; APL Mach. Learn. 2, 036107 (2024); DOI: https://doi.org/10.1063/5.0225771 CC-BY 4.0 Источник: pubs.aip.org

Именно эти идеи легли в основу новой архитектуры глубокой нейронной сети (DNN), предложенной Иваном Максимовым из Института искусственного интеллекта и кибернетического будущего при Университете Чарльза Стерта. В своей работе, опубликованной в журнале APL Machine Learning, ученый предлагает использовать эффект квантового туннелирования (QT) в качестве активационной функции нейронов.

Что такое квантовое туннелирование и как оно может помочь ИИ «видеть» иллюзии?

QT — это квантово-механический феномен, при котором частица может «просачиваться» сквозь потенциальный барьер, даже если ее энергия недостаточна для его преодоления в рамках классической физики.

В QT-DNN эффект туннелирования используется для моделирования работы нейронов, что позволяет сети обрабатывать информацию не бинарно (0 или 1), а с учетом промежуточных, «суперпозиционных» состояний. Это делает работу сети более гибкой и приближенной к процессам, происходящим в человеческом мозге.

Результаты моделирования показали, что QT-DNN способна воспроизводить динамику восприятия оптических иллюзий, аналогичную той, что наблюдается у людей. Сеть не просто переключается между двумя возможными интерпретациями, но и демонстрирует периоды «неопределенности», когда вероятность восприятия каждого из состояний примерно одинакова.

Нейроморфный алгоритм, предполагающий обучение сети на различимых изображениях объектов и ее дальнейшую эксплуатацию, направленную на распознавание оптических иллюзий.
Автор: Ivan S. Maksymov; APL Mach. Learn. 2, 036107 (2024); DOI: https://doi.org/10.1063/5.0225771 CC-BY 4.0 Источник: pubs.aip.org

Более того, сравнительный анализ показал, что QT-DNN превосходит по точности модели, использующие традиционные активационные функции, такие как ReLU и сигмоида. Это подтверждает гипотезу о том, что квантовые эффекты могут играть важную роль в процессах человеческого восприятия.

Работа Максимова открывает новые горизонты в области искусственного интеллекта и когнитивных наук. QT-DNN может стать основой для создания более совершенных систем машинного зрения, способных не только распознавать объекты, но и интерпретировать сложные визуальные образы, учитывая при этом психологические и нейрологические особенности человеческого восприятия.

Возможно, именно квантовый подход поможет нам создать ИИ, способный не просто видеть, но и понимать мир так же, как это делаем мы.

Дальнейшие исследования в этом направлении могут привести к созданию по-настоящему «сознательных» машин, способных не только решать сложные задачи, но и взаимодействовать с человеком на более глубоком, интуитивном уровне. И оптические иллюзии, некогда считавшиеся «обманками» зрения, могут стать важным инструментом в познании тайн человеческого сознания и его воссоздания в искусственном интеллекте.

Сейчас на главной

Новости

Публикации

Нейтронные звёзды перед столкновением деформируются не так, как считалось: физики обнаружили три релятивистских механизма, которых не было в моделях

Нейтронная звезда — один из самых плотных объектов во Вселенной. При диаметре около двадцати километров её масса составляет порядка полутора солнечных. Вещество внутри сжато до...

Недостроенный детектор на дне моря поймал нейтрино, которое не смог поймать IceCube. Новая физика или случайность?

В феврале 2023 года детектор ARCA — часть строящегося на дне Средиземного моря нейтринного телескопа KM3NeT — зарегистрировал частицу экстремальной энергии. Мюон прошил...

Обзор увлажнителя воздуха РЕДМОНД HF2213S: Создай свой климат со смартфона

Увлажнение воздуха в доме особенно важно в отопительный сезон, когда окна обычно закрыты, а горячие батареи сильно сушат воздух. Увлажнитель помогает поддерживать оптимальную влажность без лишних...

Почему кухонная вытяжка начинает шуметь сильнее обычного, и как решить эту проблему

Кухонная вытяжка — один из тех бытовых приборов, к которому быстро привыкают. Пока она работает тихо и незаметно, на неё редко обращают внимание. Но если однажды привычный звук...