Может ли ИИ понять оптические иллюзии? Квантовая нейросеть делает первые шаги

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Мир оптических иллюзий — это удивительная площадка, где человеческий мозг сталкивается с парадоксальными образами, ставящими под сомнение привычные представления о реальности. Как ни странно, именно эти «обманки» зрения могут стать ключом к пониманию того, как работает наше сознание и как воссоздать его принципы в искусственном интеллекте (ИИ).


Сегодняшние системы ИИ, основанные на машинном зрении и нейронных сетях, успешно справляются с распознаванием и классификацией объектов. Однако перед ними встает непреодолимый барьер, когда речь идет о восприятии оптических иллюзий, таких как куб Неккера или ваза Рубина. В то время как человек без труда переключается между двумя возможными интерпретациями этих фигур, алгоритмы ИИ «спотыкаются», не в силах воспроизвести столь гибкий процесс восприятия.

ИИ и оптические иллюзии, иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com
В чем же причина такой «слепоты» искусственного интеллекта?

Она кроется в фундаментальных различиях между искусственными и биологическими нейронами. Алгоритмы ИИ не учитывают психологические и нейрологические аспекты человеческого зрения. Более того, последние исследования указывают на то, что наше восприятие неоднозначных фигур может быть связано с квантовыми эффектами, такими как суперпозиция состояний.

a) Куб Неккера: При ответе на вопрос «Затененная грань куба находится спереди или сзади?» происходит случайное переключение между двумя стабильными перцептивными состояниями, соответствующими передней (|0⟩) и задней (|1⟩) граням куба. (b) Ваза Рубина: «Вы видите двух людей, смотрящих друг на друга (|0⟩), или вазу (|1⟩)?». (c) Согласно традиционной теории, переход от одного перцептивного состояния к другому является бинарным (пунктирная линия), т. е. от |0⟩ к |1⟩ и наоборот. Однако текущие исследования показывают, что человек может видеть суперпозицию состояний |0⟩ и |1⟩ (сплошная кривая).
Автор: Ivan S. Maksymov; APL Mach. Learn. 2, 036107 (2024); DOI: https://doi.org/10.1063/5.0225771 CC-BY 4.0 Источник: pubs.aip.org

Именно эти идеи легли в основу новой архитектуры глубокой нейронной сети (DNN), предложенной Иваном Максимовым из Института искусственного интеллекта и кибернетического будущего при Университете Чарльза Стерта. В своей работе, опубликованной в журнале APL Machine Learning, ученый предлагает использовать эффект квантового туннелирования (QT) в качестве активационной функции нейронов.

Что такое квантовое туннелирование и как оно может помочь ИИ «видеть» иллюзии?

QT — это квантово-механический феномен, при котором частица может «просачиваться» сквозь потенциальный барьер, даже если ее энергия недостаточна для его преодоления в рамках классической физики.

В QT-DNN эффект туннелирования используется для моделирования работы нейронов, что позволяет сети обрабатывать информацию не бинарно (0 или 1), а с учетом промежуточных, «суперпозиционных» состояний. Это делает работу сети более гибкой и приближенной к процессам, происходящим в человеческом мозге.

Результаты моделирования показали, что QT-DNN способна воспроизводить динамику восприятия оптических иллюзий, аналогичную той, что наблюдается у людей. Сеть не просто переключается между двумя возможными интерпретациями, но и демонстрирует периоды «неопределенности», когда вероятность восприятия каждого из состояний примерно одинакова.


Нейроморфный алгоритм, предполагающий обучение сети на различимых изображениях объектов и ее дальнейшую эксплуатацию, направленную на распознавание оптических иллюзий.
Автор: Ivan S. Maksymov; APL Mach. Learn. 2, 036107 (2024); DOI: https://doi.org/10.1063/5.0225771 CC-BY 4.0 Источник: pubs.aip.org

Более того, сравнительный анализ показал, что QT-DNN превосходит по точности модели, использующие традиционные активационные функции, такие как ReLU и сигмоида. Это подтверждает гипотезу о том, что квантовые эффекты могут играть важную роль в процессах человеческого восприятия.

Работа Максимова открывает новые горизонты в области искусственного интеллекта и когнитивных наук. QT-DNN может стать основой для создания более совершенных систем машинного зрения, способных не только распознавать объекты, но и интерпретировать сложные визуальные образы, учитывая при этом психологические и нейрологические особенности человеческого восприятия.

Возможно, именно квантовый подход поможет нам создать ИИ, способный не просто видеть, но и понимать мир так же, как это делаем мы.

Дальнейшие исследования в этом направлении могут привести к созданию по-настоящему «сознательных» машин, способных не только решать сложные задачи, но и взаимодействовать с человеком на более глубоком, интуитивном уровне. И оптические иллюзии, некогда считавшиеся «обманками» зрения, могут стать важным инструментом в познании тайн человеческого сознания и его воссоздания в искусственном интеллекте.

Читайте также

Новости

Публикации