Может ли ИИ понять оптические иллюзии? Квантовая нейросеть делает первые шаги

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Наука и космос

Мир оптических иллюзий — это удивительная площадка, где человеческий мозг сталкивается с парадоксальными образами, ставящими под сомнение привычные представления о реальности. Как ни странно, именно эти «обманки» зрения могут стать ключом к пониманию того, как работает наше сознание и как воссоздать его принципы в искусственном интеллекте (ИИ).

Сегодняшние системы ИИ, основанные на машинном зрении и нейронных сетях, успешно справляются с распознаванием и классификацией объектов. Однако перед ними встает непреодолимый барьер, когда речь идет о восприятии оптических иллюзий, таких как куб Неккера или ваза Рубина. В то время как человек без труда переключается между двумя возможными интерпретациями этих фигур, алгоритмы ИИ «спотыкаются», не в силах воспроизвести столь гибкий процесс восприятия.

ИИ и оптические иллюзии, иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com
В чем же причина такой «слепоты» искусственного интеллекта?

Она кроется в фундаментальных различиях между искусственными и биологическими нейронами. Алгоритмы ИИ не учитывают психологические и нейрологические аспекты человеческого зрения. Более того, последние исследования указывают на то, что наше восприятие неоднозначных фигур может быть связано с квантовыми эффектами, такими как суперпозиция состояний.

a) Куб Неккера: При ответе на вопрос «Затененная грань куба находится спереди или сзади?» происходит случайное переключение между двумя стабильными перцептивными состояниями, соответствующими передней (|0⟩) и задней (|1⟩) граням куба. (b) Ваза Рубина: «Вы видите двух людей, смотрящих друг на друга (|0⟩), или вазу (|1⟩)?». (c) Согласно традиционной теории, переход от одного перцептивного состояния к другому является бинарным (пунктирная линия), т. е. от |0⟩ к |1⟩ и наоборот. Однако текущие исследования показывают, что человек может видеть суперпозицию состояний |0⟩ и |1⟩ (сплошная кривая).
Автор: Ivan S. Maksymov; APL Mach. Learn. 2, 036107 (2024); DOI: https://doi.org/10.1063/5.0225771 CC-BY 4.0 Источник: pubs.aip.org

Именно эти идеи легли в основу новой архитектуры глубокой нейронной сети (DNN), предложенной Иваном Максимовым из Института искусственного интеллекта и кибернетического будущего при Университете Чарльза Стерта. В своей работе, опубликованной в журнале APL Machine Learning, ученый предлагает использовать эффект квантового туннелирования (QT) в качестве активационной функции нейронов.

Что такое квантовое туннелирование и как оно может помочь ИИ «видеть» иллюзии?

QT — это квантово-механический феномен, при котором частица может «просачиваться» сквозь потенциальный барьер, даже если ее энергия недостаточна для его преодоления в рамках классической физики.

В QT-DNN эффект туннелирования используется для моделирования работы нейронов, что позволяет сети обрабатывать информацию не бинарно (0 или 1), а с учетом промежуточных, «суперпозиционных» состояний. Это делает работу сети более гибкой и приближенной к процессам, происходящим в человеческом мозге.

Результаты моделирования показали, что QT-DNN способна воспроизводить динамику восприятия оптических иллюзий, аналогичную той, что наблюдается у людей. Сеть не просто переключается между двумя возможными интерпретациями, но и демонстрирует периоды «неопределенности», когда вероятность восприятия каждого из состояний примерно одинакова.

Нейроморфный алгоритм, предполагающий обучение сети на различимых изображениях объектов и ее дальнейшую эксплуатацию, направленную на распознавание оптических иллюзий.
Автор: Ivan S. Maksymov; APL Mach. Learn. 2, 036107 (2024); DOI: https://doi.org/10.1063/5.0225771 CC-BY 4.0 Источник: pubs.aip.org

Более того, сравнительный анализ показал, что QT-DNN превосходит по точности модели, использующие традиционные активационные функции, такие как ReLU и сигмоида. Это подтверждает гипотезу о том, что квантовые эффекты могут играть важную роль в процессах человеческого восприятия.

Работа Максимова открывает новые горизонты в области искусственного интеллекта и когнитивных наук. QT-DNN может стать основой для создания более совершенных систем машинного зрения, способных не только распознавать объекты, но и интерпретировать сложные визуальные образы, учитывая при этом психологические и нейрологические особенности человеческого восприятия.

Возможно, именно квантовый подход поможет нам создать ИИ, способный не просто видеть, но и понимать мир так же, как это делаем мы.

Дальнейшие исследования в этом направлении могут привести к созданию по-настоящему «сознательных» машин, способных не только решать сложные задачи, но и взаимодействовать с человеком на более глубоком, интуитивном уровне. И оптические иллюзии, некогда считавшиеся «обманками» зрения, могут стать важным инструментом в познании тайн человеческого сознания и его воссоздания в искусственном интеллекте.

Сейчас на главной

Новости

Публикации

Десять лет назад вышел революционный смартфон Motorola Moto Z: краткая история линейки

В наше время модульные смартфоны стали игрушкой для энтузиастов, но ещё 10 лет назад компании считали, что за ними стоит будущее. Чего стоит один только Google Ara — концепт смартфона-конструктора...

300°C за 10 секунд от USB-C: Обзор паяльника Pinecil с прошивкой IronOS

Есть категория инструментов, которые за последние лет пятнадцать принципиально не менялись. Сетевой паяльник на 40 Вт с регулятором на диммере — он и в 2010-м был таким, и сейчас стоит...

Обзор проводных наушников Sivga SM100: металлические корпуса и приятный звук

Когда я смотрю на эти наушники, то меня не покидает чувство, что их дизайн слизан с клюшки для гольфа. Но к счастью звучат они гораздо лучше! И при этом стоят адекватных денег. Послушаем?

Обзор моющего пылесоса Dreame G12S Pro с сушкой горячим воздухом: пролезет туда, куда другие не смогут!

Каждый раз, глядя на то, как мой ребёнок оставляет после себя разлитую еду по всему полу (сейчас как раз тот возраст, когда он хочет быть самостоятельным), я всё чаще задумываюсь о моющем пылесосе...

Обзор корпуса MONTECH HERITAGE: богато не значит дорого

Что будет, если скрестить чемодан из прошлого века с современным компьютерным корпусом? Думаю, что именно этим вопросом и задались дизайнеры компании «Montech», после чего и появилась на свет такая...

В кризис без сокращений и профсоюзов: как выживала сталелитейная компания Nucor

Кризис является временем перемен как в бизнесе, так и во многих других отраслях. Многие сразу могут сказать, что в сложные времена на предприятиях единственным способом удержаться на плаву может...