Учёные создали ИИ, который воспринимает звук и картинку как человек

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи Ливерпульского университета разработали компьютерную модель, которая обрабатывает аудиовизуальные данные по принципу работы человеческого мозга. Технология основана на механизме распознавания движения, который впервые был обнаружен в нервной системе насекомых.

Доктор Чезаре Паризе из кафедры психологии Ливерпульского университета адаптировал биологический принцип для работы с реальными видео- и аудиоматериалами. Предыдущие вычислительные модели использовали абстрактные параметры и не могли определять синхронность звука и изображения при получении видеофайла на вход.

Разработка получила название мультисенсорный корреляционный детектор. Система представляет собой сетку детекторов, распределённых по визуальному и слуховому пространству. Такая архитектура позволяет обрабатывать сложные сигналы окружающей среды без предварительной подготовки данных.

Автор: freepik

Модель прошла валидацию на результатах 69 научных экспериментов, в которых участвовали люди, обезьяны и крысы. Система воспроизвела поведенческие реакции всех исследованных видов и показала результаты выше, чем существующая байесовская модель причинно-следственного анализа при одинаковом количестве настраиваемых параметров.

Технология также способна прогнозировать направление взгляда человека во время просмотра аудиовизуального контента, функционируя как упрощённая модель визуальной значимости. Система работает с необработанными данными любого формата и не требует обучения на размеченных датасетах, в отличие от современных нейросетевых решений.

Паризе отметил, что работа началась с исследований, проведённых совместно с Марком Эрнстом из Билефельдского университета в Германии. Учёные предложили принцип обнаружения корреляций как механизм объединения сенсорных сигналов в мозге. Новая модель развивает эту концепцию для практического применения в системах искусственного интеллекта.

Источник: Interestingeng Iineering

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Новости по банковской карте Egypt Post Visa Easy Pay

Банковскую карту Visa Easy Pay почты Египта по-прежнему может получить иностранец с обычной туристической визой и это фактически единственная карта, которую относительно просто может получить...

Самый одинокий дом в мире: кто и для чего его построил на острове Эллидаэй в Исландии

Остров Эллидаэй в Исландии — это небольшой необитаемый клочок суши в архипелаге Вестманнаэйяр, расположенном у южного побережья страны. Площадью всего около 0,45 км², он является одним...

Обзор TWS наушников Haylou Flowbuds N55 – что дают ANC и LDAC в бюджетном сегменте

Haylou Flowbuds N55 — это модель с упором на функции: адаптивное шумоподавление, поддержка LDAC и заявленная длительная работа от аккумулятора. Набор для своего сегмента привычный, но...

Обзор УШМ Интерскол УШМВ-125/1300Э: с бесщеточным двигателем 1,3 кВт и электронной поддержкой оборотов

В январе этого года купил себе бесщеточную сетевую УШМВ-125/1200Э от Интерскол. Плавный запуск, электронная регулировка мощности и удобство в работе оценил не только я, но и соседи по гаражному...

Робот пылесос с непрерывной подачей воды и самоочисткой в реальном времени: обзор новой модели Qrevo Curv 2 Flow от Roborock

Продуманный робот Qrevo Curv 2 Flow от бренда Roborock, предназначенный для влажной/совмещенной уборки дома, дополнительно оснащенный лазерным лидаром и AI-камерой. Такой вариант и полы помоет, и...

Обзор кресла Zone51 X-Prime Optimus – удобно ли сидеть целый день

Zone 51 X-Prime Optimus — кресло с сетчатой конструкцией и набором регулировок, которое сразу задает свою логику посадки. Здесь нет привычной мягкости и простых механизмов, зато есть...