Учёные создали ИИ, который воспринимает звук и картинку как человек

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи Ливерпульского университета разработали компьютерную модель, которая обрабатывает аудиовизуальные данные по принципу работы человеческого мозга. Технология основана на механизме распознавания движения, который впервые был обнаружен в нервной системе насекомых.

Доктор Чезаре Паризе из кафедры психологии Ливерпульского университета адаптировал биологический принцип для работы с реальными видео- и аудиоматериалами. Предыдущие вычислительные модели использовали абстрактные параметры и не могли определять синхронность звука и изображения при получении видеофайла на вход.

Разработка получила название мультисенсорный корреляционный детектор. Система представляет собой сетку детекторов, распределённых по визуальному и слуховому пространству. Такая архитектура позволяет обрабатывать сложные сигналы окружающей среды без предварительной подготовки данных.

Автор: freepik

Модель прошла валидацию на результатах 69 научных экспериментов, в которых участвовали люди, обезьяны и крысы. Система воспроизвела поведенческие реакции всех исследованных видов и показала результаты выше, чем существующая байесовская модель причинно-следственного анализа при одинаковом количестве настраиваемых параметров.

Технология также способна прогнозировать направление взгляда человека во время просмотра аудиовизуального контента, функционируя как упрощённая модель визуальной значимости. Система работает с необработанными данными любого формата и не требует обучения на размеченных датасетах, в отличие от современных нейросетевых решений.

Паризе отметил, что работа началась с исследований, проведённых совместно с Марком Эрнстом из Билефельдского университета в Германии. Учёные предложили принцип обнаружения корреляций как механизм объединения сенсорных сигналов в мозге. Новая модель развивает эту концепцию для практического применения в системах искусственного интеллекта.

Источник: Interestingeng Iineering

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Чтобы рисовать, как ребенок, надо повзрослеть, или прогулка по «Бумажному саду» Сергея Макарова

Примерно раз в месяц галереи Винзавода обновляют экспозиции, и до 24 мая Totibadze Gallery будет демонстрировать серию работ «Бумажный сад» современного художника Сергея Макарова.

Для чего в горлышке бутылки подсолнечного масла есть прорези

Если внимательно посмотреть внутрь бутылки с подсолнечным маслом, можно заметить странные пластиковые «лепестки» или прорези в горлышке. Многие воспринимают их как элемент дизайна или думают, что...

Откуда берутся звездопады: как Солнце разрушает астероиды и формирует новые метеорные потоки на пути Земли

Наблюдая за ночным небом, люди часто видят метеоры — яркие вспышки, возникающие при сгорании космических частиц в атмосфере Земли. Астрономия связывает происхождение большинства...

Почему на некоторых зарядных кабелях есть утолщение

Если посмотреть на кабели разных зарядных устройств, часто, почти у самого штекера, можно заметить небольшое утолщение. Многие воспринимают его как элемент дизайна или просто не обращают внимания....

Вулкан, который работает как насос: как Этна выкачивает магму с 80-километровой глубины

Вулкан Этна, расположенный на восточном побережье Сицилии, остается одним из самых сложных объектов для геологического моделирования. Будучи самым активным вулканом Европы, он демонстрирует...

Шондонг: как нашли целую экосистему в сводах самой большой пещеры мира

В научной фантастике любят придумывать подземные миры, но один такой имеется в реальности на нашей Земле. Ниже я расскажу, как существует экосистема в сводах самой большой пещеры мира, как так...