Ученые привлекли ИИ для интерпретации значения лая

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Оффтопик

Исследовательская группа из Мичиганского университета использовала искусственный интеллект (ИИ), чтобы лучше понять, о чём говорит лай собаки, чувствует ли она себя игривой или злой.

Они также пытаются выяснить, может ли ИИ правильно определить возраст, пол и породу собаки на основе того, что она «говорит».

Автор: getty images Источник: ichef.bbci.co.uk

Ученым удалось добиться прогресса в расшифровке общения собак, перепрофилировав уже существующие алгоритмы ИИ, которые обучены распознаванию человеческой речи.

Достижения в области искусственного интеллекта могут поднять на новый уровень понимание человеком того, как общаются животные. Исследование позволило выяснить, как можно использовать то, что уже создано в области обработки речи, чтобы начать понимать нюансы собачьего лая.

ИИ позволил добиться больших успехов в понимании тонкостей речи.

Системы на базе искусственного интеллекта используются для распознавания нюансов тона, высоты тона и акцента, что, в свою очередь, позволяет использовать такие технологии, как программное обеспечение для распознавания голоса.

Обучаясь на огромном количестве реальных человеческих голосов технологии ИИ достигли высокого уровня. Однако сопоставимой базы данных по собакам не существует.

«Вокальные звуки животных гораздо сложнее получить и записать», — отметил Артем Абзалиев, ведущий автор исследования.

Его команда намеревалась выяснить, смогут ли ученые обойти недостаток данных, используя исследования, проведенные на людях.

Учёные собрали образцы лая, рычания и хныканья 74 собак разных пород, возраста и пола в самых разных контекстах.

Они ввели их в модель алгоритма машинного обучения, который идентифицирует закономерности в больших наборах данных. Алгоритм был разработан для анализа человеческой речи.

В результате удалось обнаружить, что алгоритм также хорошо помогает прислушиваться к общению собак.

В среднем, точность исследовательской модели в различных тестах составила 70%.

Это был первый случай, когда оптимизированные для понимания человеческой речи алгоритмы, были использованы для расшифровки общения животных.

Исследования показали, что обученный пониманию человеческой речи машинный алгоритм, может помочь в анализе и понимании других акустических моделей, результаты подобных исследований могут иметь «важные последствия» для благополучия животных.

Учёные предполагают, что лучшее понимание нюансов различных звуков, издаваемых животными, может улучшить то, как люди интерпретируют и реагируют на их эмоциональные и физические потребности.

Источник: www.bbc.com

Изображение в превью:
Автор: designer.microsoft.com/image-creator
Источник: designer.microsoft.com/image-creator

Сейчас на главной

Новости

Публикации

Как собрать недорогой компьютер в феврале 2026 года

Сборка компьютера в феврале 2026 года остаётся доступной даже при ограниченном бюджете. Рынок предлагает широкий выбор процессоров, видеокарт, материнских плат и накопителей, что позволяет собрать...

Цаганское землетрясение 1862 года: как оно вызвало единственное историческое цунами на Байкале и затопило 230 км² суши

Озеро Байкал — самое глубокое и чистое пресноводное озеро планеты. Но мало кто знает, что это ещё и один из наиболее сейсмоактивных регионов России. Байкальская рифтовая зона регулярно...

Заднемоторный люкс: как Tatra 613 стала последней легковой легендой Чехословакии

С чем у вас ассоциируется автомобильная марка Tatra? Для людей, хотя бы немного пожившим в Советском Союзе, этот бренд в первую очередь является синонимом тяжелых грузовиков. Эти машины с...

Цена полёта: почему эволюция заставила динозавров полностью переизобрести рот

Переход от наземного образа жизни к полету считается одним из самых сложных этапов в истории эволюции позвоночных. Дело не только в изменении строения конечностей, но и в резком возрастании...

Программируемая клавиатура MKESPN SXS-K811 на 19 клавиш: обзор удобного макропада с механическими свитчами и подсветкой

Представьте себе персональный пульт управления для всего, что происходит на вашем компьютере. Именно этим и является программируемая клавиатура MKESPN SXS-K811 (другими словами —...

Kiwi Ears Serene: обзор полноразмерных наушников с планарно-магнитным излучателем

Kiwi Ears Serene — это полноразмерные проводные наушники с планарными излучателями и закрытой конструкцией, выпущенные в сотрудничестве с аудиообозревателем Z-Reviews....