В Китае собрали 200 тысяч 3D-сканов лиц для обучения роботов мимике

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Исследователи из Шэньчжэньского института передовых технологий Китайской академии наук и Фуцзяньского технологического университета разработали крупномасштабную базу трёхмерных данных о лицах человека и новую модель искусственного интеллекта для распознавания лицевых ориентиров. Работу провели профессор Сунь Чжань и доктор Е Юпин.


База данных содержит около 200 тысяч высокоточных 3D-сканов лиц. В неё также вошли наборы изображений с различными выражениями лица, стандартизированные 3D-ориентиры, сканы человеческого тела и динамические 4D-записи мимики. В 2025 году набор данных был включён в программу провинции Фуцзянь по созданию высококачественных наборов данных для искусственного интеллекта.

Автор: Getty Images Источник: interestingengineering.com

Для обработки собранных данных команда разработала модель CF-GAT — сеть графового внимания с учётом кривизны поверхности. Модель работает непосредственно с облаками точек — наборами пространственных координат, описывающих геометрию лица без текстурирования поверхности. Система не использует 2D-изображения или заранее заданные шаблонные модели, что отличает её от большинства существующих решений.

Геометрическая стратегия выборки упрощает облако точек, сохраняя данные о кривизне. Эти данные встраиваются в механизм внимания модели, позволяя сети одновременно анализировать локальные изменения формы и глобальные взаимосвязи между чертами лица. В ходе тестирования CF-GAT показала более высокую точность локализации мелких ориентиров и устойчивость к шумам по сравнению с традиционными подходами.

Разработка предназначена для применения в человекоподобных роботах, биометрических системах и виртуальных аватарах.

Читайте также

Новости

Публикации