В Китае собрали 200 тысяч 3D-сканов лиц для обучения роботов мимике
Исследователи из Шэньчжэньского института передовых технологий Китайской академии наук и Фуцзяньского технологического университета разработали крупномасштабную базу трёхмерных данных о лицах человека и новую модель искусственного интеллекта для распознавания лицевых ориентиров. Работу провели профессор Сунь Чжань и доктор Е Юпин.
База данных содержит около 200 тысяч высокоточных 3D-сканов лиц. В неё также вошли наборы изображений с различными выражениями лица, стандартизированные 3D-ориентиры, сканы человеческого тела и динамические 4D-записи мимики. В 2025 году набор данных был включён в программу провинции Фуцзянь по созданию высококачественных наборов данных для искусственного интеллекта.
Для обработки собранных данных команда разработала модель CF-GAT — сеть графового внимания с учётом кривизны поверхности. Модель работает непосредственно с облаками точек — наборами пространственных координат, описывающих геометрию лица без текстурирования поверхности. Система не использует 2D-изображения или заранее заданные шаблонные модели, что отличает её от большинства существующих решений.
Геометрическая стратегия выборки упрощает облако точек, сохраняя данные о кривизне. Эти данные встраиваются в механизм внимания модели, позволяя сети одновременно анализировать локальные изменения формы и глобальные взаимосвязи между чертами лица. В ходе тестирования CF-GAT показала более высокую точность локализации мелких ориентиров и устойчивость к шумам по сравнению с традиционными подходами.
Разработка предназначена для применения в человекоподобных роботах, биометрических системах и виртуальных аватарах.
Источник: Interesting Engineering





0 комментариев
Добавить комментарий