Apple представила модель SHARP для создания 3D-сцен и инструменты для оценки нейросетей
В декабре 2025 года компания Apple опубликовала результаты трёх исследовательских проектов в области искусственного интеллекта, связанных с обработкой изображений и анализом языковых моделей.
Центральным элементом публикаций стала модель SHARP, предназначенная для синтеза трёхмерных сцен из одного двумерного изображения. Процесс преобразования занимает менее одной секунды. Модель использует технологию гауссова сплэттинга, при которой объёмные объекты формируются из миллионов эллипсоидов вместо традиционных полигональных сеток. Для работы SHARP достаточно одного снимка, тогда как классические методы 3D-реконструкции требуют серии фотографий объекта с разных ракурсов. Исходный код модели размещён в открытом доступе на платформе GitHub.
Параллельно с этим исследователи из Apple разработали фреймворк GIE-Bench для тестирования нейросетей, выполняющих редактирование изображений по текстовым командам. Инструмент проверяет два параметра: корректность выполнения запрошенных изменений и сохранность областей изображения, которые не должны были подвергаться редактированию. В ходе тестирования были проверены модели MGIE, OmniGen и GPT-Image-1 на тысячах примеров в двадцати категориях контента.
Третий проект получил название IMPACT. Фреймворк создан для оценки способности языковых моделей обрабатывать морфологически сложные языки: арабский, русский, финский, турецкий и иврит. Тестирование восьми многоязычных моделей выявило систематические затруднения при работе с нестандартными грамматическими конструкциями в указанных языках.
Источник: CNMO





0 комментариев
Добавить комментарий
Добавить комментарий