Apple разработала ИИ-модель ILuvUI для анализа интерфейсов мобильных приложений

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследовательская группа Apple в партнерстве с Университетом Аалто (Финляндия) разработала новую модель искусственного интеллекта ILuvUI, способную интерпретировать интерфейсы мобильных приложений на основе скриншотов и естественного языка. Модель представлена в научной работе «ILuvUI: Instruction-tuned LangUage-Vision моделирование пользовательских интерфейсов на основе машинного диалога».

Ключевая особенность разработки заключается в способности системы анализировать пользовательские интерфейсы как визуально, так и семантически, что отражает естественный способ взаимодействия людей с цифровыми продуктами. В отличие от большинства существующих моделей «зрение-язык» (VLM), которые обучаются преимущественно на естественных изображениях, ILuvUI специализируется именно на распознавании и понимании элементов интерфейса приложений.

Автор: Freepik Источник: ru.freepik.com

Техническая реализация проекта основана на доработке модели с открытым исходным кодом LLaVA. Исследователи адаптировали методологию обучения для специализации в области UI и создали синтетический набор данных, включающий пары «текст-изображение». Обучающий датасет содержал взаимодействия в формате вопросов и ответов, детальные описания экранов, прогнозы результатов действий и многоэтапные сценарии использования приложений.

После завершения обучения ILuvUI продемонстрировала превосходство над базовой моделью LLaVA как в автоматизированных тестах, так и при оценке предпочтений реальными пользователями. Важным преимуществом системы является отсутствие необходимости указывать конкретную область интереса в интерфейсе — модель анализирует весь экран на основе простого текстового запроса.

Потенциальные применения технологии включают улучшение специальных возможностей для пользователей с ограниченными возможностями и автоматизированное тестирование пользовательских интерфейсов. Исследователи отмечают возможность дальнейшего совершенствования системы через использование более мощных кодировщиков изображений, улучшение обработки различных разрешений экрана и создание форматов вывода, совместимых с существующими фреймворками UI, такими как JSON.

Данная разработка дополняет недавнее исследование Apple о возможностях ИИ не только понимать, но и предсказывать последствия действий в приложениях, что открывает перспективы для создания более интеллектуальных систем взаимодействия с мобильными устройствами.

Источник: 9TO5Mac

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор внешнего бокса RELETECH WAVE II с информационным дисплеем. Тест с Samsung 990 Pro

Рынок внешних боксов для M.2 SSD переживает настоящий бум — производители наперебой предлагают решения с разными интерфейсами и дизайном. RELETECH выделяется на этом фоне своим подходом...

Обзор эндоскопа iCartool IC-V104AW – управляемая камера Ø4 мм и работа через смартфон

Иногда проще один раз заглянуть внутрь, чем разбирать устройство наугад. Для этого как раз и используют эндоскопы, но не все они одинаково удобны в работе. В этой статье речь пойдет о модели с...

Наушники с роботом на упаковке: обзор проводных TINHIFI C2 Mech Warrior с диафрагмой из композитного материала

Впечатления о наушниках C2 Mech Warrior от TINHIFI, которые примечательны полностью алюминиевым фрезерованным корпусом, диафрагмой из композитного материала, а также роботом-мехом на упаковке....

Яркий налобник с Карлсоном: обзор фонаря Sofirn HS45

Для ярких светодиодных фонарей поддержание высокого уровня светового потока возможно либо с ограничением по времени («турбопых»), либо со снижением тока для защиты от перегрева. Но есть хитрость,...

Можно ли заметить инопланетный лес, если сама планета размером с пиксель: как растения на экзопланетах выдадут свое присутствие телескопам

Анализ характеристик экзопланет, расположенных в десятках световых лет от Земли, это одна из самых сложных задач современной астрофизики. Даже телескопы следующего поколения, такие как...

Древняя катастрофа Стурегга: что произошло 8 тысяч лет назад и как это повлияло на людей

Иногда самые грандиозные события в истории Земли происходят задолго до появления городов, империй и хроник. Никто не записал их на камне, никто не увидел их из окна крепости, никто не превратил в...