Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Apple разработала ИИ-модель ILuvUI для анализа интерфейсов мобильных приложений

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

16 июля 2025, 15:00 | Новость | ИИ, сервисы и приложения

Исследовательская группа Apple в партнерстве с Университетом Аалто (Финляндия) разработала новую модель искусственного интеллекта ILuvUI, способную интерпретировать интерфейсы мобильных приложений на основе скриншотов и естественного языка. Модель представлена в научной работе «ILuvUI: Instruction-tuned LangUage-Vision моделирование пользовательских интерфейсов на основе машинного диалога».

Ключевая особенность разработки заключается в способности системы анализировать пользовательские интерфейсы как визуально, так и семантически, что отражает естественный способ взаимодействия людей с цифровыми продуктами. В отличие от большинства существующих моделей «зрение-язык» (VLM), которые обучаются преимущественно на естественных изображениях, ILuvUI специализируется именно на распознавании и понимании элементов интерфейса приложений.

Техническая реализация проекта основана на доработке модели с открытым исходным кодом LLaVA. Исследователи адаптировали методологию обучения для специализации в области UI и создали синтетический набор данных, включающий пары «текст-изображение». Обучающий датасет содержал взаимодействия в формате вопросов и ответов, детальные описания экранов, прогнозы результатов действий и многоэтапные сценарии использования приложений.

После завершения обучения ILuvUI продемонстрировала превосходство над базовой моделью LLaVA как в автоматизированных тестах, так и при оценке предпочтений реальными пользователями. Важным преимуществом системы является отсутствие необходимости указывать конкретную область интереса в интерфейсе — модель анализирует весь экран на основе простого текстового запроса.

Потенциальные применения технологии включают улучшение специальных возможностей для пользователей с ограниченными возможностями и автоматизированное тестирование пользовательских интерфейсов. Исследователи отмечают возможность дальнейшего совершенствования системы через использование более мощных кодировщиков изображений, улучшение обработки различных разрешений экрана и создание форматов вывода, совместимых с существующими фреймворками UI, такими как JSON.

Данная разработка дополняет недавнее исследование Apple о возможностях ИИ не только понимать, но и предсказывать последствия действий в приложениях, что открывает перспективы для создания более интеллектуальных систем взаимодействия с мобильными устройствами.

Источник: 9TO5Mac

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Samsung признала сбой камеры в Galaxy S26 Ultra и уже выпустила обновление для его устранения

Смартфоны и телефоны
1 минута назад
0

Revel представила серию Hi-Fi акустических систем Performa4 для стерео и домашнего кинотеатра

Аудио и звук
18 минут назад
0

В файлах Valve обнаружены новые данные о Steam Controller: раскрыты особенности подключения и процесс настройки

KTM представила обновлённый электромотоцикл Freeride E

Авто и транспорт
3 часа назад
0

В Перу построили самый узкий дом в мире шириной 63 сантиметра

Публикации

Черные дыры не исчезают бесследно: как кручение пространства спасает квантовую информацию

Статья
1 час назад
Наука и космос

Если вы сожжете энциклопедию, теоретически, отследив движение каждого атома пепла и каждого фотона излучения, вы сможете восстановить текст. Это один из главных принципов в квантовой механике,...

Плитвицкие озера: почему в их кристальных водах нельзя искупаться

Статья
Вчера в 20:03
Путешествия и туризм

К созданию озер в Хорватии природа подошла креативно. Ландшафт здесь играет так, что 16 озер располагаются своеобразной лесенкой, где прозрачная бирюзовая вода, как после фильтров в фотошопе,...

Британский Hi-Fi сэндвич с аэрокосмической начинкой: LEAK выпустила колонки Sandwich 100

Статья
Вчера в 19:28
Аудио и звук

Есть что-то почти провокационное в том, как LEAK называет свои колонки. Sandwich 100 — это не маркетинговый каприз, а прямая отсылка к инженерному решению 65-летней давности, которое в...

Налобный фонарик, который смог? Держит высокую яркость и пробивает вдаль. Обзор Wurkkos HD17

Обзор
Вчера в 14:40
Фонари

200м реальной дальнобойности, 2500люм яркости, удобное для ремонта быстросъёмное оголовное крепление, магнит в торце, исключительно яркий красный свет, ступенчатая и плавная настройка яркости с...

Обзор башенного кулера Ocypus Delta A62 BK ARGB: тише человеческого шёпота!

Обзор
Вчера в 13:52
Платформа ПК

Когда собираешь компьютер, всегда ищешь тот самый золотой баланс: чтобы и процессор не задыхался от жары, и кошелёк не опустел, и в ушах не свербело от гула вентиляторов. С виду обычная башня, а по...

Белорусские мотивы на заставке китайских часов: обзор Haylou Solar Lite 2

Обзор
Вчера в 13:45
Гаджеты

Классика или современные гаджеты? Вопрос простой, но ответ не такой очевидный. Обычные часы — это про внешний вид и привычку, умные — про удобство и повседневные функции. При...