Apple показывает внутреннее устройство своих ИИ-моделей в официальном отчете

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Apple выпустила технический отчет «Языковые модели Apple Intelligence Foundation — технический отчет за 2025 год», раскрывающий детали архитектуры, обучения и оптимизации своих новых моделей искусственного интеллекта, представленных на конференции WWDC25.

В документе описывается инновационный подход к созданию локальной модели для устройств. Она разделена на два блока: первый содержит 62,5% слоев трансформера, второй — оставшиеся 37,5% без проекций ключей и значений. Такое разделение позволило сократить требования к памяти на 37,5% и уменьшить время вывода первого токена примерно на такую же величину, сохранив при этом качество работы модели.

Для облачной модели Apple разработала собственную архитектуру Parallel-Track Mixture-of-Experts (PT-MoE). Она объединяет концепцию параллельных треков с принципом «смеси экспертов». Модель разделена на несколько параллельных уровней, каждый из которых обрабатывает токены независимо и синхронизируется только в определенных точках. В каждом треке используются слои MoE, активирующие только релевантных «экспертов» для конкретной задачи, что повышает эффективность и скорость работы.

Автор: 9TO5Mac Источник: 9to5mac.com

Значительное внимание в отчете уделено многоязычной поддержке. Apple увеличила объем многоязычных данных с 8% до 30% от общего объема обучающих материалов. Токенизатор расширен на 50% — до 150 000 различных токенов. Тестирование проводилось с использованием запросов от носителей языка, а не переведенных материалов, оценивалась как точность, так и естественность ответов в местном контексте.

Для обучения моделей Apple использовала несколько источников данных: общедоступные веб-данные, собранные с помощью Applebot с соблюдением robots. txt; лицензированный контент от издателей; синтетические данные, созданные для специфических задач; визуальные данные, включающие более 10 миллиардов пар изображений с подписями.

Благодаря новой архитектуре и улучшенным методам обучения, модели Apple обеспечивают более высокую производительность при меньших требованиях к ресурсам, что особенно важно для работы искусственного интеллекта непосредственно на устройствах пользователей.

Источник: 9TO5Mac

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Что делать, если к Земле летит астероид: реальные технологии защиты планеты

Весной 2026 года в верхних слоях атмосферы над территорией США зафиксировали разрушение крупного космического тела. Объект диаметром около полутора метров и массой около пяти тонн вошел в воздушное...

Кинта да Регалейра: самый мистический дворец Португалии, построенный иллюминатом

Когда человек становится баснословно богат, он принимается воплощать в жизнь все свои отложенные желания. В случае со среднестатистическим жителем нашей голубой планеты список не такой уж...

„Бриг-001“: как советские инженеры создали Hi-Fi в условиях дефицита комплементарных транзисторов

В начале 1970-х годов советская бытовая аудиоаппаратура находилась в технологическом тупике. Ранняя полупроводниковая техника страдала от специфических нелинейных искажений, которые инженеры и...

Как в СССР собирались повернуть реки вспять: мегапроект, который так и не построили

Идея звучит почти фантастически: взять часть воды великих сибирских рек и направить её туда, где воды катастрофически не хватало. Не просто построить канал между двумя городами, не просто проложить...

Как математика Джона Нэша управляет ИТ-системами: реальная теория игр против мифа из «Игр разума»

Голливудская драма «Игры разума» приучила массового зрителя к красивой, но сугубо романтизированной сцене в баре: персонаж Рассела Кроу внезапно осознает, что если все парни бросятся к одной и...