AI-модели научились сжиматься во время обучения без потери качества

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Обучение больших AI-моделей теперь может стать в разы дешевле и быстрее. Исследователи из MIT CSAIL и Института Макса Планка разработали метод CompreSSM, который позволяет удалять избыточные компоненты нейросети непосредственно в процессе обучения, а не после него. Это решает главную проблему индустрии: больше не нужно выбирать между обучением огромной, но дорогой модели, и быстрой, но менее точной.

Иллюстрация: абстрактная художественная визуализация процесса компрессии нейросети во время обучения (AI-генерация).
Автор: chatgpt Источник: chatgpt.com

Ключевая идея метода, принятого на конференцию ICLR 2026, заключается в том, что «важность» различных частей нейросети стабилизируется уже на ранних этапах обучения. Используя математический аппарат из теории управления (Hankel singular values), алгоритм определяет, какие компоненты модели вносят реальный вклад в результат, а какие являются «шумом». После этого ненужные части удаляются, и дальнейшее обучение продолжается на уже оптимизированной, более компактной модели.

Результаты на стандартном тесте CIFAR-10 показали, что модель, сжатая вчетверо с помощью CompreSSM, достигла точности 85,7%. Для сравнения, модель того же размера, обученная с нуля, показала лишь 81,8%. В экспериментах с архитектурой Mamba удалось сократить размерность со 128 до 12 параметров, полностью сохранив производительность и ускорив обучение в 4 раза. Это делает новый метод до 40 раз быстрее аналогов, основанных на схожих принципах.

Такой подход напрямую снижает затраты на электроэнергию и вычислительные ресурсы, поскольку отпадает необходимость в полном цикле обучения полноразмерной модели перед ее последующей компрессией. Исследователи математически доказали, что определенная на раннем этапе важность компонентов остается стабильной до конца процесса обучения.

Источник: MIT News

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Официально признан новый глобальный загрязнитель: как атмосфера Земли пропиталась промышленными полимерами

Современная экологическая повестка сосредоточена на двух проблемах: распространении микропластика и накоплении перфторалкильных веществ (PFAS). Эти соединения тщательно отслеживаются в питьевой...

Новый игрок на рынке: обзор ультратонкой беспроводной клавиатуры xG Blade TKL

xG Blade — абсолютная новинка в мире клавиатур, которая зарелизилась без какой-либо помпы, громких анонсов и так далее, хотя клавиатура, как минимум, любопытная. Во-первых, это...

Хижина Маргариты: почему люди поднимаются на высоту 4554 метра ради одной ночи

В итальянских Альпах на горе Пунта-Гнифетти горной цепи Монте-Роза (Monte Rosa) стоит необычное место для ночлега, называемое «Хижиной Маргариты». Находится оно на высоте 4554 метра над уровнем...

Будущее защищённых смартфонов на российском рынке: планы и инновации бренда Ulefone

  • Статья
  • Ulefone
О планах Ulefone на российском рынке и особенностях новых защищённых гаджетов рассказал CEO компании, господин Сюн Синьань. Компания уже много лет выпускает защищённые смартфоны и продолжает...

Гравитация следует законам Ньютона и Эйнштейна на любых масштабах: доказывает ли это существование темной материи?

Наблюдая за космосом, современные астрономы сталкиваются с серьезной физической проблемой. Эта проблема касается того, как движутся звезды внутри галактик и как сами галактики перемещаются внутри...