Метод дистилляции знаний позволяет создавать эффективные ИИ-модели с минимальными затратами

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Метод дистилляции знаний, разработанный исследователями Google в 2015 году, включая нобелевского лауреата 2024 года Джеффри Хинтона, превратился в фундаментальную технологию индустрии искусственного интеллекта. Этот подход позволяет передавать знания от крупных, вычислительно затратных моделей к меньшим и более эффективным, существенно снижая стоимость их эксплуатации.

Технология привлекла широкое внимание в начале 2025 года, когда китайская компания DeepSeek выпустила чат-бота R1, который демонстрировал производительность на уровне ведущих моделей, но требовал значительно меньше вычислительных ресурсов. Это вызвало резкое падение акций технологических компаний, включая рекордное однодневное падение стоимости акций Nvidia.

Принцип дистилляции основан на концепции «мягких целей», когда большая модель-учитель передает не просто однозначные ответы, а вероятностные распределения для различных вариантов. Это позволяет меньшей модели-ученику усваивать нюансы классификации и принятия решений. По словам Ориола Виньялса, одного из авторов оригинальной статьи и ведущего научного сотрудника Google DeepMind, изначально метод был разработан для сжатия ансамблей моделей в одну более эффективную.

Автор: Quanta Magazine Источник: www.wired.com

Несмотря на первоначальный скептицизм, дистилляция стала стандартной практикой в индустрии. Такие проекты как DistilBERT (уменьшенная версия языковой модели BERT от Google) продемонстрировали практическую ценность подхода. Сегодня Google, OpenAI и Amazon предлагают дистилляцию как коммерческую услугу.

Недавние исследования лаборатории NovaSky Калифорнийского университета в Беркли показали, что дистилляция особенно эффективна для обучения моделей рассуждений с цепочкой мыслей. Их модель Sky-T1 с открытым исходным кодом, обучение которой стоило менее 450 долларов, достигла результатов, сопоставимых с гораздо более крупными моделями.

Энрик Бойш-Адсера из Уортонской школы бизнеса Пенсильванского университета подчеркивает: «Дистилляция — один из самых важных инструментов, которые сегодня есть у компаний для повышения эффективности моделей».

Источник: WIRED

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Робот пылесос с непрерывной подачей воды и самоочисткой в реальном времени: обзор новой модели Qrevo Curv 2 Flow от Roborock

Продуманный робот пылесос Roborock Qrevo Curv 2 Flow для влажной и совмещенной уборки, оснащенный лазерной навигацией и ИИ-камерой. Такой вариант и полы помоет, и мусор соберет, и протрет в углах...

Обзор кресла Zone51 X-Prime Optimus – удобно ли сидеть целый день

Zone 51 X-Prime Optimus — кресло с сетчатой конструкцией и набором регулировок, которое сразу задает свою логику посадки. Здесь нет привычной мягкости и простых механизмов, зато есть...

Классическая фотография умерла? Нет. Просто фотоиндустрия стоимостью $100 млрд превратилась в иконку на экране смартфона

Куда исчезли $90 млрд? Как индустрия Kodak и Fujifilm сжалась в 10 раз, превратившись в иконку на экране. История о величайшей ошибке в бизнесе и о том, кто на самом деле победил в войне за наши кадры

Странные полосы на соснах в лесу: что такое подсочка

Прогуливаясь по сосновому лесу или собирая грибы, ягоды вы, возможно, замечали странные отметины на стволах взрослых деревьев V- образные надрезы в виде зарубок, иногда их называют рунами. И...

Обзор ноутбука Ninkear S14 — продуманное решение с малым весом

Сегодня я расскажу о ноутбуке Ninkear S14. Ноутбук задуман как максимально лёгкое и компактное устройство, имеющее при этом интересные характеристики, и предлагающееся за адекватную стоимость....

Обзор кабеля USB-C Baseus Cafele 100W: Мощный зарядный кабель, который не стоит оставлять без присмотра

Рынок USB-C кабелей сегодня — это настоящий минный лоток: снаружи все выглядят плюс-минус одинаково, но что происходит внутри — отдельная история. Одни кабели тихо...