Физика разума машины: как геометрия помогает нам понять логику нейросетей

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

10 августа 2025, 20:32 | Мнение | Наука и космос

Искусственный интеллект сегодня повсюду — от рекомендаций в вашем смартфоне до сложных научных открытий. В основе большинства этих систем лежат глубокие нейронные сети, которые, подобно человеческому мозгу, обучаются на огромных массивах данных. Но вот парадокс: мы создали эти системы, но зачастую не до конца понимаем, что именно происходит в их цифровых «недрах». Процесс обучения ИИ долгое время оставался «чёрным ящиком» — мы видели результат, но внутренняя логика оставалась туманной.

Что если ключ к разгадке этой тайны лежит не в ещё более сложных алгоритмах, а в простой механике, знакомой нам со школьной скамьи? Недавно группа учёных из Швейцарии и Китая предложила поразительно изящную идею: смоделировать работу сложнейшей нейросети с помощью… обычной цепочки из блоков и пружин. Звучит странно? Возможно. Но именно в этой простоте и кроется гениальность, способная изменить наш подход к созданию и настройке ИИ.

Иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com

От вешалки до землетрясения: как рождаются научные аналогии

История этого открытия сама по себе похожа на увлекательный детектив. Всё началось с наблюдения за так называемым «законом разделения данных». Учёные заметили, что хорошо обученная нейросеть обрабатывает информацию послойно, и на каждом «этаже» этой структуры данные становятся всё более упорядоченными. Например, если сеть учится отличать кошек от собак, то на каждом новом слое изображения этих животных становятся всё более чётко разделёнными в математическом пространстве. Причём каждый слой вносит примерно одинаковый вклад в это разделение.

Но эта красивая закономерность работала не всегда. Стоило изменить параметры обучения — скорость или уровень «шума» — как гармония нарушалась. Именно эта загадка и натолкнула исследователей на поиск более фундаментального объяснения. И тут, как это часто бывает в науке, помог случай и междисциплинарный опыт.

Один из авторов исследования, Иван Докманич, параллельно занимался геофизикой, где для моделирования землетрясений и движения тектонических плит используются модели из блоков и пружин. Внезапно он увидел поразительное сходство. Рождение аналогии было настолько творческим, что учёные во время отпуска обменивались фотографиями бытовых предметов: складных линеек, раздвижных вешалок, подставок под горячее — пытаясь найти идеальный физический прототип для нейросети. Эта забавная история отлично иллюстрирует, что великие открытия порой рождаются не из сухих формул, а из живой интуиции и умения видеть связи там, где их никто не искал.

Фазовые диаграммы кривых нагрузки при обучении ГНС (показаны красным) для соотношения нелинейности и (a) шума данных, (b) скорости обучения, (c) dropout и (d) размера батча. Нелинейность контролируется отрицательным наклоном функции leaky ReLU со значениями 1; 0,8; 0,6; 0,4; 0,2 и 0 для рядов снизу вверх. Во всех случаях сила шума максимальна слева, а нелинейность — наверху. Фоновая заливка отражает точность на тестовых данных. Результаты усреднены по десяти независимым запускам на наборе данных MNIST.
Автор: Cheng Shi et al Источник: journals.aps.org

Физика «обучения»: что общего у нейросети и цепи из пружин?

Давайте разберёмся в этой аналогии. Представьте себе несколько деревянных блоков, лежащих на столе и соединённых пружинами. Теперь потянем за крайний блок. Что произойдёт?

Слои нейросети — это блоки. Каждый блок в нашей цепи — это один слой нейронной сети.
Процесс разделения данных — это растяжение пружин. Насколько сильно нейросеть «растащила» данные на одном слое, настолько же растянулась пружина между двумя блоками.
Сложность задачи (нелинейность) — это трение. Если данные очень запутанные и их трудно разделить, это похоже на то, как если бы блоки скользили по шероховатой, липкой поверхности. Сила трения мешает им легко двигаться.
Шум при обучении — это вибрация. В реальном обучении ИИ всегда есть элемент случайности, или «шума». В нашей модели это эквивалентно тому, что мы начинаем слегка трясти стол. Блоки подпрыгивают, на мгновение отрываясь от поверхности, и трение ослабевает. Это позволяет пружинам перераспределить натяжение и выровняться.

Иллюстрация аналогии между цепочкой из блоков и пружин и глубокой нейронной сетью.
Автор: Cheng Shi et al Источник: journals.aps.org

Именно этот последний пункт оказался ключевым. Когда в обучении нейросети есть оптимальный уровень «шума», он, подобно вибрации, помогает всем слоям работать согласованно, и каждый вносит свой равный вклад в разделение данных. Если же шума нет, а задача сложная (высокое трение), то вся нагрузка ложится на последние, «глубокие» слои, в то время как первые почти не работают. Они «застревают», не в силах преодолеть трение.

Карта для «чёрного ящика»: фазовая диаграмма обучения

Самое ценное в этом подходе — его предсказательная сила. На основе своей модели учёные смогли построить нечто вроде карты, или фазовой диаграммы, подобной тем, что в физике описывают состояния вещества (лёд, вода, пар). Эта диаграмма наглядно показывает, как будет вести себя нейросеть в зависимости от двух ключевых параметров: уровня нелинейности (трения) и шума (вибрации).

Глядя на эту карту, разработчик может сразу понять, в каком «режиме» работает его модель. Находится ли она в «замороженном» состоянии, где ранние слои бездействуют? Или, может, в ней слишком много «шума», и обучение идёт хаотично? Или же она находится в той самой «золотой середине», где все слои работают слаженно, как хорошо смазанный механизм? Это превращает абстрактную настройку миллиардов параметров в понятный физический процесс.

Кривые нагрузки при сходимости (a) и траектории (b)-(d) для MLP с семью скрытыми слоями и функцией ReLU на наборе данных MNIST (_1) в сравнении с нашей моделью из блоков и пружин (_2). Для MLP (_1) ордината представляет собой Dℓ (разделение данных на слое ℓ); пунктирная линия — это потери при обучении. Характерные режимы: (b) высокая нелинейность (высокое трение) и низкая случайность при обучении (шум в силе); (c) сбалансированные нелинейность и случайность; (d) низкая нелинейность и высокая случайность. В системе с пружинами (_2) ордината — это расстояние до целевого значения Dℓ = y − xn. Значения масштабированы для соответствия режиму, используемому в ГНС, и для наглядности. Пунктирная линия показывает силу F на крайнем правом блоке, и она отображена в ином масштабе, чем Dℓ.
Автор: Cheng Shi et al Источник: journals.aps.org

Практический смысл: зачем инженеру ИИ знать про пружины?

Это исследование — не просто красивое теоретическое упражнение. Оно открывает вполне конкретные практические возможности.

Диагностика и оптимизация. Представьте, что нейросеть — это мост. Используя эту модель, можно создать «карту напряжений» для ИИ, которая покажет, какие слои «перегружены» (что может вести к переобучению и ошибкам), а какие — «простаивают» (что говорит об избыточности архитектуры). Это позволит точно настраивать даже гигантские модели, вроде больших языковых моделей (LLM).
Ускорение обучения. Понимая, как шум и сложность влияют на процесс, можно целенаправленно «встряхивать» нейросеть на нужных этапах, чтобы ускорить её сходимость к правильному решению. Это может сэкономить колоссальные вычислительные ресурсы и время.
Новый путь развития ИИ. Сегодня доминирует подход «законов масштабирования»: чтобы сделать ИИ умнее, мы просто увеличиваем его размер и количество данных. Новый метод предлагает более изящный путь — не бездумно наращивать мощь, а тонко настраивать внутреннюю динамику системы, опираясь на понятные физические принципы.

Динамика кривых нагрузки для глубокой CNN. (a) Точность на тестовых данных в зависимости от потерь при обучении. (b) Соответствующие кривые нагрузки во время обучения. В ходе экспериментов мы вводим 5% на эпохе 20 x 200 и 30% dropout на эпохе 40 x 200.
Автор: Cheng Shi et al Источник: journals.aps.org

От интуиции к инструменту: новый взгляд на интеллект машин

Работа Докманича и его коллег — яркий пример того, как фундаментальная наука может дать мощный толчок прикладным технологиям. Она возвращает в мир больших данных и сложных алгоритмов человеческую интуицию. Ведь интуитивно понять, как ведут себя пружинки и кубики, гораздо проще, чем оперировать миллиардами математических параметров.

Это исследование превращает «чёрный ящик» в прозрачный механизм, который можно не только наблюдать, но и целенаправленно конструировать. Возможно, в будущем инженеры ИИ будут говорить не о «скорости обучения», а о «коэффициенте трения», и не о «регуляризации», а о «силе вибрации». И этот новый язык, заимствованный у физики, поможет нам создавать более эффективный, надёжный и, что самое главное, понятный искусственный интеллект.

Физика разума машины: как геометрия помогает нам понять логику нейросетей

От вешалки до землетрясения: как рождаются научные аналогии

Физика «обучения»: что общего у нейросети и цепи из пружин?

Карта для «чёрного ящика»: фазовая диаграмма обучения

Практический смысл: зачем инженеру ИИ знать про пружины?

От интуиции к инструменту: новый взгляд на интеллект машин

1 комментарий

Добавить комментарий

Сейчас на главной

Новости

Sony запатентовала контроллер для PlayStation с гибким корпусом, который можно сжимать, скручивать и деформировать

Bluetti представила FridgePower: ультратонкую электростанцию на 2016 Вт·ч с расширением до 8 кВт·ч

Роботы на дорогах возят за деньги. Южная Корея одобрила поставки грузовиков без водителя для коммерческих перевозок

Galaxy S27 Ultra может стать первым смартфоном Samsung с UFS 5.0, что ускорит запуск приложений и обработку больших файлов на устройстве

В Quick Share на Galaxy выявлена проблема при передаче фото на iPhone

Публикации

Как бактерии стали многоклеточными: система разделения ДНК эволюционировала во внутриклеточный каркас

Компьютерные расчеты термоядерных реакций оказались ошибочными: как эксперимент с испаренной медью переписывает законы физики плазмы

Самые крупные карповые в мире и в России: история семейства, размеры и что из них готовят

✦ ИИ 5 сервисов для создания презентаций с опросами: для учителей, маркетологов и бизнеса

Где можно увидеть Стоунхендж, не выезжая за границы России

Обзор бесщеточной аккумуляторной пилы ProCraft PKA45 (PKA46): 2 аккумулятора, 2 шины и 2 цепи