Выращенный в лаборатории мозг подключили к симулятору: клетки успешно решили бенчмарк для искусственного интеллекта

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Статья | Наука и космос

Несмотря на колоссальный прогресс в развитии искусственного интеллекта, современные нейронные сети всё ещё сильно проигрывают биологическому мозгу в энергоэффективности. Чтобы обучить алгоритм базовым законам физики, требуются гигаватты электроэнергии и вычислительные кластеры размером с промышленный склад. Живые клетки справляются с аналогичными задачами, потребляя доли ватта. Главное отличие кроется в архитектуре: биологическая нервная ткань способна физически перестраивать свои внутренние связи в ответ на поступающую информацию.

Исследователи из Калифорнийского университета задались целью выяснить, можно ли взять эту вычислительную мощность биологии, изолировать ее от живого организма и заставить решать сугубо инженерные задачи. Для этого они создали замкнутую биоэлектронную систему, в которой выращенный в лаборатории фрагмент мозговой ткани научился управлять виртуальным объектом в режиме реального времени.

Органоид мозга на чипе, вольная интерпретация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com
Проблема отсутствующего тела

Для эксперимента ученые вырастили кортикальные органоиды — трехмерные скопления клеток, сформированные из эмбриональных стволовых клеток мыши. За тридцать дней развития в инкубаторе эти клетки самостоятельно организовались в сложную сеть, имитирующую архитектуру коры головного мозга. Однако сама по себе такая ткань бесполезна для вычислений: она лишена сенсорных органов для получения данных извне и мышечного аппарата для обратной связи.

Чтобы заставить клетки обрабатывать информацию, их необходимо было подключить к симулятору. В качестве тестовой среды была выбрана классическая задача теории автоматического управления — перевернутый маятник. В этой симуляции на подвижной тележке закреплен шест, который свободно падает под действием гравитации. Задача агента управления — постоянно двигать тележку влево или вправо, чтобы удерживать шест в строгом вертикальном положении. Это нестабильная динамическая система, в которой малейшая задержка в анализе данных приводит к неминуемому падению.

Для соединения биологического материала с кодом симулятора использовалась матрица микроэлектродов высокой плотности. Это специальный чип, на поверхности которого расположены тысячи микроскопических контактов. Органоид помещался прямо на эту кремниевую подложку, что позволило инженерам с миллисекундной точностью считывать электрические импульсы отдельных нейронов и локально подавать встречные сигналы в конкретные участки клеточной сети.

Архитектура эксперимента по обучению in vitro (A) Схема подготовки и проведения эксперимента. На стадии record система фиксирует спонтанную электрическую активность ткани, чтобы локализовать нейроны на чипе. На этапе stimulate на обнаруженные клетки подаются тестовые импульсы — это позволяет измерить скорость и силу их ответных реакций. Опираясь на эти данные, исследователи назначают нейронам их роли (какие клетки будут получать информацию от симулятора, а какие — отдавать команды). Фаза train представляет собой серию эпизодов, в ходе которых органоид напрямую управляет виртуальной средой. (B) Алгоритм обучающего цикла. Виртуальная среда обновляется с фиксированной частотой, непрерывно обмениваясь данными с органоидом по принципу замкнутой петли обратной связи (блок yellow box). Эпизод прерывается в тот момент, когда виртуальный шест отклоняется на критический угол и падает. Сразу после этого, в зависимости от сценария эксперимента, на нейроны подается паттерн обучающих электрических импульсов.
Автор: Robbins, Ash et al. Источник: www.cell.com
Язык трансляции сигналов

Чтобы живые клетки могли взаимодействовать с виртуальной гравитацией, исследователям потребовалось создать протокол кодирования и декодирования информации. Взаимодействие работало как непрерывный цикл.

Сначала система передавала органоиду информацию о положении шеста. Для этого ученые выбрали два «входных» нейрона на чипе. Угол отклонения виртуального маятника математически конвертировался в частоту электрических импульсов. Если шест стоял ровно, на входные нейроны подавался фоновый, редкий сигнал. Но как только маятник начинал заваливаться, частота стимуляции резко возрастала. Таким образом, клетки буквально чувствовали отклонение через ритм электрических разрядов.

Одновременно компьютер прослушивал активность двух других, «выходных» нейронов органоида. Разница в частоте их собственных, спонтанных электрических разрядов переводилась в кинетическую команду. Если первый выходной нейрон активировался чаще второго, система толкала виртуальную тележку влево. Если наоборот — вправо.

В первые минуты эксперимента система вела себя ожидаемо хаотично. Сигналы, проходящие через нейронную сеть органоида от входа к выходу, не имели никакой логики. Тележка дергалась в случайных направлениях, и виртуальный шест падал за доли секунды. Ткани требовался алгоритм обучения.

Выращивание органоида и интеграция с электронным интерфейсом (A) Схема процесса выращивания кортикальных органоидов из эмбриональных стволовых клеток мыши (ESC). (B) Микрофотографии органоидов в светлом поле на разных этапах развития (снимки сделаны при различном увеличении). (C) Иммуногистохимический анализ ткани на 10-й день. Специфичное окрашивание подтверждает правильное формирование клеточных структур мозга: маркерами выделены клетки радиальной глии (Pax6) и зачатки медиального ганглионарного возвышения (Nkx2.1). Масштабная шкала: 150 мкм. (D) Внешний вид органоида, размещенного на матрице микроэлектродов высокой плотности (HD-MEA). Масштабная шкала: 200 мкм. (E) Тепловая карта электрической активности ткани, наложенная на физическую сетку чипа HD-MEA, с указанием конфигурации задействованных электродов. Масштабная шкала: 200 мкм. (F) Графики формы электрических импульсов (потенциалов действия), полученных от отдельных нейронов, с привязкой к координатам считывающих электродов на матрице.
Автор: Robbins, Ash et al. Источник: www.cell.com
Электрическая индукция пластичности

В полноценном организме успешные действия закрепляются химически — выбросом нейромодуляторов вроде дофамина. Органоид в чашке Петри лишен системы вознаграждения. Поэтому инженеры использовали базовое свойство нервной ткани — синаптическую пластичность. Науке известно, что точечные высокочастотные электрические разряды заставляют нейроны изменять силу соединений друг с другом. Вопрос заключался лишь в том, куда и когда подавать эти импульсы.

Компьютер непрерывно анализировал эффективность органоида. Если среднее время удержания маятника в последних попытках оказывалось ниже базового уровня, алгоритм переходил в режим обучения. В момент падения виртуального шеста система подавала серию коротких электрических стимулов на отдельную группу нейронов, не связанных напрямую с входом или выходом.

Обучение не было случайным ударом тока. Алгоритм использовал принципы машинного обучения: он вел строгий учет всех комбинаций стимулирующих импульсов и анализировал, какие из них исторически приводили к увеличению времени балансировки маятника. Эффективным паттернам стимуляции присваивался высокий приоритет, и в следующих циклах они применялись чаще.

Результаты подтвердили состоятельность метода. Под воздействием направленной адаптивной стимуляции органоид начал менять внутреннюю логику обработки сигналов. Вместо хаотичных реакций сеть выработала стабильную стратегию контроля. Время удержания маятника увеличилось с первоначальных секунд до стабильных десятков секунд и минут. Более того, анализ показал, что сеть научилась реагировать не только на сам угол наклона, но и на скорость падения маятника, формируя сложный прогностический контроль.

Биологическая достоверность эксперимента

Наиболее частый скепсис в отношении подобных гибридных систем касается источника вычислений: критики предполагают, что обучение может быть артефактом работы самого кремниевого чипа или компьютерного алгоритма, а клетки выступают лишь в роли пассивного проводника.

Для строгого доказательства биологической природы вычислений авторы применили фармакологический тест. В разгар успешного эксперимента, когда органоид стабильно удерживал маятник, в питательную среду добавили химические блокаторы — вещества NBQX и APV. Они избирательно отключают рецепторы, отвечающие за передачу глутамата — главного нейромедиатора, обеспечивающего синаптическую пластичность и память в мозге.

Эффект был мгновенным. Несмотря на то, что компьютер продолжал транслировать угол наклона и подавать обучающие импульсы, способность органоида контролировать тележку упала на 64%. Ткань потеряла приобретенный навык и вернулась к базовому уровню случайного шума.

Как только химические блокаторы были вымыты из инкубатора и нормальная работа рецепторов восстановилась, органоид вновь обрел способность обучаться и балансировать маятник. Этот тест окончательно подтвердил: обработка информации и адаптация происходили именно на микроскопическом уровне, внутри живых синапсов.

Динамика непрерывного адаптивного обучения и формирование стратегии управления (A) Графики времени удержания виртуального маятника в процессе непрерывного обучения. Пунктирная линия на уровне 20,5 секунд обозначает экспериментальный порог — пересекая его, органоид считается успешно «обученным». (B) Оценка эффективности различных паттернов электрической стимуляции. Цвет линии и кружка обозначают первый и второй нейроны в стимулируемой паре соответственно. Серая заштрихованная область — границы случайного (броуновского) шума. Римскими цифрами отмечены паттерны, давшие максимальный прирост к результату. (C) Работа алгоритма «обучения с подкреплением» в реальном времени. Сверху: время удержания маятника в ходе эксперимента. Снизу: эволюция «ценности» для всех возможных пар стимулируемых нейронов. Чем интенсивнее цвет на графике, тем выше вероятность, что алгоритм выберет именно эту пару для удара током. Компьютер постоянно обновляет эти вероятности, ориентируясь на прошлые успехи или неудачи ткани. Черные маркеры — моменты подачи стимулов, красные рамки — фрагменты, детально разобранные на графике (D). (D) Механизм алгоритмической обратной связи в действии. На примере двух паттернов стимуляции (фиолетового и оранжевого) видно, как система меняет их приоритет. «Ценность» фиолетового паттерна сначала стабильна, но резко возрастает, когда он приводит к улучшению балансировки. Оценка оранжевого паттерна сначала растет, а затем падает, как только его эффективность снижается. (E) Математическая модель стратегии управления, выработанной органоидом. В ранних попытках структура действий хаотична. На поздних этапах вырисовывается четкая S-образная кривая (сигмоида), отцентрированная вокруг отметки 0° (идеально ровное вертикальное положение шеста). (F) Реакции органоида на ранних этапах обучения (первая треть эксперимента). Показано, как разница в активности выходных нейронов реагирует на информацию об угле наклона маятника. Ответы ткани короткие, слабо скоординированные и хаотичные. (G) Реакции на поздних этапах (последняя треть эксперимента). В отличие от графика (F), здесь формируются устойчивые циклические траектории реакций. Активность нейронов плотно концентрируется вокруг целевого состояния (0°). Система демонстрирует уверенный контроль и минимальный разброс в стартовых решениях.
Автор: Robbins, Ash et al. Источник: www.cell.com
Значение для науки и инженерии

Доказав, что биологическая нейронная сеть способна целенаправленно оптимизировать управление нестабильной динамической системой без естественной системы вознаграждения, наука открывает два масштабных направления для развития.

Первое направление касается инженерии и вычислительной техники. Изоляция фундаментальных механизмов обучения живых клеток позволяет вплотную подойти к созданию биологических сопроцессоров. Подобные гибридные системы будущего смогут решать задачи классификации данных или управления робототехникой, расходуя на порядки меньше энергии, чем современные полупроводниковые архитектуры.

Второе, не менее важное направление — нейрореабилитация. Исследование демонстрирует, что определенные паттерны внешней электрической стимуляции способны заставить нейронную сеть перестроить свои связи для достижения конкретной поведенческой цели. Понимание этого синтаксиса сигналов необходимо для разработки нейроимплантов нового поколения. Устройства будущего смогут точечно воздействовать на поврежденные инсультом или травмой участки коры головного мозга, принудительно стимулируя ткань к созданию новых синаптических маршрутов и восстановлению утраченных функций человека.

Источник: Cell Reports

1 комментарий

AlexAdams
Господа, учёные всё больше хотят избавить планету от живых организмов класса человек.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как мошенники берут кредиты через старые SIM-карты и забытые счета — и почему это опасно

В последние годы все чаще появляются истории, когда человек неожиданно узнает о кредите, который он никогда не оформлял. Иногда это происходит спустя месяцы или даже годы после того, как был утерян...

Закрывает все вопросы к налобному фонарю: обзор Wurkkos HD17

Не за горами уже лето и активности на природе до ночи. Начинаю подбирать себе свет для лесных походов, сплавов на каяке и поездок на электровелосипеде, перепробовал уже много фонарей, в одном мало...

Как зарегистрировать аккаунт PlayStation (PSN) в 2026 году

Ранее уже публиковал материал на эту тему, но тогда упустил некоторые важные нюансы. В этой инструкции покажу, как в 2026 году создать новый аккаунт PlayStation с нуля под нужный PS Store. Для...

Рождались на четырех лапах, вырастали на двух: как странная доисторическая рептилия полностью перестраивала тело в юности

В позднем триасовом периоде, около 215 миллионов лет назад, структура сухопутных экосистем существенно отличалась от более поздних геологических эпох. Доминантное положение на суше занимали не...

Высокое часовое искусство по цене Айфона: обзор эксклюзивных механических часов Lucky Harvey

Lucky Harvey - бренд, который стремится удивлять, и это стремление легко проследить на всех уровнях часов от необычного дизайна до редкой функциональности и цены....