Учёные впервые «урезали» генетический код живой бактерии: ИИ помог переписать ключевые белки рибосомы без одной из 20 аминокислот

Генетический код считается одной из самых устойчивых и универсальных систем в биологии. Почти все живые организмы на Земле используют одинаковую «схему»: триплеты ДНК кодируют 20 стандартных аминокислот, из которых собираются белки. Незначительные вариации существуют, но радикальных исключений в природе практически нет, из-за чего считается, что этот код сформировался ещё у последнего общего предка.

Несмотря на это, происхождение генетического кода остаётся одной из ключевых нерешённых проблем биологии. Большинство гипотез предполагает, что ранние формы жизни использовали упрощённый набор аминокислот и постепенно «расширяли свой код». Чтобы проверить подобные сценарии, исследователи из Колумбийского и Гарвардского университетов попытались сделать обратный шаг — сократить современный генетический код.

Их целью стало понять, можно ли убрать одну из 20 стандартных аминокислот и при этом сохранить жизнеспособность клетки. В качестве кандидата выбрали изолейцин — гидрофобную аминокислоту, структурно близкую к лейцину и валину. Все три вещества часто взаимозаменяемы в белках.

Выбор изолейцина был не случайным. Анализ генома Escherichia coli («кишечной палочки») показал, что именно он чаще других заменяется на другие аминокислоты в эволюционно близких белках у разных видов. Это делало его наиболее вероятным кандидатом на «удаление» с точки зрения биологической устойчивости системы.

Источник: Steven McDowell / Science Photo Library

Однако сразу переписать весь геном бактерии оказалось невозможно: в E. coli около 4500 генов, и одновременные изменения почти гарантированно привели бы к гибели клетки. Поэтому исследователи начали с малого — с набора из 36 жизненно важных генов, в которых изолейцин заменяли на валин.

Результаты оказались неоднозначными. В части случаев бактерии погибали, но примерно половина модифицированных генов продолжала работать. В ряде белков можно было заменить до десятков позиций изолейцина без критических последствий, хотя рост клеток в таких условиях обычно замедлялся.

Следующим этапом стал один из самых сложных элементов клетки — рибосома. Это молекулярная машина, которая «считывает» РНК и собирает из аминокислот белки. Её структура включает десятки белков и молекул РНК, тесно взаимодействующих друг с другом, что делает систему крайне чувствительной к любым изменениям.

Исследователи начали с тестирования 50 рибосомных белков, заменяя в них изолейцин на валин. Лишь часть из них сохраняла работоспособность без существенных проблем. Для остальных использовали модели глубокого обучения, которые предлагали альтернативные последовательности аминокислот, исключающие изолейцин.

После нескольких циклов оптимизации с участием разных ИИ-систем удалось получить жизнеспособные варианты большинства белков. В сложных случаях алгоритмы дополнительно пересматривали структуру соседних аминокислот, компенсируя изменения в пространственной конфигурации белка.

Кульминацией эксперимента стала попытка переписать весь малый субъединичный блок рибосомы. Он включает 21 белок, расположенных в одном компактном участке генома. Учёные последовательно заменяли гены группами, наблюдая за жизнеспособностью клетки.

Постепенно система начинала «ломаться»: при замене большинства белков рост замедлялся, а при попытке изменить почти весь комплекс клетки погибали. Однако при сохранении одного ключевого белка — rplW — бактерии оставались жизнеспособными и могли расти, хоть и примерно на 30–40% медленнее обычного уровня.

Этот белок оказался узким местом всей конструкции. ИИ-модели предложили для него сложные структурные изменения, включая удаление участков цепи, но такие модификации конфликтовали с другими изменениями в системе. В итоге исследователям пришлось перебрать множество комбинаций вручную, пока не был найден рабочий вариант.

Примечательно, что модифицированная система оказалась устойчивой: даже после 400 поколений бактерии не «вернули» изолейцин обратно в рибосомные белки, несмотря на сильное эволюционное давление. Однако скорость роста оставалась сниженной — примерно до 60–70% от нормальной.

Авторы подчёркивают, что без ИИ-инструментов такие изменения были бы практически невозможны. Модели не только предлагали последовательности белков, но и проверялись структурными предсказаниями, включая AlphaFold 2. При этом разные алгоритмы иногда давали противоречивые решения, и причины этих расхождений пока что остаются неясными.

В то же время исследование показало ограниченность современных моделей: они способны находить рабочие решения, но не объясняют, почему именно эти решения эффективны. В некоторых случаях ИИ даже предлагал радикальные перестройки вторичной структуры белков, последствия которых трудно интерпретировать биологически.

Учёные рассматривают эти результаты как первый шаг к экспериментальному моделированию «альтернативной биохимии» — систем, где жизнь может функционировать с сокращённым набором аминокислот. Однако пока что неизвестно, можно ли довести такой организм до полной жизнеспособности без потери эффективности.