Скрытая биосфера Земли: ИИ выявил древнейшие следы жизни возрастом 3,3 млрд лет, невидимые для человека
Вот грустная правда о палеонтологии: чем дальше мы смотрим в прошлое, тем меньше мы находим. Когда речь идет о породах старше 2,5 миллиардов лет, привычные методы перестают работать. Окаменелости стираются в пыль, а химические следы жизни — биомаркеры — разрушаются под воздействием температуры и давления. Мы знаем, что жизнь тогда была, но доказать это на молекулярном уровне очень и очень сложно.
Группа исследователей опубликовала в PNAS работу, которая, наконец, может это подтвердить. Они перестали искать отдельные уцелевшие молекулы и поручили алгоритмам машинного обучения анализировать весь химический шум целиком. В результате, мы получили доказательства существования фотосинтеза и биологической активности, которые в два раза старше предыдущих надежных химических записей.
Разберем, как это работает, почему старые методы провалились и что это значит для поиска жизни на Марсе.
Почему классическая химия сдает позиции?
Проблема древних пород — это проблема выживания информации. Органические молекулы, из которых состоит жизнь (липиды, белки), нестабильны. За миллиарды лет геологические процессы — диагенез и метаморфизм — превращают сложные биологические структуры в бесформенную массу углерода.
Традиционная геохимия ищет конкретные молекулы-биомаркеры. Например, стераны или порфирины. Но эти молекулы редко сохраняются дольше 1,6 миллиарда лет.
Однако углерод остается. Вопрос в том, откуда он взялся. В древних породах углерод может быть трех типов:
- Биогенный: остатки живых организмов.
- Абиогенный земной: результат геологических процессов (например, в гидротермальных источниках).
- Внеземной: органика, занесенная метеоритами (углистые хондриты богаты углеродом).
Различить сильно деградировавшую бактерию и кусок органики из метеорита, пролежавший в земле 3 миллиарда лет, — задача, с которой человеческий глаз и стандартные хроматограммы справляются плохо.
Метод: сжечь и посчитать
Авторы исследования применили комбинацию двух технологий: пиролитической газовой хроматографии — масс-спектрометрии (Py-GC-MS) и машинного обучения.
Метод выглядит довольно просто и грубо: образец породы нагревают до экстремальных температур без доступа воздуха (пиролиз). Органика распадается на мелкие фрагменты. Газовый хроматограф разделяет эти фрагменты, а масс-спектрометр взвешивает их.
На выходе получается гигантская матрица данных. Для каждого образца это 489 240 точек данных, показывающих интенсивность сигнала в зависимости от массы фрагмента и времени его выхода.
Человек не способен проанализировать такой массив. Мы ищем знакомые пики. Алгоритм «Случайный лес» (Random Forest) действует иначе. Он ищет скрытые закономерности во всем массиве данных — соотношения между тысячами фрагментов, которые в совокупности образуют уникальный почерк биологии.
Обучение на 406 образцах
Чтобы научить машину думать, ей показали 406 образцов с известным происхождением:
- Современная биология: растения, животные, грибы.
- Ископаемые: уголь, древние сланцы, окаменевшая древесина.
- Абиогенная органика: метеориты (углистые хондриты) и синтетические смеси, созданные в лаборатории.
Здесь исследователи столкнулись с первым препятствием. Модель, обученная на современных листьях и животных, отлично отличала их от метеоритов (точность 98%), но полностью провалилась при анализе древних окаменелостей. Причина очевидна: химия свежего листа и химия угля, пролежавшего под землей 300 миллионов лет, кардинально отличаются.
Тогда ученые создали новые модели, обученные специально на древних, геологически измененных образцах. И это сработало.
Результаты: жизнь в Архее
Алгоритм научился с точностью до 95% отличать биологическую древнюю органику от абиогенной (метеоритов и синтетики). Но самое интересное началось, когда систему применили к спорным образцам, возраст которых превышает 2,5 миллиарда лет.
1. Доказательство биологического происхождения (3,33 млрд лет). Образцы из формации Йозефсдал (Южная Африка) датируются возрастом 3,33 миллиарда лет. В этих слоях находят слоистую органику, похожую на микробные маты, но скептики всегда могли сослаться на метеоритное загрязнение или гидротермальные процессы. Алгоритм выдал вердикт: вероятность биологического происхождения выше 60-70%. Это довольно надежное подтверждение того, что органика в этих скалах — это остатки живых существ, а не космический мусор.
2. Фотосинтез в Неоархее (2,52 млрд лет). Еще более сложная задача — определить тип метаболизма. Занимались ли эти микробы фотосинтезом? Формация Гамохан (Южная Африка, 2,52 млрд лет) давно заинтересовала ученых. Там есть строматолиты — постройки, которые обычно создают цианобактерии. Но химических доказательств фотосинтеза не было. Модель показала высокую вероятность того, что органика в этих породах принадлежит фотосинтезирующим организмам. Это первое молекулярное подтверждение фотоавтотрофии такой древности. Оно удваивает временной интервал, в котором мы можем химически детектировать фотосинтез (ранее предел был около 1,6 млрд лет).
Почему это важно?
Мы перестали зависеть от сохранности конкретных молекул. Даже если время уничтожило все известные нам биомаркеры, общая структура распределения органических фрагментов сохраняет информацию о своем происхождении. Биология упорядочивает материю иначе, чем случайные химические реакции в космосе или в горячем источнике.
Взгляд на Марс
Этот метод имеет прямое практическое применение за пределами Земли. Марсоход Perseverance прямо сейчас собирает образцы в кратере Езеро. Когда (и если) эти образцы вернутся на Землю, они будут выглядеть так же, как архейские породы: смесь минералов и, возможно, сильно деградировавшей органики.
Мы не найдем там свежих клеток. Мы найдем такой себе химический фарш. И описанный метод машинного обучения — это именно тот инструмент, который позволит сказать: это просто углерод из космоса или остатки древней марсианской биосферы.
Источник: Proceedings of the National Academy of Sciences (PNAS)





1 комментарий
Добавить комментарий