Ученые научили компьютер видеть эволюцию: Новый авто-инструмент легко строит «семейные древа» всех видов по ДНК

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Наука и космос

Представьте себе гигантское, ветвистое древо жизни, где каждая веточка, каждый листик — это отдельный вид, а корни уходят в глубокое прошлое, к общим предкам. Понимание того, как именно эти ветви связаны, кто кому приходится «родственником» в этом грандиозном древе, — одна из фундаментальных задач биологии. Это не просто академический интерес. Знание эволюционных связей помогает нам в самых разных областях: от поиска новых лекарств и борьбы с пандемиями до сохранения исчезающих видов. Но вот незадача: расшифровка этих связей — дело непростое, требующее глубоких знаний и серьезных вычислительных мощностей. Или, по крайней мере, так было до недавнего времени.

А что, если можно проще?

Ученые из Калифорнийского университета в Сан-Диего, похоже, нашли способ сделать эту сложную задачу доступнее. Команда инженеров под руководством профессора Ятиша Турахии разработала инструмент, который получил немного забавное, но говорящее название ROADIES. Эта система обещает настоящий прорыв, позволяя строить филогенетические деревья видов — те самые «древа жизни» — прямо из «сырых» геномных данных. И что самое приятное, с гораздо меньшими затратами времени, сил и специализированных знаний.

Иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com

Давайте разберемся, почему это так важно. Традиционно, чтобы построить такое дерево, ученым приходилось проделывать колоссальную подготовительную работу. Нужно было не просто отсеквенировать геномы (то есть «прочитать» их ДНК), но и провести их тщательную аннотацию — определить, где находятся гены, какие функции они выполняют. Затем следовал кропотливый поиск ортологов — генов, имеющих общее происхождение у разных видов. Это похоже на детективную работу: найти похожие «улики» в геномах десятков, а то и сотен организмов, и убедиться, что они действительно указывают на родство, а не на случайное сходство. Все это требует не только времени, но и очень высокой квалификации, не говоря уже о мощных компьютерах для обработки огромных массивов данных.

Секретное оружие ROADIES: простота и элегантность

Так в чем же хитрость ROADIES? Разработчики пошли немного другим, я бы сказал, более изящным путем.

Во-первых, инструмент отказывается от идеи выбирать какие-то «особенные» участки генома, вроде белок-кодирующих генов, на которые обычно опираются при построении филогении. Вместо этого ROADIES работает с случайной выборкой локусов (участков ДНК) из геномов. Звучит немного контринтуитивно, не правда ли? Как можно получить точный результат, опираясь на случайность? Однако, как показали исследования (а статья об этом опубликована в престижном PNAS — Proceedings of the National Academy of Sciences), такой подход не только работает, но и, возможно, даже лучше соответствует реальным моделям эволюции последовательностей ДНК. Главный плюс такого подхода — отпадает необходимость в аннотации генома. Представляете, сколько времени и сил это экономит? Это как если бы для приготовления сложного блюда вам больше не нужно было бы тщательно отбирать и взвешивать каждый ингредиент, а можно было бы просто взять по щепотке того и сего, и результат все равно был бы превосходным.

Во-вторых, ROADIES умеет работать с генами, которые представлены в геноме множественными копиями. Это довольно частое явление, когда один и тот же ген дублируется в процессе эволюции. Для многих старых методов это настоящая головная боль, ведь нужно как-то разобраться, какая копия какой соответствует у разных видов. ROADIES же, благодаря интеграции с разработками лаборатории другого профессора из Сан-Диего, Сиаваша Мирараба, элегантно обходит эту проблему. Это, в свою очередь, избавляет от необходимости определять ортологию — еще один трудоемкий этап.

Обзор конвейера ROADIES. (A) Входные и выходные данные ROADIES (B) Сравнение различных этапов, участвующих в выводе дерева видов в традиционных подходах и ROADIES. (C) Детальное представление различных этапов работы ROADIES и механизма сходимости. Цитирование: A. Gupta, S. Mirarab,& Y. Turakhia, Accurate, scalable, and fully automated inference of species trees from raw genome assemblies using ROADIES, Proc. Natl. Acad. Sci. U.S.A. 122 (19) e2500553122, https://doi.org/10.1073/pnas.2500553122 (2025).
Автор: A. Gupta, S. Mirarab,& Y. Turakhia Источник: www.pnas.org

В итоге, убрав два таких «узких места» — аннотацию и поиск ортологов — разработчики получили не просто быстрый и точный инструмент, но и по-настоящему автоматизированный конвейер. Он позволяет обрабатывать данные сотен геномов, получая результаты, сопоставимые по качеству с теми, что достигаются в ходе многолетних исследований экспертов, но, как говорится, «в разы быстрее». И это не просто слова: ученые уже протестировали ROADIES на таких разных группах, как плацентарные млекопитающие (да-да, мы с вами тоже тут), плодовые мушки (любимицы генетиков), птицы и даже почкующиеся дрожжи. И везде инструмент показал себя с лучшей стороны.

Зачем нам всем это нужно?

Хорошо, скажете вы, ученым стало проще, это понятно. А нам-то что с этого? А вот что:

  • Понимание эволюции: Более точные и легкодоступные филогенетические деревья углубляют наши знания о том, как развивалась жизнь на Земле, как появлялись и исчезали виды, как они приспосабливались к изменениям среды. Это фундаментальные знания, основа основ современной биологии.
  • Медицина: Сравнивая геномы близкородственных видов, можно выявлять участки, отвечающие за те или иные заболевания или, наоборот, за устойчивость к ним. Это прямой путь к разработке новых лекарств и методов лечения. Например, понимание эволюции вирусов — ключ к борьбе с пандемиями.
  • Сельское хозяйство: Изучение родственных связей культурных растений и их диких сородичей помогает выводить более урожайные и устойчивые сорта.
  • Охрана природы: Точное знание филогении помогает правильно расставлять приоритеты в сохранении биоразнообразия, ведь некоторые виды могут быть уникальными носителями древних эволюционных линий.

И это лишь несколько примеров. Доступность таких инструментов, как ROADIES, по сути, демократизирует науку. Теперь исследователи, не являющиеся узкими специалистами в биоинформатике, смогут самостоятельно проводить сложный филогенетический анализ, что, несомненно, ускорит научный прогресс во многих областях.

Оценка результатов ROADIES на наборе данных (A и B) 100 видов дрозофилид, (C и D) 363 видов птиц и (E и F) 332 видов почкующихся дрожжей (в точном режиме). (A, C и E) Филогенетическое дерево видового уровня для (A) 100 видов дрозофилид, (C) 363 видов птиц и (E) 332 почкующихся дрожжей, оцененное с помощью ROADIES. Все деревья были оценены в точном режиме ROADIES, а дерево почкующихся дрожжей — с дополнительным включением глубоких настроек. Также показано количество генов, выровненных по каждому виду (синий), и количество генов, отобранных из каждого вида (зеленый). (B, D и F) Кофилогенетические графики, сравнивающие эталонное дерево (слева) с деревом, оцененным ROADIES (справа), показанные на (B) уровне группы для 100 видов дрозофилид, (D) уровне порядка для 363 видов птиц и (F) уровне клады для 332 почкующихся дрожжей. Эталонные деревья и деревья ROADIES точно совпадают на уровне групп для видов дрозофилид. Пунктирные ветви в деревьях ROADIES показывают различия с эталонными деревьями в остальных двух случаях (D и F). Цитирование: A. Gupta, S. Mirarab,& Y. Turakhia, Accurate, scalable, and fully automated inference of species trees from raw genome assemblies using ROADIES, Proc. Natl. Acad. Sci. U.S.A. 122 (19) e2500553122, https://doi.org/10.1073/pnas.2500553122 (2025).
Автор: A. Gupta, S. Mirarab,& Y. Turakhia Источник: www.pnas.org
Что дальше? Только вперед!

Команда Ятиша Турахии не собирается останавливаться на достигнутом. В планах — дальнейшее усовершенствование ROADIES. Например, они хотят научить систему «встраивать» новые виды в уже существующие деревья, а также задействовать мощности графических процессоров (GPU), чтобы обрабатывать данные не сотен, а десятков тысяч геномов! А это уже совсем другой масштаб. Учитывая, что сейчас в мире реализуются амбициозные проекты по секвенированию геномов тысяч, а в перспективе — и всех эукариотических (то есть имеющих ядро в клетках) видов на Земле, такой инструмент будет просто незаменим.

Так что, возможно, совсем скоро построить «генеалогическое древо» для любой группы организмов станет задачей, посильной для любой хорошо оснащенной лаборатории, а не только для избранных гуру биоинформатики. И кто знает, какие удивительные открытия ждут нас за поворотом, когда мы сможем взглянуть на древо жизни с такой невероятной детализацией. Одно ясно: эволюция изучения эволюции продолжается, и ROADIES — важная веха на этом пути.

1 комментарий

stalinets
Вот бы кто нарисовал максимально подробно веточку, ведущую от мира РНК до нас, Homo Sapiens. Со всеми промежуточными стадиями, известными науке, с картинками и пояснениями. Я находил только картинки на 15-20 шагов, но знаю, что наука сейчас знает на порядок глубже.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Антикризисная сборка игрового ПК за 150 000 рублей в 2026 году

Повсеместное внедрение нейронных сетей, геополитическая турбулентность и изъятие ряда товаров из параллельного импорта рискуют превратить сборку персонального компьютера в занятие, требующее не...

Как Земля создала первые континенты: найден древний тектонический конвейер возрастом 3,5 млрд лет

Земля сильно отличается от всех известных нам планет. Главная геологическая особенность нашего мира — это разделение поверхности на два совершенно разных типа коры: тяжелую океаническую...

Как заточить нож о керамическую кружку: просто и быстро, но есть нюансы

Возможно, вы сталкивались с такой ситуацией, когда ваш нож перестаёт резать свежий хлеб или тонко нарезать помидоры, а под рукой нет ни специального камня, ни мусата, ни даже кухонной точилки. Если...

Нужно ли обслуживать механическую клавиатуру? Что для этого потребуется и сколько займет времени

Клавиатура, подобно автомобилю, со временем требует ухода: чистки и смазки. Я был убеждён, что механические свитчи практически вечны, — но реальность оказалась не столь радужной. Спустя...

Обзор кабеля USB-C Baseus Discolor 100W: Честные 100 Вт и умеренный нагрев

Кабели — самый недооценённый аксессуар в любой зарядной связке. Покупают по принципу «лишь бы был», берут первый попавшийся на маркетплейсе, а потом удивляются, почему ноутбук...

Обзор USB-тестера FNIRSI FNB-C2: Полноценный PD 3.1 EPR, E-Marker и осциллограф пульсаций с нюансами

На рынке USB-тестеров FNIRSI занимает прочные позиции благодаря соотношению цена/функциональность, и FNB-C2 — это их актуальный флагман среди компактных измерителей. Модель пришла на...