Широко распространено мнение, что мы разделяем 50% нашей ДНК с бананами. Есть ли у этого реальная основа или это миф?
Пример претензии The Mirror (Великобритания) , NHGRI
Наконец, вопрос, касающийся моей номинальной области знаний. Чтобы осмысленно ответить на этот вопрос, нам нужно определить некоторые понятия, но сначала.
Да вроде. Заявление является фактически правильным для разумных интерпретаций.
Итак, по условиям.
Я дам ссылку на более конкретный стековый обмен для поддержки определений
Гомология.
Проведем аналогию: если бы кто-то сказал, что «человеческий скелет на 90% похож на птицу», будет ли это разумным утверждением? общая структура одинакова, у большинства костей есть эквиваленты, которые длиннее, короче, толще, тоньше. Кости могут иметь приспособления для силы или веса, но немного растяните и сплющите их, и вы получите что-то похожее.
Ортология
Ортологи — это гены разных видов, которые произошли от общего предка. Ортологи обычно сохраняют ту же функцию.
Паралогия
Паралоги — это дублированные гены. Одна копия может в конечном итоге сделать что-то совершенно отличное от оригинала, но сохранить некоторые общие черты.
Когда 2 гена считаются одинаковыми?
Давайте посмотрим на пример
Гистон встречается у большинства видов и очень консервативен. Он не одинаков у разных видов, но в основном одинаков.
На самом деле многие гены, необходимые нам для жизни, являются общими для многих видов . Гены для копирования ДНК, гены для восстановления клеточных стенок, гены для контроля температуры, гены для метаболизма различных сахаров . Независимо от того, человек вы или банановое растение, вам нужно много одного и того же базового механизма, чтобы жить.
Гены не полностью идентичны, но поскольку они в основном должны выполнять одну и ту же работу, и вы, скорее всего, умрете или не сможете размножаться без них, они, как правило, высоко консервативны, причем большинство различий находятся в менее важных точках генов.
Гены перемещаются, переворачиваются с места на место или меняются хромосомами, или хромосомы сливаются или разделяются, но обычно они где-то есть.
Например, вот геном мыши , окрашенный тем, какие участки имеют гомологи в геноме человека.
Все дело в том, насколько вы строго относитесь к тому, что вы считаете «общим» ДНК.
Если вы посчитаете последовательности генов с одним основанием отличными от одинаковых, то большинство людей не будут считаться очень похожими на других людей.
Если вы допускаете 1, 2, 3, 4 или более мутаций на 100 оснований, при этом считая что-то «одинаковым», то вы можете получить почти любой процент, какой захотите.
Вот почему я сказал "вроде" выше.
Я мог бы дать ссылку на какой-нибудь документ, где они дают какой-то номер, но это было бы не очень информативно. Я мог бы указать еще на 3, которые дают разные числа для одного и того же объекта, потому что все дело в том, где вы устанавливаете точки отсечки, когда решаете, считать ли что-то одинаковым.
Утверждение о том, что мы разделяем 50% нашей ДНК , вероятно, неверно цитирует более старое утверждение о том, что мы разделяем 50% наших генов с бананами. Оба утверждения, насколько я могу судить, ложны. Я рассмотрю каждую претензию по очереди.
Идея о том, что мы разделяем 50% нашей ДНК, по наиболее очевидным определениям того, что это может означать, совершенно ложна и тривиальна. Согласно Википедии , длина генома человека составляет примерно 3 гигапары оснований. С другой стороны, геном банана ( Musa Acuminata ) составляет лишь около одной пятой от этой длины — 600 Мб, согласно ProMusa , или всего 520 Мб, согласно первой публикации эталонного генома в 2012 году .
Очевидно, что мы не можем сопоставить срезы одной копии генома банана с геномом человека и сделать так, чтобы они покрывали 50% его длины, потому что для этого недостаточно даже пар оснований!
Откуда же тогда это утверждение? Биоинформатик Нил Сондерс попытался найти ответ и описал свои выводы в блоге, озаглавленном « 50% бананов » . Самый старый источник, который он смог найти, — это интервью со Стивом Джонсом в эпизоде «Почти как кит » научного шоу на радио ABC 12 января 2002 г.), за целое десятилетие до публикации генома первого банана.
Стив не обосновывает утверждение в интервью, и оно происходит в контексте шутки о том, как геномно похожие организмы могут сильно отличаться друг от друга:
... мы также разделяем около 50% нашей ДНК с бананами, и это не делает нас наполовину бананами, ни выше талии, ни ниже талии. Таким образом, есть ограничения в том, что генетика может рассказать нам о том, что значит быть человеком...
Более того, незадолго до этого интервью другие источники утверждали, что у нас 50% общих генов с бананами. Вот источник этого заявления от апреля 2001 года: https://www.pbs.org/wgbh/nova/genome/deco_lander.html *. Поэтому, хотя мы не можем быть уверены, на чем основывался Стив, мы можем предположить , что он просто случайно неверно процитировал это похожее утверждение, шутя в радиоинтервью.
Но как насчет этого альтернативного утверждения?
Ответ Мерфи предполагает, что разумно вместо этого принять утверждение, что мы «на 50% разделяем нашу ДНК» с бананами, как означающее, что 50% из десятков тысяч генов человека имеют гомологи в генах бананов. Более того, самый старый источник, который я могу отследить для любого варианта заявления о «50% бананов» — ранее связанное интервью 2001 года с доктором Эриком Ландером , в котором интервьюер , научный журналист Роберт Крулвич, поднимает эту тему — говорит, что мы разделяем 50% наших генов, а не 50% нашей ДНК. Итак, верен ли этот вариант утверждения?
Насколько я могу судить, нет. По крайней мере, это сомнительно, и я не могу найти этому никакого обоснования.
Как отмечалось ранее, геном банана не был секвенирован до 2012 года, однако это заявление датируется как минимум 2001 годом, поэтому оно было сделано без доступа к имеющимся у нас данным. А Нил Сондерс в своем блоге «50% бананов» попытался использовать Orthologous Matrix Browser — общедоступный инструмент для поиска ортологов генов — для поиска ортологов человеческих генов в геноме банана. Он сообщает , что он находит только около 3500 человеческих генов с такими ортологами. (В частности, 3440 — я получаю немного другое число, возможно, из-за изменений в алгоритме OMB.)
Вы можете воспроизвести результат Нила самостоятельно, введя HUMAN и MUSAM (соответствует Musa acuminata , научному названию бананов) на странице https://omabrowser.org/oma/genomePW/ и нажмите «получить пары». OMB возвращает TSV пар ортологов с идентификатором человеческого гена слева и соответствующим банановым геном справа. Как отмечает Нейл, если мы подсчитаем количество перечисленных уникальных идентификаторов генов человека, то получим общее количество человеческих генов, которые, по мнению алгоритма OMB, имеют хотя бы один ортолог в геноме банана. Такой подсчет показан ниже в Python:
>>> import requests
>>> result_tsv = requests.get('https://omabrowser.org/cgi-bin/gateway.pl?f=PairwiseOrthologs&p1=HUMAN&p2=MUSAM&p3=OMA').text
>>> unique_human_gene_names = {line.split('\t')[0] for line in result_tsv.splitlines()}
>>> len(unique_human_gene_names)
3484
Он отмечает, что это,
учитывая, что существует двадцать тысяч генов, кодирующих человеческий белок, это соответствует примерно «17% банана».
Конечно, OMB просто использует алгоритм, чтобы попытаться найти ортологи, просматривая эталонные последовательности. Может быть какой-то оправданный альтернативный подход, который дает другой результат. Но если и так, то я не смог его найти; единственная известная мне попытка проверить утверждение о 50% в свете опубликованных эталонных геномов — это попытка Нила, и его метод, по крайней мере, ясно показывает, что утверждение ложно.
* Я написал профессору Ландеру по электронной почте, чтобы узнать, помнит ли он первоисточник, из которого он услышал утверждение. Увы, нет. Он предположил, что это могут быть семейства генов, к которым изначально относилось утверждение, а не гены.
Т. Сар
Джейсон С
Джейсон С
Мерфи
Бакуриу
Мерфи
Март Хо
Нельсон
Марк Эмери
Фредсбенд