У людей 50% ДНК совпадает с бананами?

Широко распространено мнение, что мы разделяем 50% нашей ДНК с бананами. Есть ли у этого реальная основа или это миф?

Пример претензии The Mirror (Великобритания) , NHGRI

Ответы (2)

Наконец, вопрос, касающийся моей номинальной области знаний. Чтобы осмысленно ответить на этот вопрос, нам нужно определить некоторые понятия, но сначала.

Да вроде. Заявление является фактически правильным для разумных интерпретаций.

Итак, по условиям.

Я дам ссылку на более конкретный стековый обмен для поддержки определений

Гомология.

Проведем аналогию: если бы кто-то сказал, что «человеческий скелет на 90% похож на птицу», будет ли это разумным утверждением? общая структура одинакова, у большинства костей есть эквиваленты, которые длиннее, короче, толще, тоньше. Кости могут иметь приспособления для силы или веса, но немного растяните и сплющите их, и вы получите что-то похожее.

гомология

Ортология

Ортологи — это гены разных видов, которые произошли от общего предка. Ортологи обычно сохраняют ту же функцию.

Паралогия

Паралоги — это дублированные гены. Одна копия может в конечном итоге сделать что-то совершенно отличное от оригинала, но сохранить некоторые общие черты.введите описание изображения здесь

Когда 2 гена считаются одинаковыми?

Давайте посмотрим на пример

Гистон H1

Гистон встречается у большинства видов и очень консервативен. Он не одинаков у разных видов, но в основном одинаков.

гистон

На самом деле многие гены, необходимые нам для жизни, являются общими для многих видов . Гены для копирования ДНК, гены для восстановления клеточных стенок, гены для контроля температуры, гены для метаболизма различных сахаров . Независимо от того, человек вы или банановое растение, вам нужно много одного и того же базового механизма, чтобы жить.

Гены не полностью идентичны, но поскольку они в основном должны выполнять одну и ту же работу, и вы, скорее всего, умрете или не сможете размножаться без них, они, как правило, высоко консервативны, причем большинство различий находятся в менее важных точках генов.

Гены перемещаются, переворачиваются с места на место или меняются хромосомами, или хромосомы сливаются или разделяются, но обычно они где-то есть.

Например, вот геном мыши , окрашенный тем, какие участки имеют гомологи в геноме человека.

геном мыши

Все дело в том, насколько вы строго относитесь к тому, что вы считаете «общим» ДНК.

Если вы посчитаете последовательности генов с одним основанием отличными от одинаковых, то большинство людей не будут считаться очень похожими на других людей.

Если вы допускаете 1, 2, 3, 4 или более мутаций на 100 оснований, при этом считая что-то «одинаковым», то вы можете получить почти любой процент, какой захотите.

Вот почему я сказал "вроде" выше.

Я мог бы дать ссылку на какой-нибудь документ, где они дают какой-то номер, но это было бы не очень информативно. Я мог бы указать еще на 3, которые дают разные числа для одного и того же объекта, потому что все дело в том, где вы устанавливаете точки отсечки, когда решаете, считать ли что-то одинаковым.

Это действительно хороший ответ - он информативный, содержит ссылки и хорошо объясняет предмет. Некоторым это понравится, так как это не совсем обычный формат (одна или две статьи по теме), но мне все равно нравится. +1 от меня!
Та диаграмма, которую вы показываете, изображает гомологов мыши/человека с цветовой кодировкой; у этого типа диаграммы есть имя?
О, подождите, неважно; cinteny.cchmc.org генерирует их и, похоже, называет их «картами синтении». К сожалению, в их базе данных нет бананов, но есть рис. Я сделал это , но я не уверен, какие параметры они использовали для создания мыши / человека.
Да, это звучит примерно так. С очень отдаленно связанными видами вам нужно ограничить его экзонами и принять гораздо больше несоответствий, чтобы получить разумную степень синтении. Глядя на их диаграмму/карту синтении человека и мыши, видно, что у них немного более строгие параметры по умолчанию, чем те, которые использовались для создания диаграммы, которую я включил в свой пост.
Мне любопытно: а как насчет негенетической ДНК? Большая часть ДНК на самом деле вообще не содержит генов. Тогда насколько сильно различаются эти фрагменты ДНК между видами? Являются ли они сильно изменчивыми или стабильными?
@Bakuriu Не генетический? ты имеешь в виду без кодирования? интроны? секции, не подвергающиеся селективному давлению? некоторые области нашей ДНК, по-видимому, не подвергаются селективному давлению, мутации/изменения в этих областях не отбираются из популяции, предполагая, что если они что-то делают, их фактическая последовательность не важна настолько, чтобы иметь эффект от того, насколько велика вероятность того, что человек выживет. В этих областях, как правило, существуют огромные различия даже между особями одного и того же вида.
Не лучше ли этот ответ сформулировать так: «У людей 50% общих генов с бананами»? Из карты синтении с рисом становится ясно, что утверждение о «50% ДНК» ложно.
@MarchHo, к сожалению, плохо информированное население и средства массовой информации с готовностью обмениваются словами и действительно все портят. Я слышал, что люди используют эти два термина как синонимы...
Вы говорите, что это верно при «разумных интерпретациях», но при этом не предлагаете никакой такой интерпретации. Да, есть много способов измерить процент ДНК, общей для двух видов. Но есть ли какой- нибудь разумный способ, который выходит на 50%? Вы даже не пытаетесь показать, что здесь есть.
Является ли этот график гомологии мыши/человека указанием на то, что гены в Y-хромосоме человека не обнаружены в Y-хромосоме мыши? Почему так, учитывая все остальные совпадения?

Утверждение о том, что мы разделяем 50% нашей ДНК , вероятно, неверно цитирует более старое утверждение о том, что мы разделяем 50% наших генов с бананами. Оба утверждения, насколько я могу судить, ложны. Я рассмотрю каждую претензию по очереди.

50% нашей ДНК ?

Идея о том, что мы разделяем 50% нашей ДНК, по наиболее очевидным определениям того, что это может означать, совершенно ложна и тривиальна. Согласно Википедии , длина генома человека составляет примерно 3 гигапары оснований. С другой стороны, геном банана ( Musa Acuminata ) составляет лишь около одной пятой от этой длины — 600 Мб, согласно ProMusa , или всего 520 Мб, согласно первой публикации эталонного генома в 2012 году .

Очевидно, что мы не можем сопоставить срезы одной копии генома банана с геномом человека и сделать так, чтобы они покрывали 50% его длины, потому что для этого недостаточно даже пар оснований!

Откуда же тогда это утверждение? Биоинформатик Нил Сондерс попытался найти ответ и описал свои выводы в блоге, озаглавленном « 50% бананов » . Самый старый источник, который он смог найти, — это интервью со Стивом Джонсом в эпизоде ​​«Почти как кит » научного шоу на радио ABC 12 января 2002 г.), за целое десятилетие до публикации генома первого банана.

Стив не обосновывает утверждение в интервью, и оно происходит в контексте шутки о том, как геномно похожие организмы могут сильно отличаться друг от друга:

... мы также разделяем около 50% нашей ДНК с бананами, и это не делает нас наполовину бананами, ни выше талии, ни ниже талии. Таким образом, есть ограничения в том, что генетика может рассказать нам о том, что значит быть человеком...

Более того, незадолго до этого интервью другие источники утверждали, что у нас 50% общих генов с бананами. Вот источник этого заявления от апреля 2001 года: https://www.pbs.org/wgbh/nova/genome/deco_lander.html *. Поэтому, хотя мы не можем быть уверены, на чем основывался Стив, мы можем предположить , что он просто случайно неверно процитировал это похожее утверждение, шутя в радиоинтервью.

Но как насчет этого альтернативного утверждения?


50% наших генов ?

Ответ Мерфи предполагает, что разумно вместо этого принять утверждение, что мы «на 50% разделяем нашу ДНК» с бананами, как означающее, что 50% из десятков тысяч генов человека имеют гомологи в генах бананов. Более того, самый старый источник, который я могу отследить для любого варианта заявления о «50% бананов» — ранее связанное интервью 2001 года с доктором Эриком Ландером , в котором интервьюер , научный журналист Роберт Крулвич, поднимает эту тему — говорит, что мы разделяем 50% наших генов, а не 50% нашей ДНК. Итак, верен ли этот вариант утверждения?

Насколько я могу судить, нет. По крайней мере, это сомнительно, и я не могу найти этому никакого обоснования.

Как отмечалось ранее, геном банана не был секвенирован до 2012 года, однако это заявление датируется как минимум 2001 годом, поэтому оно было сделано без доступа к имеющимся у нас данным. А Нил Сондерс в своем блоге «50% бананов» попытался использовать Orthologous Matrix Browser — общедоступный инструмент для поиска ортологов генов — для поиска ортологов человеческих генов в геноме банана. Он сообщает , что он находит только около 3500 человеческих генов с такими ортологами. (В частности, 3440 — я получаю немного другое число, возможно, из-за изменений в алгоритме OMB.)

Вы можете воспроизвести результат Нила самостоятельно, введя HUMAN и MUSAM (соответствует Musa acuminata , научному названию бананов) на странице https://omabrowser.org/oma/genomePW/ и нажмите «получить пары». OMB возвращает TSV пар ортологов с идентификатором человеческого гена слева и соответствующим банановым геном справа. Как отмечает Нейл, если мы подсчитаем количество перечисленных уникальных идентификаторов генов человека, то получим общее количество человеческих генов, которые, по мнению алгоритма OMB, имеют хотя бы один ортолог в геноме банана. Такой подсчет показан ниже в Python:

>>> import requests
>>> result_tsv = requests.get('https://omabrowser.org/cgi-bin/gateway.pl?f=PairwiseOrthologs&p1=HUMAN&p2=MUSAM&p3=OMA').text
>>> unique_human_gene_names = {line.split('\t')[0] for line in result_tsv.splitlines()}
>>> len(unique_human_gene_names)
3484

Он отмечает, что это,

учитывая, что существует двадцать тысяч генов, кодирующих человеческий белок, это соответствует примерно «17% банана».

Конечно, OMB просто использует алгоритм, чтобы попытаться найти ортологи, просматривая эталонные последовательности. Может быть какой-то оправданный альтернативный подход, который дает другой результат. Но если и так, то я не смог его найти; единственная известная мне попытка проверить утверждение о 50% в свете опубликованных эталонных геномов — это попытка Нила, и его метод, по крайней мере, ясно показывает, что утверждение ложно.


* Я написал профессору Ландеру по электронной почте, чтобы узнать, помнит ли он первоисточник, из которого он услышал утверждение. Увы, нет. Он предположил, что это могут быть семейства генов, к которым изначально относилось утверждение, а не гены.

«результат, который вы можете тривиально подтвердить» Запустить ваш код тривиально. Подтвердить, делает ли ваш код что-то значимое или что полученные данные имеют смысл, не так уж и просто.
@Oddthinking Если вы не доверяете этому конкретному коду (или мне, или цитируемому источнику), просто подсчитайте уникальные гены каким-либо другим способом. Все, что он делает, это подсчитывает количество уникальных элементов в одном столбце TSV. Я согласен с тем, что подтверждение того, что полученные данные имеют смысл, является более сложной проблемой.
Подсчет уникальных элементов в одном столбце TSV тривиален (для разработчика Python). Но вы не продемонстрировали, что подсчет уникальных элементов в этом столбце является осмысленным способом подсчета генов, и это не следует отбрасывать с помощью маханья рукой «тривиально».
@Oddthinking Это разумная критика. Я изменю ответ, чтобы предоставить больше обоснования для метода.
@Oddthinking Я немного подправил пост в свете вашей критики. В частности, я сделал две вещи: немного конкретизировал свое объяснение подхода к подсчету ортологов и немного смягчил утверждение о том, что вариант утверждения «50% генов» является ложным (поскольку все, что я действительно могу сказать в оправдание, это что алгоритм OMB, который пытается идентифицировать ортологов, дает совсем другой результат; я не знаю, нет ли надежной методологии, которая дала бы другой результат).