Каково процентное сходство между людьми (и другими приматами) при сравнении только экзонов?

В научно-популярных книгах и статьях я часто встречаю утверждения, что люди >99% похожи друг на друга (в Википедии это 99,5%, ссылаясь на Крейга Вентера и эту статью по биологии PLOS ) и примерно на 96-99% похожи на шимпанзе или бонобо. ( Смитсоновский институт , National Geographic ). Раньше я думал, что это относится ко всему геному, но формулировка на странице Смитсоновского института, на которую я ссылаюсь, создает впечатление, что это может относиться только к генам, что также, по-видимому, имеет место в соответствии с ответами на этот пост . а у людей 99% ДНК или 99% генов? В чем разница? .

Насколько велики эти проценты при сравнении только кодирующих областей (экзонов), а не целых генов, как внутри нашего вида, так и по сравнению с другими видами, такими как приматы? И, что не менее важно, каковы эти числа, если включить весь геном со всей некодирующей ДНК?

Ответы (2)

Одна из ссылок на статью о геноме шимпанзе, на которую ссылается Максимилиан, — это «Вывод ненейтральной эволюции из трио ортологичных генов человека-шимпанзе-мыши », где авторы, похоже, сосредоточились только на экзонах:

Здесь мы применяем эволюционные тесты для идентификации генов и путей из новой коллекции из более чем 200 000 экзонных последовательностей шимпанзе, которые демонстрируют закономерности расхождения, согласующиеся с естественным отбором в линиях человека и шимпанзе.

Они заключают, что:

Возможно, лучший способ понять взаимосвязь между расхождением последовательностей ДНК и различиями между физиологией и морфологией человека и шимпанзе — это сравнить эти различия с изменчивостью среди людей. Расхождение последовательностей ДНК человека и шимпанзе примерно в 10 раз превышает расхождение между случайными парами людей.

К сожалению, они не сравнили это с кратной разницей неэкзонной ДНК, поэтому сравнительная количественная оценка между кодирующими и некодирующими областями еще предстоит определить.

Однако это прямо отвечает на вопрос, насколько велики геномные различия между особями одного и того же вида по сравнению с особями других видов при сравнении только кодирующих областей. Я также счел полезным количественно оценить различия в этих относительных показателях в дополнение к ранее указанным процентам.

В этой статье , кажется, есть соответствующие оценки расхождений человека и обезьяны. Еще раз обратите внимание, что он использует не весь геном, а отдельные области экзонов, интронов, псевдогенов и т. д. В документе о геноме шимпанзе есть хороший список пунктов в начале соответствующей статистики для вас конкретно для этого вида, то есть порядка 1% в целом. В разделе «Эволюция генов» есть некоторые конкретные числа для кодирующих последовательностей.

Для вариаций среди людей есть страница биономеров по этому вопросу, основанная на числах проекта 1000 геномов, которые дают расхождение среди людей на 0,1%.

Поправьте меня, если я что-то пропустил (не прочитал всю статью), но разве первая статья, на которую вы ссылаетесь, не использует области кодирования? Из аннотации: "...мы выбрали 53 аутосомных межгенных неповторяющихся сегмента ДНК..."
В статье о геноме шимпанзе говорится: «Когда CpG- и не-CpG-сайты рассматриваются отдельно, мы обнаруживаем, что как CpG-сайты, так и не-CpG-сайты демонстрируют заметно более низкую дивергенцию в экзонических синонимичных сайтах, чем в интронах (~50% и ~30% ниже, чем в CpG-сайтах). соответственно)." Для меня это указывает на то, что межвидовые различия в пределах экзональных областей будут меньше, чем внутри интронных областей...
... Насколько я понимаю, это связано с ограничениями выживания, налагаемыми на экзонические регионы, т. е. некоторые экзонические мутации убивают организм и не передаются потомству, в то время как мутации в неэкзонических регионах не влияют на выживание до той же степени. Это не моя область знаний, поэтому я рад услышать, если я что-то неправильно истолковал.
Первый комментарий: обратите внимание, что в таблице 5 первой статьи сравниваются расстояния между регионами кодирования. Опять же, вероятно, не лучший пример, потому что это только избранные регионы; но по моему опыту эти оценки, как правило, не сильно меняются с размером выборки.
Комментарии 2+3: Вы правы в том, что механизм более низкой скорости расхождения экзонов обусловлен отбором. Действительно, вывод функционально важных фрагментов последовательности с помощью сравнительного анализа зависит от этого; см., например, compgen.cshl.edu/~acs/phylohmm.pdf . Но это, похоже, не было частью первоначального вопроса. На эту тему имеется очень большая литература, но краткий обзор известного автора вы можете посмотреть на sciencedirect.com/science/article/pii/S0959437X02003489 . Обратите внимание, что межсайтовые вариации дивергенции также важны для белков.