Имеют ли обезьяны и люди общие 99% ДНК или 99% генов? В чем разница?

Я сделал ответ на Scifi.SE, который можно прочитать здесь . Речь идет о том, как персонажи рассказа «Парк Юрского периода» могли получить ДНК всех показанных видов.

В своем ответе я сказал следующее:

Обезьяны и люди, например, имеют более 99% общих генов. Это означает, что разница между нашими видами составляет менее 1% наших генов. На самом деле все живое на Земле имеет около 50% общих генов.

но в исходной публикации (до того, как ее кто-то отредактировал) я решил использовать слово «ДНК» вместо «гены».

Он оставил этот комментарий в разделе, чтобы объяснить редактирование:

Извините, я биолог, ничего не могу поделать. Люди и человекообразные обезьяны имеют 99% сходства в кодирующих последовательностях их ДНК, примерно 5%, которые кодируют гены, а не во всей ДНК. Я упростил это до генов для ответа.

У меня есть базовое школьное представление о ДНК и генах, поэтому я боюсь, что не вижу разницы между использованием «ДНК» и использованием «генов» в своем заявлении. Я понимаю, что гены — это определенные последовательности ДНК, которые каким-то образом используются клеткой. Я понимаю, что ДНК является более общей, включая все нити, независимо от того, используются они или нет, кодируют ли они что-то или нет.

Итак, неправильно ли тогда говорить, что обезьяны и люди имеют общую ДНК на 99%, или одинаково правильно говорить «гены»?

В целом я доверяю тому, что говорит @terdon, он довольно разносторонний человек. При этом я был бы немного более педантичным и сказал бы, что обезьяны и люди разделяют более 99% кодирующих последовательностей (или ДНК) в наших генах, прямо в ответ, но это только я. Технически неверно говорить, что у нас общая ДНК на 99%, по причинам, которые я объясню ниже...
@MattDMo да, я не хотел использовать «последовательность кодирования», так как думал, что это слишком технично для другого сайта. Я просто достаточно педантичен, чтобы не позволить «99% ДНК» оставаться безнаказанным :).

Ответы (6)

Итак, краткий урок молекулярной биологии.

  • Белки — это то, что составляет значительную часть наших клеток (которые составляют значительную часть от нас ), и это то, что выполняет работу клеток — многие из них являются катализаторами и известны как «ферменты».
  • Белки кодируются генами — хотя утверждение, что один ген кодирует один белок, не совсем верно (один ген может кодировать разные вариации одного и того же основного белка), это хороший способ подумать о вещах в этом контексте.

  • Гены состоят из ДНК , полимерной молекулы, из которой состоят наши хромосомы, информационная часть которых состоит из четырех «букв» (химических оснований).

  • Однако теперь мы подходим к ключевой части — хотя все гены состоят из ДНК, не вся ДНК хромосом составляет гены . На самом деле, как упомянул @terdon в комментарии, только около 5% (или меньше) из 4 миллиардов букв в общей ДНК — геноме — составляют гены — те последовательности, которые
    непосредственно кодируют белок.

  • Функция остальной части генома не совсем ясна. Некоторые из них являются регуляторными, некоторые могут быть структурными и могут быть «мусорной ДНК». Однако он застрял на миллионы лет, поэтому мы предполагаем, что у него должна быть какая-то цель. Эта некодирующая ДНК различается между видами в большей степени, чем сами гены, поэтому, возможно, она каким-то образом способствует различиям между организмами.


От AndroidPenguin

Вот ссылки на статью о функции «мусорной» ДНК от 2013 года.

  1. Резюме в NY Times

  2. Абстракция в природе

  3. КОДИРОВАТЬ темы на nature.com

Примечание: материал ENCODE о хламе в лучшем случае спорен, а в большей степени был (признан консорциумом) чистой рекламой; его не было в рецензируемой статье, исследователи мусорной ДНК считают его чушью, и его не следует рассматривать как действительную ссылку.

Поскольку все это началось с моего редактирования вашего вопроса, я могу также взвесить. Я дам упрощенную версию генов и транскрипции генов, есть различные детали, которые делают процесс намного сложнее, чем то, что я опишу, но они не относятся к основному вопросу здесь.

Прежде всего, как уже упоминалось, гены представляют собой определенные последовательности ДНК. Задача гена — «кодировать» белок (первое большое упрощение). Однако не все гены кодируют белок, а только те его части, которые называются экзонами ( здесь изображение немного изменено ):

введите описание изображения здесь

Вывод из изображения выше заключается в том, что красные биты ( интроны ) удалены и не влияют на конечный белковый продукт. Итак, только часть гена кодирует белок. Интроны, как правило, гораздо менее консервативны у разных видов, чем экзоны.

Не только весь ген не кодирует белок, но и большая часть генома не содержит генов. На самом деле у человека гены составляют ~5% всей ДНК, а экзоны — ~2%.

Другим сбивающим с толку фактором являются последовательности, называемые повторяющимися элементами . Это различные типы обычно коротких последовательностей, которые существуют во многих копиях в геномах. В геноме человека ~41% состоит из повторяющихся элементов различных типов, а ~10% представляет собой копии одного такого элемента (Alu), то есть в два раза больше. как гены. Такие повторяющиеся элементы обычно не учитываются при расчете степени сходства всего генома.

С точки зрения всего их генома человек и шимпанзе очень похожи. Однако точные проценты варьируются (я видел оценки от ~ 85 до ~ 90 с чем-то) в зависимости от того, как изучаются последовательности. Чтобы быть в безопасности, вы должны сказать, что они имеют 99% сходства на генном уровне, и оставить все как есть.

Спасибо за подробности. Теперь, закончив свой первый курс биологии на уровне колледжа, я понимаю большую часть этого, когда я очень мало понимал, когда вы впервые ответили. +1 но я не дал вам выбор, потому что Мэтт был лучше по простоте и организации мыслей.

Чтобы уточнить определения, ваш геном состоит из последовательностей ДНК. ДНК построена парами из четырех нуклеиновых кислот или нуклеотидов (A,G,T,C). В этой ДНК есть множество локусов , каждый из которых кодирует ген. Локусам даются имена генов, такие как SHH (sonic hedgehog), что является частью дисциплины, называемой номенклатурой генов . У людей есть две версии каждого гена, по одной от каждого родителя. Эти гены, такие как SHH, имеют различные варианты, называемые аллелями . Здесь вы, возможно, слышали термины гомозигота и гетерозигота, когда у человека есть две копии одного и того же аллеля или две разные соответственно. Возможно, вы помните, как в старшей школе говорили о серповидноклеточной анемии.

Итак, неправильно ли тогда говорить, что обезьяны и люди имеют общую ДНК на 99%, или одинаково правильно говорить «гены»?

Что ж, сходство между людьми и шимпанзе с точки зрения известной последовательности ДНК составляет около 98,8%, расхождение последовательностей довольно низкое, поэтому, по моему мнению, вы правы, говоря, что у них 99% общей ДНК. Это означает, что в 100 нуклеотидах есть примерно одно различие, например (показывает 90 оснований, сделанных с использованием случайной выборки из четырех букв в R):

Нить ДНК человека:

atgactgtagcccatga t gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt

Шимпанзе:

atgactgtagcccatga c gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt

Сказав это, учитывая, что в человеческом геноме более 3 000 000 000 пар оснований (последовательность из 4 нуклеотидов, составляющих ДНК), это соответствует примерно 36 000 000 различных пар оснований (между людьми и шимпанзе), что, вероятно, приравнивается к большой разнице. Иногда даже полиморфизм одного нуклеотида (SNP, выраженный snip), изменение всего одной пары оснований, может привести к количественным изменениям:

мутация с одним основанием в гене АРОЕ (аполипопротеин Е) связана с более высоким риском развития болезни Альцгеймера.

Вот небольшая статья о противостоянии людей и шимпанзе . Вы также можете увидеть этот похожий пост о биологии SE .

Но редактор вашего исходного поста прав... секвенирован только эухроматический регион.

«У людей и обезьян на 99% сходство в кодирующих последовательностях их ДНК»

Эухроматиновую область часто считают частью ДНК, кодирующей белок, и она составляет 92% генома (я думаю, что это, возможно, 92% генов, но лишь небольшая часть физической ДНК).

Остальная часть, гетерохроматин, содержит несеквенированную информацию и может содержать некоторые вариации ДНК между двумя видами. В некоторых работах предполагалось, что гетерохроматин, ранее обозначаемый как «мусорная ДНК», на самом деле оказывает некоторое влияние на черты. Например, у дрозофилы были проведены исследования, показывающие влияние Y-хромосомы на признаки, несмотря на то, что Y-хромосома в основном гетерохроматична.


Далее: я думаю, что распространенным источником путаницы является использование слова «ген». Он часто используется взаимозаменяемо для обозначения аллеля или генетического локуса . Когда кто-то говорит, что люди и человекообразные обезьяны имеют общие 99% генов, они имеют в виду, что они имеют общие 99% генетических локусов. Когда кто-то говорит, что человек разделяет 50% своих генов с родителем, они имеют в виду, что они разделяют половину своих аллелей с этим родителем (это только примерно половина из-за рекомбинации и мутации). У человека есть все (за исключением генетических дефектов , таких как делеции ) те же локусы, что и у их родителей.

Большинство ответов здесь очень хорошо сосредоточены на разнице между понятиями «ДНК» и «гены». Однако идентичность последовательностей между людьми и шимпанзе не рассматривается столь строго и остается неясной из того, что было получено. Поэтому я остановлюсь на этом подробнее, чтобы осветить и первую часть вопроса.

Общая последовательность ДНК человека и шимпанзе различается примерно через каждые 100 нуклеотидов. Это не означает, что 98,5% генов являются общими. Это означает, что люди имеют около 98,5% (точнее около 98,8%, The Chimpanzee Sequencing and Analysis Consortium, 2005 ) идентичности последовательностей с шимпанзе, не считая вставок . Они рассматривали индели и нуклеотидные различия отдельно и «вычислили [d] расхождение нуклеотидов по всему геному между человеком и шимпанзе, которое составляет 1,23% », включая межгенные области и интроны — так что, очевидно, также и негенные области . Идентичность последовательности на генном уровне , по-видимому, намного больше.

Консорциум секвенирования и анализа шимпанзе также предоставляет информацию о том, как структурировано это расхождение. Основная часть (около 85% из 30–35 миллионов различных нуклеотидов) происходит от фиксированных различий : фиксированное различие — это положение в гаплоидном геноме, в котором у каждого человека есть, скажем, G, а у каждого шимпанзе — Т. Соответственно , сайт отличается между двумя видами для каждой особи соответствующего вида. Меньшая часть (около 15%) происходит из сайтов, которые являются либо вариабельными ( SNP ) у человека, либо вариабельными у шимпанзе, либо и тем, и другим (существует даже небольшое количество очень старых вариантов, т.е. общих аллелей между людьми и шимпанзе, например, см.Азеведо и др., 2015 ). Обратите внимание, что оценки становятся лучше, чем больше особей соответствующего вида секвенируется и сравнивается.

Я только что прочитал статью, в которой говорится, что даже статистика 99% технически неверна. Чтобы получить это число, им пришлось проигнорировать 25% ДНК человека и, по-моему, 18% ДНК шимпанзе. Я также предполагаю, что статистика включала только закодированную ДНК. Потому что, если то, что они привыкли называть мусорной ДНК, не то же самое, то статистика 99% за 2005 год начинает выглядеть все менее и менее точной и немного вводит в заблуждение. https://futurism.com/watch-do-we-really-share-99-our-dna-chimps/

Это не только кодирующая ДНК, но и вся некодирующая ДНК. Кроме того, в публикации, в которой упоминается идентичность последовательностей на 98,8%, подробно упоминается, что это не связано со структурными различиями (вставки и т. д.), поскольку эти различия не могут быть легко определены количественно. Однако они также охватывают структурные различия в статье.

Общая последовательность ДНК человека и шимпанзе различается примерно через каждые 100 нуклеотидов. Это не означает, что 98,5% генов являются общими. 2005) идентичность последовательности с шимпанзе, не принимая во внимание вставки. Они рассматривали вставки и различия нуклеотидов отдельно и «рассчитали [d] расхождение нуклеотидов по всему геному между человеком и шимпанзе, которое составляет 1,23%», что включает межгенные области и интроны, так что, очевидно, также не- генные регионы. Идентичность последовательностей на генном уровне, по-видимому, намного выше.

Я чувствую, что математика здесь не работает. Как 100 нуклеотидов могут составлять 1,23% всей последовательности?