Я сделал ответ на Scifi.SE, который можно прочитать здесь . Речь идет о том, как персонажи рассказа «Парк Юрского периода» могли получить ДНК всех показанных видов.
В своем ответе я сказал следующее:
Обезьяны и люди, например, имеют более 99% общих генов. Это означает, что разница между нашими видами составляет менее 1% наших генов. На самом деле все живое на Земле имеет около 50% общих генов.
но в исходной публикации (до того, как ее кто-то отредактировал) я решил использовать слово «ДНК» вместо «гены».
Он оставил этот комментарий в разделе, чтобы объяснить редактирование:
Извините, я биолог, ничего не могу поделать. Люди и человекообразные обезьяны имеют 99% сходства в кодирующих последовательностях их ДНК, примерно 5%, которые кодируют гены, а не во всей ДНК. Я упростил это до генов для ответа.
У меня есть базовое школьное представление о ДНК и генах, поэтому я боюсь, что не вижу разницы между использованием «ДНК» и использованием «генов» в своем заявлении. Я понимаю, что гены — это определенные последовательности ДНК, которые каким-то образом используются клеткой. Я понимаю, что ДНК является более общей, включая все нити, независимо от того, используются они или нет, кодируют ли они что-то или нет.
Итак, неправильно ли тогда говорить, что обезьяны и люди имеют общую ДНК на 99%, или одинаково правильно говорить «гены»?
Итак, краткий урок молекулярной биологии.
Белки кодируются генами — хотя утверждение, что один ген кодирует один белок, не совсем верно (один ген может кодировать разные вариации одного и того же основного белка), это хороший способ подумать о вещах в этом контексте.
Гены состоят из ДНК , полимерной молекулы, из которой состоят наши хромосомы, информационная часть которых состоит из четырех «букв» (химических оснований).
Однако теперь мы подходим к ключевой части — хотя все гены состоят из ДНК, не вся ДНК хромосом составляет гены . На самом деле, как упомянул @terdon в комментарии, только около 5% (или меньше) из 4 миллиардов букв в общей ДНК — геноме — составляют гены — те последовательности, которые
непосредственно кодируют белок.
Функция остальной части генома не совсем ясна. Некоторые из них являются регуляторными, некоторые могут быть структурными и могут быть «мусорной ДНК». Однако он застрял на миллионы лет, поэтому мы предполагаем, что у него должна быть какая-то цель. Эта некодирующая ДНК различается между видами в большей степени, чем сами гены, поэтому, возможно, она каким-то образом способствует различиям между организмами.
Вот ссылки на статью о функции «мусорной» ДНК от 2013 года.
Поскольку все это началось с моего редактирования вашего вопроса, я могу также взвесить. Я дам упрощенную версию генов и транскрипции генов, есть различные детали, которые делают процесс намного сложнее, чем то, что я опишу, но они не относятся к основному вопросу здесь.
Прежде всего, как уже упоминалось, гены представляют собой определенные последовательности ДНК. Задача гена — «кодировать» белок (первое большое упрощение). Однако не все гены кодируют белок, а только те его части, которые называются экзонами ( здесь изображение немного изменено ):
Вывод из изображения выше заключается в том, что красные биты ( интроны ) удалены и не влияют на конечный белковый продукт. Итак, только часть гена кодирует белок. Интроны, как правило, гораздо менее консервативны у разных видов, чем экзоны.
Не только весь ген не кодирует белок, но и большая часть генома не содержит генов. На самом деле у человека гены составляют ~5% всей ДНК, а экзоны — ~2%.
Другим сбивающим с толку фактором являются последовательности, называемые повторяющимися элементами . Это различные типы обычно коротких последовательностей, которые существуют во многих копиях в геномах. В геноме человека ~41% состоит из повторяющихся элементов различных типов, а ~10% представляет собой копии одного такого элемента (Alu), то есть в два раза больше. как гены. Такие повторяющиеся элементы обычно не учитываются при расчете степени сходства всего генома.
С точки зрения всего их генома человек и шимпанзе очень похожи. Однако точные проценты варьируются (я видел оценки от ~ 85 до ~ 90 с чем-то) в зависимости от того, как изучаются последовательности. Чтобы быть в безопасности, вы должны сказать, что они имеют 99% сходства на генном уровне, и оставить все как есть.
Чтобы уточнить определения, ваш геном состоит из последовательностей ДНК. ДНК построена парами из четырех нуклеиновых кислот или нуклеотидов (A,G,T,C). В этой ДНК есть множество локусов , каждый из которых кодирует ген. Локусам даются имена генов, такие как SHH (sonic hedgehog), что является частью дисциплины, называемой номенклатурой генов . У людей есть две версии каждого гена, по одной от каждого родителя. Эти гены, такие как SHH, имеют различные варианты, называемые аллелями . Здесь вы, возможно, слышали термины гомозигота и гетерозигота, когда у человека есть две копии одного и того же аллеля или две разные соответственно. Возможно, вы помните, как в старшей школе говорили о серповидноклеточной анемии.
Итак, неправильно ли тогда говорить, что обезьяны и люди имеют общую ДНК на 99%, или одинаково правильно говорить «гены»?
Что ж, сходство между людьми и шимпанзе с точки зрения известной последовательности ДНК составляет около 98,8%, расхождение последовательностей довольно низкое, поэтому, по моему мнению, вы правы, говоря, что у них 99% общей ДНК. Это означает, что в 100 нуклеотидах есть примерно одно различие, например (показывает 90 оснований, сделанных с использованием случайной выборки из четырех букв в R):
Нить ДНК человека:
atgactgtagcccatga t gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt
Шимпанзе:
atgactgtagcccatga c gtaaacgtaccaagcctcctcggctgtcccgaaatagatacgcctggtagacgtattaatagtgagtaa...cgt
Сказав это, учитывая, что в человеческом геноме более 3 000 000 000 пар оснований (последовательность из 4 нуклеотидов, составляющих ДНК), это соответствует примерно 36 000 000 различных пар оснований (между людьми и шимпанзе), что, вероятно, приравнивается к большой разнице. Иногда даже полиморфизм одного нуклеотида (SNP, выраженный snip), изменение всего одной пары оснований, может привести к количественным изменениям:
мутация с одним основанием в гене АРОЕ (аполипопротеин Е) связана с более высоким риском развития болезни Альцгеймера.
Вот небольшая статья о противостоянии людей и шимпанзе . Вы также можете увидеть этот похожий пост о биологии SE .
Но редактор вашего исходного поста прав... секвенирован только эухроматический регион.
«У людей и обезьян на 99% сходство в кодирующих последовательностях их ДНК»
Эухроматиновую область часто считают частью ДНК, кодирующей белок, и она составляет 92% генома (я думаю, что это, возможно, 92% генов, но лишь небольшая часть физической ДНК).
Остальная часть, гетерохроматин, содержит несеквенированную информацию и может содержать некоторые вариации ДНК между двумя видами. В некоторых работах предполагалось, что гетерохроматин, ранее обозначаемый как «мусорная ДНК», на самом деле оказывает некоторое влияние на черты. Например, у дрозофилы были проведены исследования, показывающие влияние Y-хромосомы на признаки, несмотря на то, что Y-хромосома в основном гетерохроматична.
Далее: я думаю, что распространенным источником путаницы является использование слова «ген». Он часто используется взаимозаменяемо для обозначения аллеля или генетического локуса . Когда кто-то говорит, что люди и человекообразные обезьяны имеют общие 99% генов, они имеют в виду, что они имеют общие 99% генетических локусов. Когда кто-то говорит, что человек разделяет 50% своих генов с родителем, они имеют в виду, что они разделяют половину своих аллелей с этим родителем (это только примерно половина из-за рекомбинации и мутации). У человека есть все (за исключением генетических дефектов , таких как делеции ) те же локусы, что и у их родителей.
Большинство ответов здесь очень хорошо сосредоточены на разнице между понятиями «ДНК» и «гены». Однако идентичность последовательностей между людьми и шимпанзе не рассматривается столь строго и остается неясной из того, что было получено. Поэтому я остановлюсь на этом подробнее, чтобы осветить и первую часть вопроса.
Общая последовательность ДНК человека и шимпанзе различается примерно через каждые 100 нуклеотидов. Это не означает, что 98,5% генов являются общими. Это означает, что люди имеют около 98,5% (точнее около 98,8%, The Chimpanzee Sequencing and Analysis Consortium, 2005 ) идентичности последовательностей с шимпанзе, не считая вставок . Они рассматривали индели и нуклеотидные различия отдельно и «вычислили [d] расхождение нуклеотидов по всему геному между человеком и шимпанзе, которое составляет 1,23% », включая межгенные области и интроны — так что, очевидно, также и негенные области . Идентичность последовательности на генном уровне , по-видимому, намного больше.
Консорциум секвенирования и анализа шимпанзе также предоставляет информацию о том, как структурировано это расхождение. Основная часть (около 85% из 30–35 миллионов различных нуклеотидов) происходит от фиксированных различий : фиксированное различие — это положение в гаплоидном геноме, в котором у каждого человека есть, скажем, G, а у каждого шимпанзе — Т. Соответственно , сайт отличается между двумя видами для каждой особи соответствующего вида. Меньшая часть (около 15%) происходит из сайтов, которые являются либо вариабельными ( SNP ) у человека, либо вариабельными у шимпанзе, либо и тем, и другим (существует даже небольшое количество очень старых вариантов, т.е. общих аллелей между людьми и шимпанзе, например, см.Азеведо и др., 2015 ). Обратите внимание, что оценки становятся лучше, чем больше особей соответствующего вида секвенируется и сравнивается.
Я только что прочитал статью, в которой говорится, что даже статистика 99% технически неверна. Чтобы получить это число, им пришлось проигнорировать 25% ДНК человека и, по-моему, 18% ДНК шимпанзе. Я также предполагаю, что статистика включала только закодированную ДНК. Потому что, если то, что они привыкли называть мусорной ДНК, не то же самое, то статистика 99% за 2005 год начинает выглядеть все менее и менее точной и немного вводит в заблуждение. https://futurism.com/watch-do-we-really-share-99-our-dna-chimps/
Общая последовательность ДНК человека и шимпанзе различается примерно через каждые 100 нуклеотидов. Это не означает, что 98,5% генов являются общими. 2005) идентичность последовательности с шимпанзе, не принимая во внимание вставки. Они рассматривали вставки и различия нуклеотидов отдельно и «рассчитали [d] расхождение нуклеотидов по всему геному между человеком и шимпанзе, которое составляет 1,23%», что включает межгенные области и интроны, так что, очевидно, также не- генные регионы. Идентичность последовательностей на генном уровне, по-видимому, намного выше.
МэттДмо
тердон