Почему в ДНК ровно четыре азотистых основания?

Кто-нибудь знает, почему ДНК состоит из четырех азотистых оснований? В частности, есть ли объяснение номеру? Почему четыре, а не два или восемь?

это только в том, что два новых основания, добавленные к кишечной палочке (X и Y), действительно воспроизводятся. wired.com/2014/05/synthetic-dna-cells не ясно, насколько необходима адаптация, чтобы заставить X и Y работать для кодирования генов.

Ответы (7)

В удаленном ответе это объясняется аргументом, основанным на кодировании аминокислот в кодонах, но, как указал Конрад Рудольф в комментарии, аргументы, основанные на кодонах, не могут быть правильными, потому что система с 4 основаниями, вероятно, предшествует эволюции белковая трансляция.

Так почему четыре?

Я предполагаю, что это происходит из-за комбинации факторов, которые делают его «в самый раз» подходящим для репликаторов на основе РНК: больше было бы плохо, и меньше тоже было бы плохо. Четыре основания могут копироваться с высокой надежностью, потому что две функции объединяются, чтобы исключить неправильное спаривание: есть два класса размера, что означает, что любое пурин-пуриновое или пиримидин-пиримидиновое спаривание приводит к неправильному разделению между цепями, исключая связи AG и CU; и есть два класса, основанные на количестве ОН-связей, что ограничивает потенциал для связей AC и GU. Большее количество оснований неизбежно должно ослабить силу этих исключительных подходов и увеличить количество ошибочных пар. Репликаторам мира РНК не хватает сложных механизмов исправления и проверки ошибок современных форм жизни, поэтому это увеличение неправильного спаривания, вероятно, не будет исправлено.

Конечно, система с двумя базами была бы еще более способна уменьшить количество ошибок. Я предполагаю, что преимущество системы с четырьмя основаниями заключается в том, что она позволяет формировать гораздо более сложную трехмерную структуру в РНК и, таким образом, обеспечивает более широкий диапазон каталитических возможностей. Я рассматривал только четные числа, потому что только системы с четными номерами могли использовать стиль спаривания оснований Уотсона-Крика.

Я также предлагаю прочитать статью Эёрса Сатмари 2003 года по этому вопросу.

Приложение

Группа из Калифорнии только что опубликовала статью, в которой они успешно добавили в ДНК третью пару оснований. Я думаю, что это могло бы пролить свет на то, почему четыре — вы можете прочитать об этом здесь или получить полную статью здесь (природа, так что платите за стену).

Вот возможный ответ, данный в этой статье:

http://www.ncbi.nlm.nih.gov/pubmed/16794952
или http://www.math.unl.edu/~bdeng1/Papers/DengDNAreplication.pdf

Это дает дарвиновское объяснение этому вопросу. Он подходит к проблеме из теории коммуникации Клода Шеннона. Он рассматривает репликацию ДНК концептуально и математически так же, как передачу данных. Он заключает, что система из четырех оснований, а не из двух и не из шести, воспроизводит большую часть генетической информации за кратчайшее время.

Коммуникативная аналогия выглядит следующим образом. Если у вас есть две системы передачи данных, одна может передавать, скажем, 1 МБ в секунду, а другая может передавать 2 МБ в секунду, но стоит менее чем в два раза дороже. Ответ очевиден: вы купите вторую услугу по более высокой цене. Службе передачи данных не важно, какую информацию вы потребляете — это может быть спам, видео, аудио и т. д. Значение имеет только скорость передачи. Что касается репликации ДНК, то она похожа на канал передачи данных, когда одно основание реплицируется один раз по шаблону материнской ДНК. Ему также все равно, идет ли речь о геноме бактерии, растения или генома животного. Окупаемость — в информации, а цена — во времени. В отличие от ваших абиотических коммуникативных разновидностей, время является и отправителем, и получателем всех сообщений жизни. а различные формы жизни или виды — просто мобильные телефоны времени. Таким образом, если одна система может воспроизвести больше информации в единицу времени, чем другая, тем быстрее она выиграет в эволюционной гонке вооружений. Жертва, работающая на медленной репликаторной системе, не сможет ни конкурировать, ни адаптироваться к хищнику, работающему на быстрой.

Теперь, поскольку пара AT имеет только две слабые водородные связи, а пара CG имеет три, A и T требуется меньше времени для полного дублирования, чем C и G. Хотя время репликации составляет несколько наносекунд, но это время быстро увеличивается для геномов с парами оснований, исчисляемыми миллиардами. Таким образом, наличие пары CG может замедлить репликацию, но выигрыш заключается в информации. Одна базовая пара дает вам 1 бит на базовую информацию. Две пары дают вам 2 бита на базовую информацию. Но наличие большего количества пар оснований может в конечном итоге привести к уменьшению отдачи в скорости репликации информации, если для репликации новых оснований требуется слишком много времени. Отсюда рассмотрение оптимальной скорости репликации, измеряемой в информационных битах на базу за время. Без информации не было бы разнообразия, сложности.

Используя простой расчет скорости передачи/репликации Шеннона, вы можете рассчитать среднюю скорость для AT-системы, CG-системы, ATCG-системы и для некоторых гипотетических 6-базовых, 2n-базовых систем, новые базы которых занимают все больше времени. время повторить. Анализ показывает, что ATCG-система имеет оптимальную скорость репликации, если для репликации оснований CG требуется в 1,65–3 раза больше времени, чем для репликации оснований AT. То есть система base-2 реплицирует свои базы быстрее, но не несет больше информации, чтобы иметь более высокую скорость передачи данных. Точно так же система с основанием 6 имеет больше информации для каждой базы, но в среднем реплицирует медленнее, что в конечном итоге приводит к неоптимальной скорости передачи данных.

Скорость репликации ДНК

Согласно сравнению из статьи, система с основанием 4 примерно на 40% быстрее, чем система только A-T, и на 133% быстрее, чем система только G-C. Предположим, что жизнь на Земле зародилась около 4 миллиардов лет назад, тогда система только AT отбросила бы эволюцию на 1 миллиард лет, а система GC — на 2,3 миллиарда лет. Для гипотетической системы с основанием 6 это произойдет к 80 миллионам лет. Другими словами, жизнь там, где она должна быть, потому что система с основанием 4 способна передавать информацию через узкое место во времени с оптимальной скоростью передачи данных.

В заключение, жизнь состоит в том, чтобы воспроизводить как можно больше информации за кратчайшее время, и система с основанием 4 делает это лучше всего. Если бы когда-либо существовали другие системы, они бы с самого начала проиграли информационную конкуренцию системе с основанием 4. Принцип Дарвина работает на самом базовом и самом важном уровне жизни.

Есть и другие объяснения, все не дарвиновские. Большинство основано на молекулярной структуре основания. Но эти типы объяснений граничат с круговым аргументом — использование наблюдений для объяснения самих себя. Они также сталкиваются с проблемой «уловки 22», поскольку нет возможности исчерпать все возможные базы для репликации. Тем не менее, такие направления исследования плодотворны, потому что чем больше знаний, тем лучше. Но без учета информации и ее тиражирования сложно представить разумный ответ на этот вопрос.

Добро пожаловать в Биология SE. Было бы здорово, если бы вы могли расширить свой ответ, включив в него краткое изложение основных моментов. Мы не можем рассчитывать на то, что ссылка останется там навсегда.
вы можете отредактировать свой ответ. (ссылка под вашим постом).
Классное объяснение.
«и для некоторых гипотетических 6-базовых систем с 2n-базами, репликация новых баз которых занимает все больше времени». - Это предположение трудно обосновать.

В этом вопросе есть и химическое измерение.

Если вы посмотрите на пары оснований Уотсона-Крика, вы увидите, что места для маневра не так много:

Пары оснований Уотсона Крика

Нуклеотидные основания имеют 2 или 3 водородные связи. Вероятно, стерически не разумно иметь 4.

Это означает, что существует лишь ограниченное количество способов, которыми комбинации оснований могут быть взаимодополняющими, а также специфическими, поскольку они образуют двойную спираль. Поскольку образцы водородных связей A->T и T->A охватывают обе комбинации донор-рецептор, существует одно возможное спаривание 2 Н-связей.

Я думаю, что есть 2 способа настроить три основания водородных связей, поэтому, возможно, шесть возможны, но я предполагаю, что если вы расширите репертуар спаривания оснований, одно из них может начать терять специфичность. Как бы то ни было, если вы достаточно играете с нуклеотидами, вы можете создавать пары оснований, отличных от Уотсона-Крика, и, вероятно, частично терять уверенность в том, что у вас есть точные совпадения 1: 1 между комплиментарными парами оснований. Колебание пар оснований в РНК и пары оснований Хугстина уже могут быть продемонстрированы, чтобы позволить тройные спирали и неидеальные совпадения спиралей РНК.

пары оснований без туалета

Система ДНК с 4 основаниями со связями AT и связями CG - это та, которая эволюционировала для использования большинством живых существ на Земле, как упоминалось в других ответах, потому что она может кодировать триплетную таблицу оснований для всех используемых аминокислот, допуская некоторые аминокислоты имеют более одного триплетного кода. Однако существуют небольшие вариации системы: даже если связи AT и CG не меняются, нуклеотиды могут быть модифицированы, чтобы маркировать области генома в том, что является частью эпигенетического кода. Наиболее распространенной модификацией является добавление молекул метила и 5-гидроксиметила к основаниям, хотя все еще обнаруживаются другие модификации.

Теоретически из пиримидинов и пуринов вместе они составляют 6 пар оснований = 12 возможных оснований...

ЕСЛИ азотистые основания произошли только из пиримидинов, а НЕ из пуринов, ТО они представляют собой только 2 пары оснований = 4 возможных пиримидиновых основания!!!...4 пурина и 12 пуринов+пиримидины

Отказ от ответственности: я не биолог, не химик и не теоретик информации. Я просто хочу изложить точку зрения, которую я как бы собрал из различных ответов здесь, но которую я на самом деле не вижу выраженной ни в одном ответе.

А именно, я думаю, легко представить, что 4 пары оснований являются результатом компромисса между наличием большого количества пар оснований и наличием нескольких пар оснований. То есть, по сути, это результат проблемы оптимизации. Есть некоторые преимущества в наличии большего количества пар оснований и некоторые преимущества в меньшем количестве пар оснований, и 4 — это просто лучший компромисс между ними. Как и в случае с любой проблемой оптимизации, результат, вероятно, весьма чувствителен к тому, как именно мы формулируем вопрос — в какой именно среде развивалась система из 4 пар оснований, какую роль РНК играла в жизни на тот момент, как именно мы количественно оцениваем преимущества. и недостатки различных систем с парами оснований и т. д. И, возможно, система с 4 парами оснований изначально развивалась в одной среде,

Вероятно, многие из этих вопросов моделирования в настоящее время достаточно неопределенны, поэтому невозможно уверенно «запустить задачу оптимизации» и доверять результатам. Но, вероятно, первым шагом будет попытка перечислить как можно больше конкурирующих факторов. Позвольте мне попробовать это с помощью предыдущих ответов здесь:

Причины предпочесть меньшее количество пар оснований

  • Меньшее количество пар оснований означает меньше возможных путей «неправильного спаривания», что потенциально снижает скорость мутаций.

  • Меньшее количество пар оснований также означает, что необходимо использовать только «лучшие пары», что опять же потенциально снижает скорость мутаций.

  • Меньшее количество пар оснований упрощает процесс приобретения или синтеза пар оснований.

  • Может повлиять на скорость транскрипции.

Причины предпочесть большее количество пар оснований

  • Больше информации хранится на единицу массы/объема.

  • Потенциально увеличивает диапазон структур, которые могут быть построены непосредственно из генетического материала.

  • Может повлиять на скорость транскрипции.

Я уверен, что есть много других факторов, которые следует учитывать.

Мне неясно, можно ли сказать что-то количественное об этих противоборствующих силах с достаточной уверенностью, чтобы действительно «запустить оптимизацию» и доверять ответу.

И, конечно же, можно еще многое сказать о пространстве, в котором мы оптимизируем — какие именно «пары оснований» можно было бы использовать в первую очередь, как уже говорили другие более квалифицированные люди.

Потому что четыре — это минимально возможное число. Если нет стремления усложнить систему, она никогда не соберется.

Тогда можно было бы утверждать, что подобная система могла быть построена только с использованием двух баз.

Отлично.

Попробуйте.

Вы с треском провалитесь. Конечно, вы можете сделать цепочку ДНК, содержащую только аденин и тимин. Но кто тогда помешал бы гуанину и цитозину сформироваться и присоединиться к какой-то дезоксирибозе? Как бы вы тогда организовали хранение, сохранение и передачу информации?

Спаривание оснований — каким бы сложным оно ни выглядело — это самый простой способ безопасного хранения информации на молекулярном уровне, чтобы ее можно было обрабатывать для передачи и трансляции где-то еще. Пространственных комбинаций водородных связей, которые могут быть установлены между пиримидиновыми и пуриновыми производными, всего две.

Для целей репликации вам потребуется дальнейшее нарушение симметрии, в результате чего у вас останется два основания, по одному на каждой цепи двойной спирали ДНК.

Дважды два четыре.

PS: Кстати, кто на Земле сказал вам, что в ДНК ровно четыре азотистых основания? Скажи им, что они, вероятно, забыли метилцитозин! Термин «метилирование» — это просто предлог, чтобы не признать, что ДНК использует пять оснований вместо четырех. Открой свой разум.