Почему 3 нуклеотида используются в качестве кодонов для картирования аминокислот в ДНК?

ДНК состоит из 4 уникальных нуклеотидов. При кодировании белка для кодирования каждой аминокислоты используется последовательность из 3 нуклеотидов. Почему кодоны имеют длину 3 нуклеотида?

Связанный с этим вопрос можно найти здесь: почему в ДНК ровно четыре нуклеотидных основания.

Я спросил и ответил на это здесь, потому что я разместил этот ответ на связанный вопрос, но это не было ответом на него. Теперь есть гораздо лучшие альтернативные ответы, поэтому я задал вопрос, на который на самом деле ответил здесь!
Ваш вопрос должен быть правильнее (точнее, в уточняющих целях) в качестве азотистых оснований. Думаю, ваш вопрос меня немного смутил. Статья, которую я нашел в Интернете, объясняет это более или менее правдоподобно: biologie.uni-hamburg.de/b-online/e21/21a.htm

Ответы (4)

Центральная догма молекулярной биологии: ДНК делает РНК делает белок

ДНК является эталоном для белков*, которые являются функциональными молекулами в клетках. Они состоят из 20 уникальных аминокислот, каждая из которых кодируется участком ДНК, известным как кодон. Кодоны всегда имеют длину 3 пары оснований (нуклеотидов).

ДНК состоит из 4 уникальных нуклеотидов; ( A )денин, ( G )уанин, ( C )гитозин и ( T )гимин. Это означает, что из этих 4 оснований (4*4*4) можно составить 64 уникальных кодона.

Теория первая — эволюционируемость

Если бы длина кодонов составляла всего 2 основания, то разнообразие кодонов, которые можно было бы создать, было бы меньше (всего 16 уникальных последовательностей, если осталось 4 нуклеотида). Потребуется больше уникальных нуклеотидов, чтобы получить достаточно уникальных последовательностей для кодирования 20 аминокислот (а также кодонов STOP). Например, чтобы получить 64 уникальные последовательности с использованием системы с двумя основаниями на кодон, потребуется 8 уникальных нуклеотидов.

Мы никогда не можем «узнать», что произошло с точки зрения эволюции, но кажется вероятным, что система кодонов из 3 оснований (нуклеотидов) возникла бы после периода системы из 2 оснований, поскольку биологические системы стали более сложными. Это позволило бы гораздо больше варьировать используемые аминокислоты и, следовательно, повысить «эволюционность», что было бы очень выгодно для ранних организмов.

Однако, поскольку система 4 уникальных нуклеотида/3 кодона характерна для всей жизни, обнаруженной нами на Земле, кажется вероятным, что в самом начале ДНК (на самом деле, вероятно, РНК) работала именно эта система, или по крайней мере, эта сохранилась (хотя, как справедливо отмечает Кевин, мы не знаем, существовали ли когда-либо другие системы). С годами могли возникать вариации, но именно эта система преобладала здесь, на Земле.

См. этот вопрос для получения более интересной информации: почему 20-аминокислот вместо 64?

Теория вторая — «избыточность» кодонов передает дополнительную информацию

Эта теория не является взаимоисключающей по отношению к описанной выше. В недавней статье Д'Онофрио и Абель [ 1 ] утверждают, что рибосомы делают паузу на разное время в разных кодонах (даже если кодон кодирует одну и ту же аминокислоту) и что эта пауза влияет на трехмерную структуру конечной аминокислоты. белок.

Следовательно, нуклеотидная последовательность содержит как минимум два «слоя» информации: во-первых, какую аминокислоту следует добавить, а во-вторых, конкретный кодон, используемый для этой аминокислоты, может повлиять на окончательную структуру белка. Этого нельзя было бы сделать с меньшим количеством нуклеотидов, но, возможно, с большим количеством нуклеотидов можно было бы осуществлять еще больший контроль, но, возможно, это возвращает меня к моему первому замечанию, что эта система развилась так давно, что больше нуклеотидов не было необходимо для того, чтобы жизнь «работала». " и размножаются во всем, что мы видим сегодня.

  1. Д'Онофрио и Абель, 2014. Границы генетики . Избыточность генетического кода позволяет приостановить трансляцию.

* только около 1% нашего генома на самом деле кодирует белок, и многие продукты РНК, не кодирующие белок, выполняют очень важные функции, но я не буду вдаваться в подробности здесь. Достаточно сказать, что я имею в виду участки ДНК, кодирующие белок.

В целом, это хороший ответ. Однако я не согласен с высказыванием «определено, что наиболее эффективным». Мы понятия не имеем, что когда-либо существовали другие комбинации. 4 нуклеотида в комбинациях по 3 не работали. Это все, что мы знаем.
@ Кевин, спасибо, и ты абсолютно прав. Я дал ответу общую переработку, потому что я не думаю, что он правильно читался, будучи адаптированным из другого вопроса, и принял во внимание ваш комментарий. Большое спасибо.
Комментарий НЕ является критикой ответа. Я знаю, что все говорят об этом, central dogma of molecular biologyно это такое дурное имя. Догме нет места в науке. Более того, теперь мы знаем, что ретротранскрипция существует, и поэтому центральная догма молекулярной биологии не всегда верна.
Спасибо за публикацию второй части теории. Я всегда задавался вопросом, почему тринуклеотидный повтор CAG в HTT может вызывать болезнь Хантингтона, но CAACAG, похоже, этого не делает.
Чувак, моя дипломная работа (8 лет назад) была основана на идее о том, что разные кодоны вызывают конформационные изменения. Я сравнил кодоны структурированных областей в белках с неструктурированными и обнаружил, что использование кодонов было разным при кодировании одной и той же аминокислоты. Парень, который отметил это, дал мне 20%. Это привело к тому, что я получил низкую итоговую оценку. Обязательно Я получил степень магистра до получения докторской степени. Наверное, отбросил меня на 2 года назад. А теперь она опубликована в журнале Frontiers in Genetics . _- Академия — отстой, когда ты мелочь.

Я думаю, что можно привести веские доводы в пользу того, что три нуклеотидных кодона уже существовали в изначальном генетическом коде, который включал только восемь абиотических аминокислот (это все еще ясно видно сегодня в таблицах перевода, где большинство абиотических аминокислот определяются четырьмя или более кодонами) . Однако в этом первичном генетическом коде последний nt, вероятно, был бессмысленным (это было заново изобретено во многих митохондриальных геномах, где одна тРНК, обычно благодаря модифицированному U в положении колебания антикодона, распознает до 4 кодонов). Предполагая, что существовал первичный генетический код из трех нуклеотидных кодонов, мы видим, что причина трехнуклеотидной структуры кодона заключалась не в том, что двухнуклеотидной кодонов было недостаточно для кодирования всего (4^2 > 9, этого было бы достаточно), а в чем-то другом. . Так что же это может быть? Мое обоснованное предположение состоит в том, что это связано с A, P, Структура E-сайта рибосомы не вписывается в меньшую молекулярную конфигурацию (т. е. вы не можете иметь соседние A, P, E-сайты в пространстве, ограниченном всего пятью фосфодиэфирными связями (шесть нуклеотидов, три кодона по два нуклеотида) по сравнению с. восемь фосфодиэфирных связей (девять нуклеотидов, три трехнуклеотидных кодона)). Короче говоря, я считаю, что первичная рибосомная структура была ключевым фактором в трехнуклеотидной кодоновой структуре генетического кода, она не могла работать с чем-то меньшим, а что-то большее было бы пустой тратой времени.

Это очень интересная информация (извините за задержку с комментариями). Не могли бы вы предоставить какие-либо ссылки / дополнительное чтение?

Могу ли я предложить вам обратиться непосредственно к источнику? Вот ссылка на статью, опубликованную Фрэнсисом Криком (и др.) в 1957 году под названием «Коды без запятых» http://www.ncbi.nlm.nih.gov/pmc/articles/PMC528468/

Источник, на который вы ссылаетесь, действительно хорош, но простая ссылка - это не совсем то, о чем этот сайт. Конечно, это проще, но, пожалуйста, найдите время и уточните свой ответ, объясните, интерпретируйте источники, которыми вы пользуетесь.
Добро пожаловать в Biology.SE. Одной ссылки недостаточно для ответа. Либо найдите время, чтобы уточнить свой ответ, либо преобразуйте свой ответ в комментарий.

По той же причине в языках программирования старой школы (до интернационализации и Unicode) в обычном символьном типе данных было 8 бит.

В современных интерпретациях ASCII у вас есть определенное количество символов, которые необходимо закодировать, где-то между 128 и 256. 8 бит будут минимумом, достаточным для (современного расширенного) кодирования ASCII. (Не связанный с вопросом: в вычислениях часто помогает, чтобы количество битов в различных операциях было степенью 2. Кроме того, исходные версии ASCII определяли 7-битное кодирование, прежде чем оно было расширено до полного байта в раннем усилия по поддержке интернационализации.)

Возвращаясь к нуклеотидам, существует 20 аминокислот. Думайте о кодоне как об эквиваленте «байта», а основание (нуклеотид) — как об эквиваленте «бита». Наборов из 2 кодонов будет недостаточно, за исключением случаев, когда вы планируете создать форму жизни с компактным геномом, которая поддерживает только 15 аминокислот, стоп-кодон и не имеет колебаний.

Для поддержки всех аминокислот плюс стоп-кодон требуется по крайней мере 21 различное значение кодона. В частности, найдите наименьшую степень числа 4 >= 21, которая равна 3.

Дополнительный бонус: количество значений кодона примерно в три раза превышает количество аминокислот (плюс стоп-кодон), что обеспечивает избыточность: некоторые аминокислоты кодируются более чем одним кодоном, который действует как буфер против мутаций.