ДНК состоит из 4 уникальных нуклеотидов. При кодировании белка для кодирования каждой аминокислоты используется последовательность из 3 нуклеотидов. Почему кодоны имеют длину 3 нуклеотида?
Связанный с этим вопрос можно найти здесь: почему в ДНК ровно четыре нуклеотидных основания.
ДНК является эталоном для белков*, которые являются функциональными молекулами в клетках. Они состоят из 20 уникальных аминокислот, каждая из которых кодируется участком ДНК, известным как кодон. Кодоны всегда имеют длину 3 пары оснований (нуклеотидов).
ДНК состоит из 4 уникальных нуклеотидов; ( A )денин, ( G )уанин, ( C )гитозин и ( T )гимин. Это означает, что из этих 4 оснований (4*4*4) можно составить 64 уникальных кодона.
Если бы длина кодонов составляла всего 2 основания, то разнообразие кодонов, которые можно было бы создать, было бы меньше (всего 16 уникальных последовательностей, если осталось 4 нуклеотида). Потребуется больше уникальных нуклеотидов, чтобы получить достаточно уникальных последовательностей для кодирования 20 аминокислот (а также кодонов STOP). Например, чтобы получить 64 уникальные последовательности с использованием системы с двумя основаниями на кодон, потребуется 8 уникальных нуклеотидов.
Мы никогда не можем «узнать», что произошло с точки зрения эволюции, но кажется вероятным, что система кодонов из 3 оснований (нуклеотидов) возникла бы после периода системы из 2 оснований, поскольку биологические системы стали более сложными. Это позволило бы гораздо больше варьировать используемые аминокислоты и, следовательно, повысить «эволюционность», что было бы очень выгодно для ранних организмов.
Однако, поскольку система 4 уникальных нуклеотида/3 кодона характерна для всей жизни, обнаруженной нами на Земле, кажется вероятным, что в самом начале ДНК (на самом деле, вероятно, РНК) работала именно эта система, или по крайней мере, эта сохранилась (хотя, как справедливо отмечает Кевин, мы не знаем, существовали ли когда-либо другие системы). С годами могли возникать вариации, но именно эта система преобладала здесь, на Земле.
См. этот вопрос для получения более интересной информации: почему 20-аминокислот вместо 64?
Эта теория не является взаимоисключающей по отношению к описанной выше. В недавней статье Д'Онофрио и Абель [ 1 ] утверждают, что рибосомы делают паузу на разное время в разных кодонах (даже если кодон кодирует одну и ту же аминокислоту) и что эта пауза влияет на трехмерную структуру конечной аминокислоты. белок.
Следовательно, нуклеотидная последовательность содержит как минимум два «слоя» информации: во-первых, какую аминокислоту следует добавить, а во-вторых, конкретный кодон, используемый для этой аминокислоты, может повлиять на окончательную структуру белка. Этого нельзя было бы сделать с меньшим количеством нуклеотидов, но, возможно, с большим количеством нуклеотидов можно было бы осуществлять еще больший контроль, но, возможно, это возвращает меня к моему первому замечанию, что эта система развилась так давно, что больше нуклеотидов не было необходимо для того, чтобы жизнь «работала». " и размножаются во всем, что мы видим сегодня.
* только около 1% нашего генома на самом деле кодирует белок, и многие продукты РНК, не кодирующие белок, выполняют очень важные функции, но я не буду вдаваться в подробности здесь. Достаточно сказать, что я имею в виду участки ДНК, кодирующие белок.
central dogma of molecular biology
но это такое дурное имя. Догме нет места в науке. Более того, теперь мы знаем, что ретротранскрипция существует, и поэтому центральная догма молекулярной биологии не всегда верна.Я думаю, что можно привести веские доводы в пользу того, что три нуклеотидных кодона уже существовали в изначальном генетическом коде, который включал только восемь абиотических аминокислот (это все еще ясно видно сегодня в таблицах перевода, где большинство абиотических аминокислот определяются четырьмя или более кодонами) . Однако в этом первичном генетическом коде последний nt, вероятно, был бессмысленным (это было заново изобретено во многих митохондриальных геномах, где одна тРНК, обычно благодаря модифицированному U в положении колебания антикодона, распознает до 4 кодонов). Предполагая, что существовал первичный генетический код из трех нуклеотидных кодонов, мы видим, что причина трехнуклеотидной структуры кодона заключалась не в том, что двухнуклеотидной кодонов было недостаточно для кодирования всего (4^2 > 9, этого было бы достаточно), а в чем-то другом. . Так что же это может быть? Мое обоснованное предположение состоит в том, что это связано с A, P, Структура E-сайта рибосомы не вписывается в меньшую молекулярную конфигурацию (т. е. вы не можете иметь соседние A, P, E-сайты в пространстве, ограниченном всего пятью фосфодиэфирными связями (шесть нуклеотидов, три кодона по два нуклеотида) по сравнению с. восемь фосфодиэфирных связей (девять нуклеотидов, три трехнуклеотидных кодона)). Короче говоря, я считаю, что первичная рибосомная структура была ключевым фактором в трехнуклеотидной кодоновой структуре генетического кода, она не могла работать с чем-то меньшим, а что-то большее было бы пустой тратой времени.
Могу ли я предложить вам обратиться непосредственно к источнику? Вот ссылка на статью, опубликованную Фрэнсисом Криком (и др.) в 1957 году под названием «Коды без запятых» http://www.ncbi.nlm.nih.gov/pmc/articles/PMC528468/
По той же причине в языках программирования старой школы (до интернационализации и Unicode) в обычном символьном типе данных было 8 бит.
В современных интерпретациях ASCII у вас есть определенное количество символов, которые необходимо закодировать, где-то между 128 и 256. 8 бит будут минимумом, достаточным для (современного расширенного) кодирования ASCII. (Не связанный с вопросом: в вычислениях часто помогает, чтобы количество битов в различных операциях было степенью 2. Кроме того, исходные версии ASCII определяли 7-битное кодирование, прежде чем оно было расширено до полного байта в раннем усилия по поддержке интернационализации.)
Возвращаясь к нуклеотидам, существует 20 аминокислот. Думайте о кодоне как об эквиваленте «байта», а основание (нуклеотид) — как об эквиваленте «бита». Наборов из 2 кодонов будет недостаточно, за исключением случаев, когда вы планируете создать форму жизни с компактным геномом, которая поддерживает только 15 аминокислот, стоп-кодон и не имеет колебаний.
Для поддержки всех аминокислот плюс стоп-кодон требуется по крайней мере 21 различное значение кодона. В частности, найдите наименьшую степень числа 4 >= 21, которая равна 3.
Дополнительный бонус: количество значений кодона примерно в три раза превышает количество аминокислот (плюс стоп-кодон), что обеспечивает избыточность: некоторые аминокислоты кодируются более чем одним кодоном, который действует как буфер против мутаций.
Люк
пользователь6641