где найти относительное частотное распределение синонимичных кодонов

Большинство аминокислот могут кодироваться более чем одним кодоном. Например, Serineможет быть закодирован любым из {UCU, UCC, UCA, UCG, AGU, AGC}.

Мой вопрос состоит из двух частей:

1) каковы относительные частоты этих кодонов? Этот вопрос можно эквивалентно сформулировать в вероятностных терминах: какова вероятность того, что данная аминокислота кодируется определенным кодоном?

2) Зависит ли эта вероятность от контекста (соседние кодоны/аминокислоты)?

Ответы (2)

Феномен использования разных кодонов с разной вероятностью называется предвзятостью использования кодонов . То, как используются разные кодоны, иногда сильно различается у разных видов и требует некоторой осторожности. Это особенно верно, когда вы хотите сверхэкспрессировать последовательности в бактериях для производства белка, для которого может потребоваться оптимизация кодонов для обеспечения оптимального использования кодонов (иначе редкие тРНК могут замедлить процесс трансляции). Существует база данных (на основе NCBI Genbank), которая дает вам вероятности кодонов для разных видов:

Кроме того, эти документы могут быть интересны:

Что касается вашего второго вопроса, я не думаю (и я также не нашел никаких доказательств), что использование кодонов зависит от соседей.

Погрешности использования кодонов зависят от вида, поэтому вам, возможно, придется измерить его для интересующего вас генома или набора генов.

Это смещение, по крайней мере, в некоторых случаях коррелирует с составом генома с точки зрения A, T, G и C (см. рисунок 3 этой статьи о цианобактериях ). Так что в некотором смысле это действительно зависит от контекста, если вы включаете состав нуклеотидов в то, что вы называете «контекстом».