Фон
GC-содержание относится к частоте пар оснований, которые являются либо C, либо G в геноме, или, другими словами, количеству пар оснований GC, деленному на сложение количества пар оснований GC плюс количество пар оснований AT.
Вопрос
Как эволюционирует GC-содержание и почему GC-содержание различается между популяциями/видами/линиями? Он развивается только в результате дрейфа генов? Под отбором? Интуитивно я бы сказал, что отношение вероятности мутации от A или T к G или C должно быть важным фактором, определяющим эволюцию GC-содержания. Имеет ли это? Влияет ли общая частота мутаций на содержание GC? Какие другие черты/силы влияют на эволюцию GC-контента?
Я думаю, что ключевой задачей здесь является «эволюция». Общие соотношения GC/AT изменяются мутациями, скорость которых постоянна. Вероятность того, что при данном событии мутации одно основание будет заменено другим, моделировалась несколькими способами, где вероятности различных мутаций могут быть или не быть одинаковыми .
В целом содержание GC приближается к 50%. Что заставляет GC-богатые геномы становиться GC-богатыми (60-70%), так это то, что мутации пар оснований GC имеют избирательные преимущества либо в регионах , либо во всем геноме в целом, что приводит к их сохранению . Частота мутаций может быть такой же (или даже ниже) в организме, богатом GC (многие из них находятся глубоко под землей или глубоко под водой. Геномы, богатые GC, возникают потому, что мутации AT->GC дают преимущество, и они сохраняются.
Причины, по которым содержание GC мигрирует от 50%, можно разделить на две категории, которые я назову энтропийными и селективными.
Под энтропией я подразумеваю, в частности, последовательности, кодирующие гены и другие особенности, такие как сайты связывания в ДНК или другие особенности, такие как центромеры, которые будут вызывать отклонение общего отношения от 1, поскольку последовательность ограничена содержащейся в ней информацией. В то время как кодирующие области имеют соотношение выше 1 , содержание GC имеет тенденцию колебаться около 54% . Эукариоты имеют GC-островки и т. д., но это также не меняет общего содержания GC.
Таким образом, богатые генами геномы и типичные функциональные особенности генома на самом деле не объясняют некоторые из обнаруженных впечатляюще высоких содержаний GC; до диапазона 70%. В то время как приведенная выше ссылка рассматривает смещение GC в кодирующих областях, учитывая, что любая часть генома, которая является просто прокладкой между элементами с определенными функциями, будет свободно варьироваться в зависимости от GC, если она полезна.
Селективные факторы для высокого содержания GC включают, например, среду с высоким давлением и температурой, которые обычно сильно смещают высокое содержание GC по этому механизму. Вы можете себе представить, как это работает: геномы с высоким содержанием GC термодинамически более стабильны и могут легче пережить внемолекулярные столкновения более высокой энергии в этих средах.
Геномы, богатые GC, — это не простая адаптация, с которой можно жить. Все гены для ДНК-ориентированных процессов, таких как транскрипция, упаковка хромосом, ДНК-полимераза, должны многое приспособить. Поскольку организм приспосабливается к более высоким температурам или более высокому давлению, каждый отдельный произведенный белок также должен измениться, чтобы быть стабильным и функционировать в новых условиях . Таким образом, эти изменения происходят только в течение длительного времени эволюции. Это, вероятно, важная часть причины, по которой ниши архей не были вытеснены эубактериями за все более чем 1 миллиард лет с тех пор, как на Земле существует жизнь.
Злой ученый
Реми.б