Когда я просматривал NCBI, я увидел закономерность: даже если размеры хромосом, количество генов и количество белков различаются, GC% в хромосомах имеют тенденцию быть одинаковыми. Примеры связаны ниже.
Дрожжи , Plasmodium falciparum
Если вы видите геном митохондрий, то он не очень похож на хромосому. Почему все хромосомы имеют тенденцию приближать свой GC% к среднему общему GC% Есть ли какая-то конкретная причина, связанная с метафазой мейоза?
чтобы уточнить, у меня есть несколько изображений, чтобы помочь
Размер хромосом или гены в организме не приспосабливаются к среднему их общему количеству, в отличие от GC%. Он имеет только 3-2% (falciparum) или 3-4% (vivax) вариации GC%. Такое ощущение, что он балансирует как эквалайзер. Почему?
Как указывает @dd3, средний GC% указывает на необходимость стабильности, а кодирующие области или структурные области генома, возможно, должны быть более стабильными. Но самые большие %GC в геномах обнаружены у термофилов — организмов, живущих в воде с высокой температурой — в горячих источниках и подводных геотермальных жерлах. В этом обзоре упоминается, как некоторые термофилы могут быть найдены с 50% GC. Чрезвычайно термофильный Thermus thermophilus может иметь содержание GC% 69,4%.
Но вы спрашиваете, как усредняется содержание GC по длине большого генома. Ответ — вариация и отбор. Когда ген должен быть более стабильным из-за геномной функции или из-за того, что он пытается жить в более жаркой среде, мутации, которые превращают пары оснований A/T в G/C, будут давать дополнительное преимущество для выживания и будут иметь тенденцию сохраняться в гене. пул до тех пор, пока не будет нанесен больший ущерб результатам мутации. Со временем и по мере того, как стабильность создает большее преимущество, GC % будет все дальше и дальше отклоняться от среднего значения.
Это работает как для термоустойчивости, так и из-за биофункциональных ограничений, связанных с теломерой, центромерой или кодирующей областью - ограничения стабильности и кодирования играют друг против друга, чтобы сходиться к оптимальному содержанию GC в любом данном участке генома.
И наоборот, большинство геномов с содержанием GC ниже 50% мигрируют туда, потому что слишком высокая стабильность также может иметь свою цену. Например, разрыв спирали ДНК для транскрипции и других клеточных процессов также должен проходить гладко.
Кодирующие области важны для бактерий ( E coli составляет 89% кодирующей последовательности).). Для кодирующих последовательностей генетический код в среднем логически составляет 50% GC, но если вы посмотрите на фактические кодоны на диаграмме ниже, вы увидите, что за исключением случаев с одним кодоном (триптофан, метионин) третье основание всегда имеет опцию GC, допускающую содержание GC в середине 60 процентилей. Ограничение, позволяющее свободно варьировать кодирующие последовательности, является лишь приближением - в некоторых случаях замены аминокислот кодонами, богатыми GC, могут немного увеличить потолочное ограничение. А более часто встречающиеся аминокислоты имеют возможность образования 2 или 3 оснований своих кодонов GC. В целом было бы замечательно найти бактерии с GC% выше 72%. Мутации и требования к кодируемым белкам просто не позволили бы этого.
Итак: в течение эволюционных периодов эти мутации GC накапливаются там, где они полезны, вплоть до того, что 2/3 генома составляют пары GC. Самая сильная селективная сила для накопления высокого среднего % GC для генома - это воздействие на геном самого высокотемпературного окружения.
Обратите внимание, что этот аргумент термостабильности не имеет значения для многих животных, потому что они регулируют температуру своего тела.
Содержание GC в геноме значительно различается как между видами, так и внутри индивидуального генома. Обычно среднее содержание GC находится в диапазоне 35-45%, хотя определенно существуют организмы, выходящие за пределы этого диапазона. Виды плазмодия, на которые вы ссылаетесь выше, являются примером чрезвычайного богатства AT (низкое содержание GC), тогда как некоторые бактериальные геномы имеют до 70% содержания GC или более.
Для эукариотических геномов нуклеотидный состав распределен неравномерно. Тот факт, что геном имеет среднее содержание GC 40%, не означает, что вы можете выбрать любую область генома размером 10 т.п.н. и ожидать, что эта область будет иметь +/-40% GC содержания. Скорее эукариотические геномы представляют собой мозаику из больших областей, которые внутри имеют очень однородный состав, но состав которых сильно отличается от фланкирующих областей ( изохор ).
Таким образом, хотя все хромосомы конкретного организма могут иметь одинаковое среднее содержание GC, помните, что это всего лишь среднее значение, и что состав нуклеотидов значительно различается по всему геному.
Хороший ответ от Даниэля. Я бы также добавил, что могут быть значительные различия между содержанием GC хромосомной или ядерной ДНК и содержанием внехромосомных объектов, таких как митохондриальные и хлоропластные геномы или (природные) плазмиды. Эти ДНК имеют разные ограничения (репликация, субклеточное расположение и т.д.), и это может в некоторой степени отражаться содержанием GC, отличным от содержания ядерных хромосом.
Для начала можно спросить: «В чем преимущество более высокого содержания GC?»
Более высокое содержание GC связано с более высокой стабильностью ДНК, и, соответственно, люди предположили, что это важно для областей, кодирующих белок. Было обнаружено, что в GC-богатых областях есть довольно много областей, кодирующих белок, но я не уверен, верно ли обратное, что является важной частью.
Если верно обратное , то можно посмотреть на распределение областей, кодирующих белок, по хромосомам и сопоставить его с содержанием GC. Если также размер областей, кодирующих белок, в данной хромосоме пропорционален размеру хромосомы, то у вас будет причина, по которой среднее содержание GC в каждой хромосоме одинаково.
Однако я понимаю, что все это очень спекулятивно. У кого-нибудь есть лучшие идеи?
бэп
грвпанчал