Правильно ли говорить, что кодирующая последовательность является частью последовательности экзона?

Некоторые основные неясности заставляют меня смущаться. Я загрузил последовательности 5'UTR, CDS, 3'UTR и экзона отдельно с сайта Biomart для гена P4HA2 (Homo sapiens) и обнаружил в них несколько повторов простой последовательности (SSR). Хотя в последовательности экзона есть повтор x, он не был расположен в 5'UTR, 3'UTR и кодирующей последовательности (или CDS) гена. Насколько я помню, последовательность экзона совпадает с кодирующей последовательностью, за исключением первого и последнего экзона, которые являются частями 5'UTR и 3'UTR соответственно, я прав?. Не могли бы вы помочь мне выяснить, как возможно упомянутое событие? Спасибо

Вы сравниваете один и тот же вариант сращивания?
Как сказал @canadianer, помните, что почти все человеческие гены прерываются. В гене есть длинные интронные последовательности, которые могут прервать вашу кодирующую последовательность. Также альтернативный сплайсинг может вырезать экзоны, составляющие зрелую мРНК. Если вы выполняете выравнивание, вы сможете определить, где находятся экзоны в сплайс-варианте вашего гена.
Да канадец, сравниваю тот же вариант сращивания.

Ответы (2)

Насколько я помню, последовательность экзонов совпадает с последовательностью кодирования, за исключением первого и последнего экзона, которые являются частями 5'UTR и 3'UTR соответственно, я прав?

Не обязательно. UTR могут состоять из нескольких экзонов, и может быть экзон, который охватывает обе стороны стартового кодона, т.е. он является частью как 5'UTR, так и CDS. Точно так же экзон может охватывать обе стороны стоп-кодона.

Причина, по которой вы не можете сопоставить свой повтор ни с одной из областей мРНК, может заключаться в том, что ваш повтор попадает в экзон, который охватывает стартовый/стоп-кодон. Сам повтор может охватывать эти сайты. Вам необходимо предоставить дополнительные сведения, такие как расположение повтора, размер повтора и с каким экзоном он сопоставляется. Также укажите, какой эталонный файл генома вы используете.

Кодирующая область — это та область кодирующей цепи ДНК, которая транслируется в продукт. Это синоним экзон области. 5'-нетранслируемая область и 3'-нетранслируемая область представляют собой именно это, и хотя они могут выполнять некоторые малопонятные функции в репликации, они не транслируются в белок. Я слышал, что термин «кодирующая область» широко не используется, хотя я новичок в молекулярной биологии.