В пре-мРНК эукариот у меня возникли небольшие проблемы с пониманием того, как именно определяется 5 основных нетранслируемых областей.
Кажется, это можно определить как разницу в пре-мРНК между транскрипцией и трансляцией, верно?
Если да, то начинается ли транскрипция сразу после окончания промоторной последовательности? Становится ли следующий нуклеотид частью 5'UTR сразу после окончания промоторной области ДНК?
Краткий ответ
Область 5'-UTR эукариотической мРНК происходит из РНК-транскрипта области гена между сайтом начала транскрипции и ДНК, соответствующей кодону инициации трансляции. Он отличается от этой области исходного транскрипта в большинстве случаев наличием модифицированного гуанозинового нуклеотида, добавленного на 5'-конце в структуру «кэпа», а в некоторых случаях отсутствием интрона, присутствующего в первом.
Сайт начала транскрипции (TSS) и промотор
Этот ответ относится к TSS, а не к «промоторной области» или «промоторной последовательности», которые предпочитает задающий вопрос, потому что, по крайней мере, у эукариот не существует простой и легко определяемой промоторной последовательности. Обзор промоторов многоклеточных животных 2012 года начинается с определения: «Промоторы генов — это локусы, перекрывающие сайты начала транскрипции (TSS), в которых общий регуляторный вклад гена интегрируется в скорость инициации транскрипции. Непосредственная роль промотора заключается в том, чтобы связать и правильно расположить комплекс инициации транскрипции…».
Упрощенная диаграмма некоторых компонентов промоторов человека (адаптированная из более раннего обзора Хана ) показана ниже. Положение «Inr» — поля Инициатора, содержащего TSS, — варьируется по отношению к блоку ТАТА (обычно от –25 до –30 у людей), как и его последовательность. Следовательно, даже игнорируя альтернативные TSS, упомянутые @Luke, невозможно однозначно идентифицировать TSS путем проверки последовательности ДНК гена так, как, по-видимому, хотел бы вопрошающий.
Кодон инициации трансляции
Следует отметить, что также невозможно однозначно идентифицировать кодон инициации трансляции мРНК путем изучения последовательности ДНК гена. Хотя 90% и более случаев следуют правилу Козака , так что он соответствует первому АТГ, в некоторых случаях он может соответствовать второму АТГ, а в незначительном меньшинстве — там, где происходит внутренняя инициация — какому-то дистальному АТГ. Также имеется очень мало примеров инициации трансляции с кодонов, отличных от AUG .
Интроны в областях 5'-UTR пре-мРНК
Обычное объяснение интронно-экзонной природы эукариотической пре-мРНК заключается в альтернативном сплайсинге для получения различных белковых последовательностей. Возможно, из-за этого присутствие интронов в первичном транскрипте, содержащем 5'- и 3'-UTR, часто игнорируется (см . обзор Bicknell et al. ). Фактически примерно 35% предшественников 5'-UTR содержат интроны, отсутствующие в зрелой мРНК.
5'-кэпирование эукариотической мРНК
Подавляющее большинство эукариотических мРНК имеют кэп на 5'-конце, образованный добавлением гуанозинового нуклеотида в 5'-5' пирофосфатной связи к 5'-остатку (обычно А) пре-мРНК. Впоследствии он метилируется по углероду-7; также может иметь место 2'-O-метилирование рибозы последующих одного или двух нуклеотидов.
Сноска
Хотя «ДНК делает РНК делает белок», я считаю важным описывать свойства информационных молекул с точки зрения их фактического состава. Таким образом, 5'-UTR следует определять с точки зрения мРНК, а не промоторов или экзонов. Если кто-то ссылается на информационное содержание ДНК или РНК, то, я думаю, следует использовать форму слов, чтобы прояснить это. Запутанные формы слов могут легко привести к запутанному мышлению.
Короткий ответ
5'-UTR на мРНК включает последовательность от сайта начала транскрипции (TSS) до первого экзона. Промоторы обычно связаны с соответствующим TSS.
Более длинный ответ
При определении UTR мы должны учитывать, где начинается транскрипция. Строго говоря, транскрипция начинается с сайта начала транскрипции (TSS). Полезным веб-сайтом для точных определений таких терминов является Sequence Ontology — см. здесь определение TSS ( ссылка ) — хотя, по общему признанию, в этом случае он не предоставляет больше информации, чем это (т. е. TSS — это место, где начинается транскрипция... что мы могли бы почерпнуть из названия). TSS будет иметь связанную промоторную область, в которой связывается РНК-полимераза (и различные регуляторы и факторы транскрипции).
Чтобы расширить: ген может иметь несколько TSS, которые могут быть повышены при различных обстоятельствах (например, при наличии разных факторов). Таким образом, у нас есть понятие области TSS «область гена от 5' самой TSS до 3' TSS» ( ссылка ). TSS должен быть определен эмпирически, и, по-видимому, зависит от ткани (база данных всех известных TSS накапливается с 2002 года: DBTSS ). Я только что выполнил поиск гена APOE (chr 19), и это небольшая выдержка из представленных данных, просто чтобы дать представление:
Из ДБЦС
Таким образом, TSS для гена зависит от контекста, когда и где производится транскрипт.
В поисках дополнительной информации я нашел статью, в которой описывается 5'-UTR на мРНК , которая не обязательно является точной копией геномной ДНК (например, путем добавления кэпа). Вот соответствующий абзац и диаграмма, которые объясняют это лучше, чем я могу перефразировать (выделено мной):
Контроль транскрипции опосредуется транскрипционными факторами, РНК-полимеразой и серией цис - действующих элементов, расположенных в ДНК, таких как промоторы, энхансеры, сайленсеры и локус-контролирующие элементы, организованные в модульную структуру и регулирующие продукцию молекул пре-мРНК. , которые проходят несколько этапов процессинга, прежде чем станут функциональными мРНК. Интроны удаляются, к 5'-концу первого экзона добавляется кэп-структура из 7-метилгуанилата (m7G)., и участок из 100-250 адениновых остатков (поли(А)-хвост) добавляется к 3'-концу последнего экзона, который сам образуется эндонуклеолитическим расщеплением первичного транскрипта. Иногда последовательность мРНК также изменяется в процессе, называемом редактированием мРНК, и результирующая кодирующая последовательность зрелой РНК отличается от соответствующей последовательности в геноме. Полученная зрелая мРНК у эукариот имеет трехчастную структуру, состоящую из 5'-нетранслируемой области (5'-UTR), кодирующей области, состоящей из триплетных кодонов, каждый из которых кодирует аминокислоту, и 3'-нетранслируемой области (3'-UTR). . На рис. 1 показаны эти и другие особенности мРНК.
Рисунок 1: Общая структура эукариотической мРНК, иллюстрирующая некоторые посттранскрипционные регуляторные элементы, влияющие на экспрессию генов. Сокращения (от 5' до 3'): UTR, непереводимая область; m7G, кэп 7-метилгуанозина; шпилька, шпилькоподобные вторичные структуры; uORF, восходящая открытая рамка считывания; IRES, внутренний сайт посадки рибосомы; CPE, элемент цитоплазматического полиаденилирования; AAUAAA, сигнал полиаденилирования.
Ссылка: Миньоне, Ф., Гисси, К., Лиуни, С., и Песоле, Г. (2002). Нетранслируемые участки мРНК. Геномная биология, 3(3). http://www.ncbi.nlm.nih.gov/pubmed/11897027
промоутеры
В заключение моего ответа (приносим извинения за его некраткость) существуют различные типы промоторов, не все из которых непосредственно включают TSS, но большинство промоторов называются «основными промоторами» и включают TSS (в дополнение к РНК сайт связывания полимеразы и сайты связывания других факторов транскрипции).
UTR представляет собой область транскрипта перед исходным метионином. Сам промоутер не транскрибируется.
WYSIWYG