Я понял, что во всех случаях аннотаций hg19 «RefSeq Genes» я смотрел на сплайсированные транскрипты, начинающиеся (и заканчивающиеся) экзоном. Из аннотации нет никаких свидетельств какой-либо последовательности выше или ниже этих экзонов, которые остаются в зарождающейся РНК.
Отражает ли это биологию или просто следствие сплайсированного картирования чтения? Другими словами: существуют ли транскрибируемые области выше первого экзона и ниже последнего экзона в зарождающейся РНК?
Эти области, если они существуют, не могут называться интронами, когда они определяются как «сплайсированные последовательности между экзонами». Как бы их назвать?
Большинство (почти все, насколько мне известно) мРНК и днРНК начинаются с экзонов по причинам, уже упомянутым Дэвидом. В типичном случае сплайсинга нуклеотид, который находится на 5'-конце от донорного сайта сплайсинга (назовем его предонорным), и тот, который находится на 3'-конце от акцепторного сайта (назовем его постакцепторным), соединяются вместе, и интронная последовательность между ними удаляется.
Если вы внимательно посмотрите на механизм, то заметите, что пре-донор (т.е. 3'-конец первого экзона) оказывает нуклеофильную атаку на фосфор пост-акцептора (т.е. 5'-конец второго экзона) что приводит к высвобождению интрона.
Изображение предоставлено : http://mips.helmholtz-muenchen.de/proj/yeast/reviews/intron/spliceo_splicing.html
Следовательно, в транскрипте всегда есть экзон, предшествующий интрону.
Однако процессинг РНК может происходить по другому механизму, при котором концы просто отрубаются. Это происходит при процессинге тРНК, когда РНКазеП отрезает часть 5' от зрелой области тРНК, называемую лидерной последовательностью (см. рисунок ниже). Я не знаю о таком механизме, происходящем в случае мРНК, но возможность, безусловно, существует. Одна из возможных причин того, что мРНК не имеют такого механизма, заключается в том, что их 5'-конец кэпирован (ко-транскрипционно), а расщепление 5'-конца приведет к потере кэпа и дестабилизации мРНК (хотя это все предположения). Точно так же 3'-конец мРНК полиаденилирован, что также придает им стабильность. Многие lncRNA также кэпированы и полиаденилированы, но есть и исключения (мРНК тоже).
Поскольку этот механизм не очень распространен, для иссеченных концов нет систематического названия. В случае тРНК ее просто называют «лидерной» последовательностью.
Изображение предоставлено : Leigh & Lang, 2004 г.
Насколько мне известно, транскрипты всегда начинаются и заканчиваются экзонами. Причины, по которым я не ожидал бы иного (помимо моих наблюдений при изучении транскриптов дрозофилы), приведены ниже.
Как вы знаете, сплайсосома (по крайней мере, для мРНК) представляет собой очень сложный многокомпонентный рибонуклеарно-белковый комплекс, функции которого заключаются как в сплайсинге интрона, так и в лигировании концов экзона. На приведенной ниже диаграмме из недавнего обзора предполагается, что распознавание сайтов сплайсинга также включает экзон.
А авторы пишут (курсив мой):
«Спаривание оснований между 50-м концом мяРНК U1 и первыми шестью нуклеотидами интрона и до трех нуклеотидов экзона обеспечивает основную движущую силу для распознавания специфической последовательности».
Так что я думаю, что современный механизм удаления интронов мРНК требует, чтобы мРНК экзона «зацепилась».
Если бы такое удаление интронов могло служить функциональной цели, вы могли бы предположить, что механизм эволюционировал, чтобы приспособиться к таким ситуациям, но если основная функция интронов состоит в том, чтобы позволить дифференциальный сплайсинг экзонов, которые определяют области белка, интроны в конце мРНК не будет иметь никакой цели.
Еще один момент, который следует учитывать, - это сайт связывания РНК-полимеразы на ДНК (удлиненный и сложный промотор). Если бы интроны первоначально возникли как мобильные элементы (что предполагают авторы обзора), то вставка на 5'-конце, вероятно, инактивировала бы промотор, поэтому транскрипт не был бы произведен.
Конечно, в Природе полно исключений, и было бы глупо исключать существование интронов того типа, который вы постулируете (в какой-то далекой галактике...).
Спасибо за отличный вопрос.
Я хотел бы начать с уточнения терминологии.
Во-первых, зарождающаяся РНК относится к молекуле РНК, которая в настоящее время транскрибируется и не подвергалась процессингу. Процессинг может включать, например, сплайсинг интронов или полиаденилирование на 3'-конце. Зрелая РНК (обычно) подвергается сплайсингу и полиаденилированию.
Во-вторых, текущее консенсусное определение экзона - это транскрибируемая область генома, последовательность которой можно найти в зрелых видах РНК. Важно отметить, что существует два класса экзонов: некодирующие экзоны и экзоны, кодирующие белок. Я думаю, что вы можете запутаться, и я включил изображение, чтобы помочь прояснить различие между интронами, кодирующими экзонами и некодирующими экзонами, используя в качестве примера ген GAPDH человека.
На рисунке сплошные синие прямоугольники представляют экзоны, присутствующие в зрелой мРНК . Эти экзоны могут содержать как белок-кодирующие, так и некодирующие последовательности, как я уже упоминал. Например, экзон 1 GAPDH содержит только некодирующую информацию, которая принадлежит 5'-нетранслируемой области (UTR), в то время как экзон 2 содержит как кодирующую, так и некодирующую информацию о последовательности.
Когда вы просматриваете аннотацию RefSeq, вы просматриваете все экзоны (кодирующие и некодирующие). Для некоторых генов, таких как GAPDH, первый экзон будет некодирующим. Другие гены могут начинаться с кодирующего экзона (мне еще предстоит найти его, и, поскольку 5'UTR участвует в связывании рибосомы , я сомневаюсь, что существует много примеров).
Области молекулы мРНК за пределами ее кодирующей последовательности называются 5'- и 3'-нетранслируемыми областями (UTR).
Я надеюсь, что это поможет ответить на ваш вопрос.
Вэнс Л. Олбо
Ученый-неудачник
герр Джемине
Дэйвид
герр Джемине
Дэйвид