Всегда ли транскрипты начинаются и заканчиваются экзонами?

Я понял, что во всех случаях аннотаций hg19 «RefSeq Genes» я смотрел на сплайсированные транскрипты, начинающиеся (и заканчивающиеся) экзоном. Из аннотации нет никаких свидетельств какой-либо последовательности выше или ниже этих экзонов, которые остаются в зарождающейся РНК.

Отражает ли это биологию или просто следствие сплайсированного картирования чтения? Другими словами: существуют ли транскрибируемые области выше первого экзона и ниже последнего экзона в зарождающейся РНК?

Эти области, если они существуют, не могут называться интронами, когда они определяются как «сплайсированные последовательности между экзонами». Как бы их назвать?

Добро пожаловать в BiologySE... Я согласен с тем, что вы сказали в конце (например, "Я думаю, если у вас есть ответ на 1 и 2..." - я бы сузил ваш вопрос, чтобы получить ответ (легче ответить на простой , прямой вопрос вместо широкого вопроса с 5 подвопросами) Вы всегда можете задать больше вопросов - чем конкретнее, тем лучше
Очень хороший (и хорошо изученный) вопрос!! вот жду ответов
@TalhaIrfan Спасибо. Я сжал текст до основных вопросов.
Не могли бы вы объяснить, что вы подразумеваете под «сопоставлением сплайсированного чтения».
@David, сплайсированное картирование чтения относится к сопоставлению сплайсированных последовательностей (например, считываний последовательностей, полученных из РНК) с не подвергнутым сплайсингу эталоном (ДНК эталонного генома). Алгоритм, выполняющий такого рода задачи, должен уметь принимать длинные вставки в эталонную последовательность, не наказывая их как несоответствия в выравнивании. Эти инсерции чтения для ссылки (или удаления ссылки для чтения) являются интронами.
@ Герр Джемин, понятно. Спасибо за объяснение.

Ответы (3)

Большинство (почти все, насколько мне известно) мРНК и днРНК начинаются с экзонов по причинам, уже упомянутым Дэвидом. В типичном случае сплайсинга нуклеотид, который находится на 5'-конце от донорного сайта сплайсинга (назовем его предонорным), и тот, который находится на 3'-конце от акцепторного сайта (назовем его постакцепторным), соединяются вместе, и интронная последовательность между ними удаляется.

Если вы внимательно посмотрите на механизм, то заметите, что пре-донор (т.е. 3'-конец первого экзона) оказывает нуклеофильную атаку на фосфор пост-акцептора (т.е. 5'-конец второго экзона) что приводит к высвобождению интрона.

введите описание изображения здесь Изображение предоставлено : http://mips.helmholtz-muenchen.de/proj/yeast/reviews/intron/spliceo_splicing.html

Следовательно, в транскрипте всегда есть экзон, предшествующий интрону.

Однако процессинг РНК может происходить по другому механизму, при котором концы просто отрубаются. Это происходит при процессинге тРНК, когда РНКазеП отрезает часть 5' от зрелой области тРНК, называемую лидерной последовательностью (см. рисунок ниже). Я не знаю о таком механизме, происходящем в случае мРНК, но возможность, безусловно, существует. Одна из возможных причин того, что мРНК не имеют такого механизма, заключается в том, что их 5'-конец кэпирован (ко-транскрипционно), а расщепление 5'-конца приведет к потере кэпа и дестабилизации мРНК (хотя это все предположения). Точно так же 3'-конец мРНК полиаденилирован, что также придает им стабильность. Многие lncRNA также кэпированы и полиаденилированы, но есть и исключения (мРНК тоже).

Поскольку этот механизм не очень распространен, для иссеченных концов нет систематического названия. В случае тРНК ее просто называют «лидерной» последовательностью.

введите описание изображения здесь Изображение предоставлено : Leigh & Lang, 2004 г.

Спасибо за ваше подробное объяснение. Как Дэвид и вы указываете, очень маловероятно, что механизм сплайсинга сможет удалить последовательности вверх и вниз по течению от первого и последнего экзона соответственно. Другой важный намек состоит в том, что процессинг 5'-CAP происходит ко-транскрипционно. Это, а также тот факт, что метод под названием «CAGE» используется для идентификации промоторных областей путем специфичного для CAP секвенирования 5'-концов мРНК, дает некоторую уверенность в том, что 5'-удаление «преэкзонной последовательности», вероятно, не происходит в 5'-конце. кэпированные мРНК. Однако мы не обсуждали 3'-конец.
@HerrJemine Я действительно не знаю, почему это не распространено. Даже для 5-футовой части это было просто дикой догадкой. Не воспринимайте это как факт. Кстати, 3'-конец содержит поли-А, что также имеет решающее значение для стабильности РНК. Однако РНК может быть стабильной и в отсутствие кэпа и поли-А-хвоста. Поскольку таких случаев также очень мало, можно предположить, что это может быть фактором низкой частоты обрезания концов в РНК.
Я нашел намек на посттранскрипционное усечение 3'-конца в альтернативном полиаденилировании в Википедии (второй абзац вступления и раздел «Альтернативное полиаденилирование»). Я предлагаю вам добавить этот аспект в свой ответ, и я приму его.

Насколько мне известно, транскрипты всегда начинаются и заканчиваются экзонами. Причины, по которым я не ожидал бы иного (помимо моих наблюдений при изучении транскриптов дрозофилы), приведены ниже.

Как вы знаете, сплайсосома (по крайней мере, для мРНК) представляет собой очень сложный многокомпонентный рибонуклеарно-белковый комплекс, функции которого заключаются как в сплайсинге интрона, так и в лигировании концов экзона. На приведенной ниже диаграмме из недавнего обзора предполагается, что распознавание сайтов сплайсинга также включает экзон.

Часть рис. 4 из TIBS (2016), том 41, стр. 33–45.

А авторы пишут (курсив мой):

«Спаривание оснований между 50-м концом мяРНК U1 и первыми шестью нуклеотидами интрона и до трех нуклеотидов экзона обеспечивает основную движущую силу для распознавания специфической последовательности».

Так что я думаю, что современный механизм удаления интронов мРНК требует, чтобы мРНК экзона «зацепилась».

Если бы такое удаление интронов могло служить функциональной цели, вы могли бы предположить, что механизм эволюционировал, чтобы приспособиться к таким ситуациям, но если основная функция интронов состоит в том, чтобы позволить дифференциальный сплайсинг экзонов, которые определяют области белка, интроны в конце мРНК не будет иметь никакой цели.

Еще один момент, который следует учитывать, - это сайт связывания РНК-полимеразы на ДНК (удлиненный и сложный промотор). Если бы интроны первоначально возникли как мобильные элементы (что предполагают авторы обзора), то вставка на 5'-конце, вероятно, инактивировала бы промотор, поэтому транскрипт не был бы произведен.

Конечно, в Природе полно исключений, и было бы глупо исключать существование интронов того типа, который вы постулируете (в какой-то далекой галактике...).

Так почему уценка? Если вы голосуете против кого-то, имейте мужество и порядочность, чтобы объяснить, почему. Что такого предосудительного в идее, что сплайсинг развился из-за того, что он позволил получить варианты белков путем дифференциального сплайсинга, и развился механизм, позволяющий справиться с этим? Что, хотя в UTR мРНК есть интроны, которые, возможно, влияют на связывание рибосом и т. д., они, вероятно, были вторичными. Если у вас есть комплекс, который должен связать две части веревки, прежде чем она сможет разрезать и соединить ее, вполне логично, чтобы он не работал в конце. Или тебе не нравится мой последний пункт?
Не понизил голос, но я предполагаю, что теоретический и неисточниковый характер этого ответа сыграет значительную роль. Кроме того, мне кажется странным, почему вы просите кого-то объяснить свое отрицательное мнение в такой оборонительной манере.
@MarchHo Я не буду стрелять в мессенджер, но когда вы проголосуете против, вам будет предложено оставить комментарий. Очень раздражает давать основанный на структуре ответ на теоретический (более гипотетический) вопрос и в итоге получить -1, чтобы случайный посетитель предположил, что с вашим ответом что-то в корне не так. Теперь я предполагаю, что самоуничижительная и причудливая ссылка на «Звездные войны» была неправильно понята как атака на вопрос. Возможно, я изменю его на Шекспира, когда позже добавлю изображение сплайсосомы, чтобы прояснить свой аргумент.
Ваш ответ касается сути, но небольшое объяснение и несколько диаграмм сделают его лучше.
@David Спасибо за ответ на мой вопрос. Мне нравится, что вы указали на структурную разницу между сплайсингом между экзонами и потенциальным удалением последовательности выше и ниже по течению без «партнера по сплайсингу». Кстати, я тоже не голосовал против, но мой голос еще не засчитан (отсутствует exp.).
@WYSIWYG - я добавил соответствующую диаграмму и усилил аргумент. Я не стал переключаться на Шекспира, но цитата, которую я имел в виду, была «Есть еще вещи на небе и на земле...». Например, журнал Nature на этой неделе сообщает, что N6-метиладенин был обнаружен у эукариот, где, как считалось, его не существует. Никогда не говори никогда.
@ Дэвид спасибо. Я уже поставил вам +1. Я понимаю, что есть много неизвестных механизмов (и да, я тоже видел эту статью), но я думаю, что мы можем объяснить, почему они редки.
@David, просто в качестве пояснения, пользователи не обязаны объяснять или «обосновывать» свои голоса, за или против. Сообщение, на которое вы ссылаетесь, отображается для пользователей с низким уровнем репутации или случайных пользователей сайта, но не для более опытных пользователей, которые теоретически понимают правила голосования. Я также хотел бы отметить, как это сделал Марч Хо, что нападки в такой оборонительной и оскорбительной манере не полезны для общего тона сайта и вряд ли побудят кого-либо объяснить или изменить свой голос. Будьте милы .
@MattDMo Хорошо, хорошо. Однако недавно я получил такое сообщение, и я публиковал его довольно часто. Сообщение подразумевает, что это правильный этикет, который должны были усвоить давние пользователи. И кстати, я не считаю свою манеру поведения оскорбительной. Это было сильно и прямолинейно, но не более того. Однако, когда я объяснил отрицательный голос повторно. еще одна публикация недавно мне откусили голову, поэтому я думаю, что нужно просто принять правила, которые более соблюдаются при их нарушении.

Спасибо за отличный вопрос.

Я хотел бы начать с уточнения терминологии.

Во-первых, зарождающаяся РНК относится к молекуле РНК, которая в настоящее время транскрибируется и не подвергалась процессингу. Процессинг может включать, например, сплайсинг интронов или полиаденилирование на 3'-конце. Зрелая РНК (обычно) подвергается сплайсингу и полиаденилированию.

Во-вторых, текущее консенсусное определение экзона - это транскрибируемая область генома, последовательность которой можно найти в зрелых видах РНК. Важно отметить, что существует два класса экзонов: некодирующие экзоны и экзоны, кодирующие белок. Я думаю, что вы можете запутаться, и я включил изображение, чтобы помочь прояснить различие между интронами, кодирующими экзонами и некодирующими экзонами, используя в качестве примера ген GAPDH человека.

Представление UCSC Genome Browser гена GAPDH человека

На рисунке сплошные синие прямоугольники представляют экзоны, присутствующие в зрелой мРНК . Эти экзоны могут содержать как белок-кодирующие, так и некодирующие последовательности, как я уже упоминал. Например, экзон 1 GAPDH содержит только некодирующую информацию, которая принадлежит 5'-нетранслируемой области (UTR), в то время как экзон 2 содержит как кодирующую, так и некодирующую информацию о последовательности.

Когда вы просматриваете аннотацию RefSeq, вы просматриваете все экзоны (кодирующие и некодирующие). Для некоторых генов, таких как GAPDH, первый экзон будет некодирующим. Другие гены могут начинаться с кодирующего экзона (мне еще предстоит найти его, и, поскольку 5'UTR участвует в связывании рибосомы , я сомневаюсь, что существует много примеров).

Области молекулы мРНК за пределами ее кодирующей последовательности называются 5'- и 3'-нетранслируемыми областями (UTR).

Я надеюсь, что это поможет ответить на ваш вопрос.

На самом деле это не отвечает на вопрос. Я думаю, что ОП знает об экзонах и UTR. Их вопрос о том, почему транскрипт всегда должен начинаться с экзона. Возможно, вы можете добавить некоторые пояснения к этому пункту.
Я не слышал о такой классификации, как кодирующие и некодирующие экзоны. Вы можете иметь экзоны, которые имеют часть CDS и часть UTR.
Спасибо за ваш ответ. Но мой вопрос не касался того, содержат ли экзоны кодирующие или некодирующие последовательности. Мне известен тот факт, что экзоны могут быть частью 5'- или 3'-НТО в зрелой мРНК, а также то, что вообще существуют некодирующие РНК. Как указал @WYSIWYG, я хотел бы знать, всегда ли необработанная зарождающаяся РНК начинается и заканчивается экзоном или они могут удалить последовательности РНК «голова» и «хвост», которые были транскрибированы с ДНК.
@WYSIWYG Спасибо за ваш комментарий. Возможно, кодирование по сравнению с некодированием ограничивается определенными кругами биоинформатики, где я и встретил этот термин. Я думаю, что соглашение UTR 5 '/ 3' более интуитивно понятно.
@HerrJemine Спасибо за разъяснение ваших конкретных потребностей. Как кто-то указал выше, только очень ограниченное подмножество РНК расщепляется на 5'-конце после транскрипции (мне не удалось найти примеров РНК млекопитающих, которые расщепляются на 3'-конце). Возможно, вам будет интересно изучить технику под названием NET-seq link . Он демонстрирует повсеместную транскрипцию за пределами транскрипционной единицы у дрожжей, мух и человека.