Я уверен, что ответ очевиден для некоторых из вас, но я только что закончил свою стажировку, когда мы обнаружили новые сплайс-соединения (junctionseq; данные RNAseq) (см. прикрепленный файл), и у меня есть некоторые трудности со сплайс-соединениями. Я понимаю, что чтения могут отображаться на стыке двух экзонов (что может быть связано с оценкой качества) и что, сравнивая два состояния, мы можем найти группы экзонов, более «связанные», но я не понимаю:
Соединение сплайсинга образуется из пре-мРНК (или первичного транскрипта) всякий раз, когда интрон удаляется или сплайсируется. Два сегмента РНК, которые раньше были разделены в пре-мРНК, теперь лигированы друг с другом, образуя соединение двух экзонов.
Чтения RNA-Seq, которые охватывают такой сайт соединения сплайсинга, не будут очень хорошо выравниваться с геномной последовательностью, однако, если вы создадите файл всех потенциальных смоделированных соединений сплайсинга, могут быть некоторые чтения RNA-Seq, которые теперь идеально выравниваются.
Различие между тем, что составляет интрон, и тем, что составляет экзон, является чисто эмпирическим. Хотя это правда, что сплайсосомный комплекс предпочтительно распознает и связывается с правильно расположенными донорными и акцепторными сайтами сплайсинга, множество различных процессированных, зрелых транскриптов может происходить из одного первичного транскрипта. Этот дифференциальный анализ цис-действующих последовательностей на границах потенциальных интронов и экзонов называется альтернативным сплайсингом.
Николай
WYSIWYG