Несколько транскриптов, совпадающих с одним и тем же геном в de novo, собрали данные секвенирования РНК, но значения FPKM различаются?

Question

Несколько транскриптов, совпадающих с одним и тем же геном в de novo, собрали данные секвенирования РНК, но значения FPKM различаются?

взрыв
Биология
генетика
биоинформатика
секвенирование РНК
генная экспрессия

Фродо Бэггингс

У меня есть набор данных de novo, собранных наборами данных RNA-seq для разных типов образцов.

При BLAST многие совпадения отдельных транскриптов совпадают с одним и тем же геном в эталонном геноме. Однако каждая отдельная стенограмма имеет свое уникальное значение FPKM.

Во-первых, я озадачен тем, как можно иметь несколько последовательностей одного и того же гена с разными значениями FPKM — и, конечно же, мне также интересно, какой подход будет подходящим для последующего анализа. Должен ли я просто складывать значения FPKM для последовательностей с одинаковыми совпадениями?

Ответы (1)

Несколько транскриптов, совпадающих с одним и тем же геном в de novo, собрали данные секвенирования РНК, но значения FPKM различаются?

Бли · Answer 1

Если количественная оценка выполняется на уровне транскриптов, каждый идентифицированный транскрипт данного гена будет иметь разное количество прочтений, приписываемых ему, и, следовательно, другое значение RPKM.

Для последующего анализа вы можете продолжить на уровне стенограммы.

Я думаю, что вы не можете суммировать значения FPKM напрямую, потому что они обратно пропорциональны длине расшифровки («K» означает «килобазой»). Если вы хотите провести последующий анализ на уровне генов и использовать значения FPKM, вам придется умножить значения FPKM транскриптов на соответствующие длины транскриптов перед суммированием. Затем вам придется разделить эту сумму на длину гена или что-то в этом роде.

Действительно, вы не можете суммировать FPKM, и в настоящее время вам, вероятно, следует попытаться отказаться от их использования в первую очередь (они имеют некоторую предвзятость, но все еще широко используются). Но даже если вы получите необработанные значения для каждого транскрипта, вам не следует напрямую суммировать их, чтобы получить количество для каждого гена. Если вы получили свои подсчеты с помощью Kallisto или Salmon, самый простой способ — либо использовать sleuth для работы непосредственно с расшифровками, либо tximport для суммирования подсчетов и ввода их в DESeq, edgeR или другую программу.

Несколько транскриптов, совпадающих с одним и тем же геном в de novo, собрали данные секвенирования РНК, но значения FPKM различаются?

Фродо Бэггингс

Ответы (1)

Бли

Алекслок

Какую информацию можно извлечь из данных РНК-секвенирования во времени?

Термины GO для немодельных организмов

Эпистаз между хромосомами и индивидуумами, «гомозиготными по взаимодействиям»

Генное возмущение, для чего оно используется, объясните компьютерщикам? [закрыто]

Содержит ли ДНК информацию помимо синтеза белка?

Где найти данные об экспрессии генов E.coli?

Использование секвенирования РНК для сравнения экспрессии генов у пациентов, а не между контрольными и экспериментальными условиями.

Помогите найти определенные последовательности типов генов BlaZ в Genbank

Дифференциальный анализ экспрессии генов между видами

Каков наиболее подходящий способ нормализации данных об экспрессии генов?