У меня есть данные секвенирования РНК из кожи мыши и человека (по 2 повторения каждого) и я хочу сравнить экспрессию ортологичных генов, чтобы найти те, которые экспрессируются по-разному. Я квантильно нормализовал матрицу экспрессии генов во всех 4 образцах (2 мыши + 2 человека). В конечном итоге я хочу рассчитать логарифмическое изменение экспрессии всех ортологичных генов между двумя видами. Однако прежде чем я это сделаю, я должен проверить длину гена, верно? Будет ли этого достаточно, чтобы дать мне представление о дифференциально выраженных генах, или мне следует использовать более сложные методы? Любые комментарии будут полезны. Большое спасибо.
На самом деле это зависит от того, какой тип данных у вас есть. Существуют методы, разработанные исключительно для количественной оценки относительной экспрессии на основе данных подсчета, например, с использованием edgeR или limma-voom.
Вам не нужно корректировать длину гена, чтобы оценить кратность изменений относительной экспрессии, вам нужно сначала нормализовать размер библиотеки (и в процессе получить log2 ((counts + 0,5)/1e+06), а затем , после нормализации квантилей вы можете просто вычислить мышь-человек или человек-мышь, чтобы получить оценку кратного изменения.
Тем не менее, я бы порекомендовал использовать для этой задачи что-то более сложное, например, limma-voom, потому что это также позволит вам получить такие вещи, как коэффициент ложных открытий для ваших изменений фолда.
МэттДмо