Для проблемы ниже я знаю о задействованной статистике, но просто не могу понять следующее:
В биологии мы используем количественную ПЦР для измерения экспрессии генов или количества копий мРНК. Он делает это, подсчитывая, сколько циклов усиления (2^) необходимо для достижения порога. Итак, чтобы упростить все, давайте предположим, что 1024 копии потребуют 10 циклов (2 ^ 10). Если копий больше, то для достижения порога потребуется меньше циклов, поэтому для 2024 копий потребуется 9 циклов, для 512 копий — 11 циклов и т. д. Теперь представьте следующий сценарий:
У нас есть следующие образцы:
Sample 1. 1024 copies of gene A and 4096 copies of gene B
Sample 2. 1024 copies of gene A and 16384 copies of gene B
Теперь мы хотим сравнить образец 2 с образцом 1, с геном B по отношению к гену A:
В абсолютных числах это будет:
Sample 1. 4096 / 1024 = 4x more B
Sample 2. 16384 / 1024 = 16x more B
The average amount more B = (16 + 4) / 2 = 10x more B
Теперь с qPCR те же образцы, что и выше, будут выглядеть следующим образом:
Sample 1. Gene A 10 cycles, Gene B 8 cycles.
Sample 2. Gene A 10 cycles, Gene B 6 cycles.
Теперь, используя стандартные методы, используемые для данных количественной ПЦР, мы сначала берем разницу между геном B и A. Затем следует среднее значение разницы, и это берется 2 ^.
Sample 1. 10 - 8 = 2 cycles
Sample 2. 10 - 6 = 4 cycles
The average amount more B = 2^((2 + 4)/2) = 8x more B
Все публикации / программные инструменты и т. д. будут вычислять в среднем в 8 раз больше B. И я знаю, что это произошло из шкалы log2, однако почему этот статистически точный метод отличается по результату от абсолютных чисел?
Обновление . Я упростил свой вопрос, поэтому ниже приведены некоторые подробности моей «проблемы».
Condition 1 biorep 1. 1024 copies of ref and 1024 copies of gene X
Condition 1 biorep 2. 1024 copies of ref and 1024 copies of gene X
Condition 2 biorep 1. 1024 copies of ref and 4096 copies of gene X
Condition 2 biorep 2. 1024 copies of ref and 16384 copies of gene X
Таким образом, чтобы вычислить в абсолютных числах среднее количество большего количества гена X в состоянии 2 по сравнению с 1:
We can forget the reference gene here as cDNA amounts are the same, therefore:
Condition 1 biorep 1 & 2: average (1024 + 1024) / 2 = 1024 copies
Condition 2 biorep 1 & 2: average (4096 + 16384) / 2 = 10240 copies
Condition 2 vs 1: average 10240 / 1024 = 10x more gene X in condition 2 vs 1
Теперь со значениями qPCR CT на основе приведенных выше чисел:
Condition 1 biorep 1. Ref_CT 10 and GeneX_CT 10
Condition 1 biorep 2. Ref_CT 10 and GeneX_CT 10
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 8
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 6
Теперь, используя официальные расчеты qPCR:
Condition 1, Ref_CT mean (10 + 10) / 2 = 10
Condition 2, Ref_CT mean (10 + 10) / 2 = 10
Condition 1, GeneX_CT mean (10 + 10) / 2 = 10
Condition 2, GeneX_CT mean (8 + 6) / 2 = 7
Ref_deltaCT (10 - 10) = 0
GeneX_deltaCT (10 - 7) = 3
delta_deltaCT (3 - 0) = 3
Difference Condition 2 vs 1 = (2^3) = 8x
Это соответствует в среднем в 8 раз большему количеству гена X в состоянии 2 по сравнению с состоянием 1. Вот разница в 8 раз против 10 раз. Также любая программа, которую вы будете использовать для заполнения этих значений CT, приведет к соотношению 8 к 10.
Возможно, это потому, что этот метод, равный 8, следует использовать только для технических повторений, а биорепатриантам следует использовать другое уравнение, дающее 10?
Образец 1. 4096 / 1024 = в 4 раза больше B
Пример 2. 16384 / 1024 = в 16 раз больше B
Среднее количество больше B = (16 + 4) / 2 = в 10 раз больше B
Это неправильный путь. Вы вычисляете среднее выражение B
в обоих образцах. Это не значит, что их 10x
больше B
. Просто 4x
больше B
по Sample-2
сравнению с Sample-1
.
Gene-A
не меняет свою экспрессию между образцами и может использоваться в качестве эталонного гена.
Если вы рассчитываете по пороговому циклу, кратное изменение
См. также этот пост.
Среднее значение рассчитывается между повторами, а не между различными экспериментальными условиями.
Иногда вычисляется среднее значение двух экспериментальных образцов — обычно это делается в анализе MA-графика, который делается для фильтрации генов, которые показывают очень высокие кратные изменения только из-за их общей низкой экспрессии ( 1: 4 против 100: 300 ).
Ответ на ваше редактирование
Не следует брать среднее (среднее арифметическое) Ct. Они не масштабируются линейно с выражением (и наоборот).
Для любой нелинейной функции :
Кроме того, для выпуклой функции:
где ожидаемая стоимость
является выпуклой функцией относительно ( любое действительное число > 1). Таким образом, вы можете применить неравенство Дженсена к значениям и выражению Ct.
Пим
Пим
WYSIWYG