(Обновленный вопрос) Проблема со средним значением Fold-change по сравнению с абсолютными данными (в qPCR)

Question

(Обновленный вопрос) Проблема со средним значением Fold-change по сравнению с абсолютными данными (в qPCR)

пкр
Биология
статистика
количественная генетика

Пим

Для проблемы ниже я знаю о задействованной статистике, но просто не могу понять следующее:

В биологии мы используем количественную ПЦР для измерения экспрессии генов или количества копий мРНК. Он делает это, подсчитывая, сколько циклов усиления (2^) необходимо для достижения порога. Итак, чтобы упростить все, давайте предположим, что 1024 копии потребуют 10 циклов (2 ^ 10). Если копий больше, то для достижения порога потребуется меньше циклов, поэтому для 2024 копий потребуется 9 циклов, для 512 копий — 11 циклов и т. д. Теперь представьте следующий сценарий:

У нас есть следующие образцы:

Sample 1. 1024 copies of gene A and 4096 copies of gene B
Sample 2. 1024 copies of gene A and 16384 copies of gene B

Теперь мы хотим сравнить образец 2 с образцом 1, с геном B по отношению к гену A:

В абсолютных числах это будет:

Sample 1. 4096 / 1024 = 4x more B
Sample 2. 16384 / 1024 = 16x more B
The average amount more B = (16 + 4) / 2 = 10x more B

Теперь с qPCR те же образцы, что и выше, будут выглядеть следующим образом:

Sample 1. Gene A 10 cycles, Gene B 8 cycles.
Sample 2. Gene A 10 cycles, Gene B 6 cycles.

Теперь, используя стандартные методы, используемые для данных количественной ПЦР, мы сначала берем разницу между геном B и A. Затем следует среднее значение разницы, и это берется 2 ^.

Sample 1. 10 - 8 = 2 cycles
Sample 2. 10 - 6 = 4 cycles
The average amount more B = 2^((2 + 4)/2) = 8x more B

Все публикации / программные инструменты и т. д. будут вычислять в среднем в 8 раз больше B. И я знаю, что это произошло из шкалы log2, однако почему этот статистически точный метод отличается по результату от абсолютных чисел?

Обновление . Я упростил свой вопрос, поэтому ниже приведены некоторые подробности моей «проблемы».

Condition 1 biorep 1. 1024 copies of ref and 1024 copies of gene X
Condition 1 biorep 2. 1024 copies of ref and 1024 copies of gene X
Condition 2 biorep 1. 1024 copies of ref and 4096 copies of gene X
Condition 2 biorep 2. 1024 copies of ref and 16384 copies of gene X

Таким образом, чтобы вычислить в абсолютных числах среднее количество большего количества гена X в состоянии 2 по сравнению с 1:

We can forget the reference gene here as cDNA amounts are the same, therefore: 
Condition 1 biorep 1 & 2: average (1024 + 1024) / 2 = 1024 copies
Condition 2 biorep 1 & 2: average (4096 + 16384) / 2 = 10240 copies
Condition 2 vs 1: average 10240 / 1024 = 10x more gene X in condition 2 vs 1

Теперь со значениями qPCR CT на основе приведенных выше чисел:

Condition 1 biorep 1. Ref_CT 10 and GeneX_CT 10
Condition 1 biorep 2. Ref_CT 10 and GeneX_CT 10
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 8
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 6

Теперь, используя официальные расчеты qPCR:

Condition 1, Ref_CT mean (10 + 10) / 2 = 10
Condition 2, Ref_CT mean (10 + 10) / 2 = 10
Condition 1, GeneX_CT mean (10 + 10) / 2 = 10
Condition 2, GeneX_CT mean (8 + 6) / 2 = 7

Ref_deltaCT (10 - 10) = 0
GeneX_deltaCT (10 - 7) = 3

delta_deltaCT (3 - 0) = 3
Difference Condition 2 vs 1 = (2^3) = 8x

Это соответствует в среднем в 8 раз большему количеству гена X в состоянии 2 по сравнению с состоянием 1. Вот разница в 8 раз против 10 раз. Также любая программа, которую вы будете использовать для заполнения этих значений CT, приведет к соотношению 8 к 10.

Возможно, это потому, что этот метод, равный 8, следует использовать только для технических повторений, а биорепатриантам следует использовать другое уравнение, дающее 10?

Ответы (1)

(Обновленный вопрос) Проблема со средним значением Fold-change по сравнению с абсолютными данными (в qPCR)

WYSIWYG · Answer 1

Образец 1. 4096 / 1024 = в 4 раза больше B

Пример 2. 16384 / 1024 = в 16 раз больше B

Среднее количество больше B = (16 + 4) / 2 = в 10 раз больше B

Это неправильный путь. Вы вычисляете среднее выражение Bв обоих образцах. Это не значит, что их 10xбольше B. Просто 4xбольше Bпо Sample-2сравнению с Sample-1.

Gene-Aне меняет свою экспрессию между образцами и может использоваться в качестве эталонного гена.

Если вы рассчитываете по пороговому циклу, кратное изменение $= 2^{8-6} = 4x$

См. также этот пост.

Среднее значение рассчитывается между повторами, а не между различными экспериментальными условиями.

Иногда вычисляется среднее значение двух экспериментальных образцов — обычно это делается в анализе MA-графика, который делается для фильтрации генов, которые показывают очень высокие кратные изменения только из-за их общей низкой экспрессии ( 1: 4 против 100: 300 ).

Ответ на ваше редактирование

Не следует брать среднее (среднее арифметическое) Ct. Они не масштабируются линейно с выражением (и наоборот).

Для любой нелинейной функции $f(x)$ :

ф (Икс + у) \neq ф (Икс) + ф (у)

$f(x+y) \ne f(x)+f(y)$

ф (\frac{Икс + у}{2}) \neq \frac{ф (Икс) + ф (у)}{2}

$f\left(\frac{x+y}{2}\right) \ne \frac{f(x)+f(y)}{2}$

Кроме того, для выпуклой функции:

ф (Е [Икс]) \leq Е [ф (Икс)]

$f(E[x]) \le E[f(x)]$

Дж е н с е н^{'} с я н е д ты а л я т у

$Jensen's\ inequality$

где $E[x]$ ожидаемая стоимость $x$

$a^x$ является выпуклой функцией относительно $x$ ( $a$ любое действительное число > 1). Таким образом, вы можете применить неравенство Дженсена к значениям и выражению Ct.

Я полностью согласен с вашим ответом, я думаю, что я слишком упростил свой вопрос, выше я отредактировал свой исходный пост, чтобы немного уточнить свой вопрос.
Ответ, который вы даете в своем редактировании, также является ответом, который я ожидал. Однако все (коммерческие) инструменты предполагают, что значения Ct имеют линейную шкалу, и поэтому вы берете среднее арифметическое Ct, в результате чего получается 8x. И поскольку вы берете 2 ^ от Ct, абсолютные значения не являются. Это означает, что вам придется взять среднее геометрическое 4096 и 16384, что равно 8192 (что равно 8x 1024). По-видимому, все опубликованные методы считают, что абсолютные значения не имеют линейной шкалы, и на самом деле значения Ct таковы. Что с биологической точки зрения трудно понять.
Если кого-то интересует средний Ct, то он вполне может это сделать. Но мы не заинтересованы в том, что мы. Независимо значения не находятся ни в какой шкале. Они масштабируются с другим значением в соответствии с некоторой функцией. Таким образом, экспрессия экспоненциально увеличивается с Ct. Так $Expression = f(Ct)$ . Я должен уточнить об этом. Отредактировано

(Обновленный вопрос) Проблема со средним значением Fold-change по сравнению с абсолютными данными (в qPCR)

Пим

Ответы (1)

WYSIWYG

Пим

Пим

WYSIWYG

Корректное/полное представление статистики RTPCR

Зачем оценивать линейные и полные (линейные, квадратичные и корреляционные) коэффициенты отбора по отдельности?

Как рассчитать индекс Жаккара [закрыто]

Все ли фенотипы нормально распределены

Каково назначение Y-образных адаптеров при секвенировании Illumina?

Найдите длину последовательности ДНК? [закрыто]

Отличие отца от брата

Какой был бы самый короткий и оптимальный метод выделения клеток человека для ПЦР? Существует ли протокол ПЦР колоний для клеток человека?

Как измеряется частота ошибок ДНК-полимеразы?

Объединение для количественной ПЦР