Отклонение от равновесия Харди Вайнберга (HWE)

У меня есть набор из 10 генов, каждый ген содержит около 15 SNP. Я проверил отклонение от равновесия Харди-Вайнберга (HWE) для всех SNP. Все SNP не отклонялись от HWE, кроме 5 SNP в ABCG8, они имели p<0,05. Я обнаружил различные факторы, которые могут повлиять на HWE. Мой вопрос: почему остальные SNP соответствовали HWE, почему только 5 SNP в ABCG8 в значительной степени отклоняются от HWE?

Будьте осторожны с утверждениями, основанными на p-значениях: p-значение позволяет отвергнуть нулевую гипотезу, но не подтвердить ее . Другими словами, когда п < 0,05 можно сказать, что HWE сломан, однако п > 0,05 не означает, что HWE держится - он все еще может быть нарушен, но мы не можем этого доказать.
Я бы немного поспорил с @Vadim - когда вы делаете 150 тестов, вы ожидаете, что 0,05 * 150 "=" 7,5 SNP должны быть п < 0,05 , как и при нулевой гипотезе, значения p из независимых тестов распределены равномерно. P-значения являются довольно низким стандартом доказательности, за исключением случаев, когда они очень малы. То, что все 5 встречаются в одном гене, может быть удивительным, но, тем не менее, я бы сказал, что «отвержение» нулевой гипотезы на ее основе немного сильно, поскольку наблюдения все еще довольно согласуются с нулевой гипотезой (без просмотра дополнительных данных).
@MaximilianPress Я говорил о более фундаментальной разнице в p-значении и мощности, возражая против утверждения, что остальные SNP соответствуют HWE . Однако я согласен с вами в том, что, учитывая большое количество тестов, даже пять SNP с п < 0,05 не являются доказательством нарушения HWE.
@Вадим, хорошо, это логично. Я согласен с вашей общей точкой зрения о p-значениях, используемых для подтверждения нулевой гипотезы, я думаю, что меня просто беспокоила другая сторона вопроса, которая не была ясна. Я думаю, что вы на самом деле задали вопрос достаточно прямо и точно! Я бы предложил превратить это в ответ, на самом деле.

Ответы (1)

Тест значимости (т. е. p-значение) позволяет нам отвергнуть нулевую гипотезу, но не подтвердить ее. Другими словами, когда п < 0,05 можно сказать, что условия для HWE не выполнены, однако п > 0,05 не означает, что HWE выполняется - условия могут еще не выполняться, но мы не можем этого доказать. Таким образом, делая такие утверждения, как « Все SNP не отклонялись от HWE, а остальные SNP соответствовали HWE», можно совершить статистическую ошибку II типа .

Как правильно заметил @MaximilianPress, в этом случае не следует делать никаких заявлений о SNP с п < 0,05 либо из-за высокой вероятности ложного обнаружения . Действительно, p-значение дает нам вероятность того, что данные будут, по крайней мере, столь же экстремальными, как наблюдалось, даже если нулевая гипотеза верна. Данный Н "=" 150 SNP можно ожидать примерно

Н × α "=" 150 × 0,05 "=" 7,5
статистически значимые результаты происходят случайно, даже если HWE выполняется. То есть можно также совершить ошибку первого рода, отвергнув нулевую гипотезу, когда она верна. Для исключения этой ошибки необходимо использовать более строгий критерий, например, поправку Бонферрони , т. е. тестирование по уровню значимости Н раз меньше текущего α "=" 0,05 :
α α Н "=" 0,05 150 0,0003