Статистическая генетика: частоты аллелей, соответствующие распределению Дирихле.

Из Фолля и Гаджиотти (2008 г.) (программное обеспечение BayeScan ). Они рассматривают модель, в которой несколько субпопуляций происходят от уникальной наследственной популяции.

Мы рассматриваем множество я места и пусть К я быть числом аллелей в я т час место. Степень дифференцировки в локусе я между субпопуляцией Дж а предковое население измеряется Ф С Т я Дж и является результатом его демографической истории. Позволять п я "=" { п я к } обозначают частоты аллелей предковой популяции в локусе я , где п я к это частота аллеля к в месте я ( к п я к "=" 1 ) . Мы используем п "=" { п я } для обозначения всего набора частот аллелей предковой популяции и п ~ я Дж "=" { п ~ я Дж к } для обозначения текущих частот аллелей в локусе я для субпопуляции Дж . При этих предположениях частоты аллелей в локусе я в субпопуляции Дж следуйте распределению Дирихле с параметрами θ я Дж п я ,

п ~ я Дж     ~   Реж. ( θ я Дж п я 1 , . . . , θ я Дж п я К я )

, где

θ я Дж "=" 1 Ф С Т я Дж 1

(У меня нет большого опыта работы с распределениями Дирихле, но я понимаю его определение и его полезность в байесовской статистике).

Не могли бы вы помочь мне понять, почему п ~ я Дж следует этому распределению Дирихле?

Вызов Дж т час параметр распределения Дирихле, α Дж , я обычно не понимаю, почему они "выбрали" α Дж "=" ( 1 Ф С Т я Дж 1 ) п я Дж а не, скажем так α Дж "=" Ф С Т я Дж п я Дж или что-нибудь еще.

Похоже, что это решение интегрального уравнения, описанного в книге Сьюэлла Райта «Эволюция в менделевских популяциях», раздел «Неповторяющиеся мутации» genetics.org/content/genetics/16/2/97.full.pdf .

Ответы (1)

В основном обоснованное предположение, основанное на свойствах распределений, а не на конкретных знаниях статистической генетики: бета-распределение полезно для моделирования частот двух аллелей в одном локусе. Распределение Диришле , которое представляет собой многомерное обобщение бета-распределения, таким образом, было бы полезно для моделирования набора локусов .

Оборотная сторона состоит в том, чтобы думать о бета как о частном случае Диришеле: если у вас есть только один локус, бета работает. Если у вас несколько локусов, то Dirichele.

Спасибо за Ваш ответ. Да, это то, что я знаю о статистике (все равно +1 в качестве благодарности). Я не понимаю, почему обычно α Дж "=" ( 1 Ф С Т я Дж 1 ) п я Дж а не, скажем так α Дж "=" Ф С Т я Дж п я Дж или что-нибудь еще. (Я добавлю эту точность в свой вопрос).