Из Фолля и Гаджиотти (2008 г.) (программное обеспечение BayeScan ). Они рассматривают модель, в которой несколько субпопуляций происходят от уникальной наследственной популяции.
Мы рассматриваем множество места и пусть быть числом аллелей в место. Степень дифференцировки в локусе между субпопуляцией а предковое население измеряется и является результатом его демографической истории. Позволять обозначают частоты аллелей предковой популяции в локусе , где это частота аллеля в месте . Мы используем для обозначения всего набора частот аллелей предковой популяции и для обозначения текущих частот аллелей в локусе для субпопуляции . При этих предположениях частоты аллелей в локусе в субпопуляции следуйте распределению Дирихле с параметрами ,
, где
(У меня нет большого опыта работы с распределениями Дирихле, но я понимаю его определение и его полезность в байесовской статистике).
Не могли бы вы помочь мне понять, почему следует этому распределению Дирихле?
Вызов параметр распределения Дирихле, , я обычно не понимаю, почему они "выбрали" а не, скажем так или что-нибудь еще.
В основном обоснованное предположение, основанное на свойствах распределений, а не на конкретных знаниях статистической генетики: бета-распределение полезно для моделирования частот двух аллелей в одном локусе. Распределение Диришле , которое представляет собой многомерное обобщение бета-распределения, таким образом, было бы полезно для моделирования набора локусов .
Оборотная сторона состоит в том, чтобы думать о бета как о частном случае Диришеле: если у вас есть только один локус, бета работает. Если у вас несколько локусов, то Dirichele.
Ганс