Статистическая генетика: частоты аллелей, соответствующие распределению Дирихле.

Question

Статистическая генетика: частоты аллелей, соответствующие распределению Дирихле.

Биология
генетика
эволюция
статистика
популяционная генетика
теоретическая биология

Реми.б

Из Фолля и Гаджиотти (2008 г.) (программное обеспечение BayeScan ). Они рассматривают модель, в которой несколько субпопуляций происходят от уникальной наследственной популяции.

Мы рассматриваем множество $I$ места и пусть $K_i$ быть числом аллелей в $i^{th}$ место. Степень дифференцировки в локусе $i$ между субпопуляцией $j$ а предковое население измеряется $F^{ij}_{ST}$ и является результатом его демографической истории. Позволять $p_i=\{p_{ik}\}$ обозначают частоты аллелей предковой популяции в локусе $i$ , где $p_{ik}$ это частота аллеля $k$ в месте $i$ $\left(\sum_k p_{ik} = 1\right)$ . Мы используем $\mathbf {p} = \{\mathbf {p_i}\}$ для обозначения всего набора частот аллелей предковой популяции и $\mathbf {\tilde p_{ij}} = \{ \tilde p_{ijk}\}$ для обозначения текущих частот аллелей в локусе $i$ для субпопуляции $j$ . При этих предположениях частоты аллелей в локусе $i$ в субпопуляции $j$ следуйте распределению Дирихле с параметрами $\theta_{ij}\mathbf {p_i}$ ,

${\tilde{п}}_{я Дж} \tilde{} Реж. (θ_{я Дж} п_{я 1}, . . ., θ_{я Дж} п_{я К_{я}})$ $\mathbf {\tilde p_{ij}} \space \tilde \space\space \text{Dir}(\theta_{ij} p_{i1}, ..., \theta_{ij}p_{iK_i})$

, где

$θ_{я Дж} "=" \frac{1}{Ф_{С Т}^{я Дж}} - 1$ $\theta_{ij} = \frac{1}{F^{ij}_{ST}}-1$

^{(У меня нет большого опыта работы с распределениями Дирихле, но я понимаю его определение и его полезность в байесовской статистике).}

Не могли бы вы помочь мне понять, почему $\mathbf {\tilde p_{ij}}$ следует этому распределению Дирихле?

Вызов $j^{th}$ параметр распределения Дирихле, $\alpha_j$ , я обычно не понимаю, почему они "выбрали" $\alpha_j = \left(\frac{1}{F^{ij}_{ST}}-1\right) p_{ij}$ а не, скажем так $\alpha_j = F^{ij}_{ST} p_{ij}$ или что-нибудь еще.

Ганс

Похоже, что это решение интегрального уравнения, описанного в книге Сьюэлла Райта «Эволюция в менделевских популяциях», раздел «Неповторяющиеся мутации» genetics.org/content/genetics/16/2/97.full.pdf .

Ответы (1)

Статистическая генетика: частоты аллелей, соответствующие распределению Дирихле.

Похоже, что это решение интегрального уравнения, описанного в книге Сьюэлла Райта «Эволюция в менделевских популяциях», раздел «Неповторяющиеся мутации» genetics.org/content/genetics/16/2/97.full.pdf .

кмм · Answer 1

В основном обоснованное предположение, основанное на свойствах распределений, а не на конкретных знаниях статистической генетики: бета-распределение полезно для моделирования частот двух аллелей в одном локусе. Распределение Диришле , которое представляет собой многомерное обобщение бета-распределения, таким образом, было бы полезно для моделирования набора локусов .

Оборотная сторона состоит в том, чтобы думать о бета как о частном случае Диришеле: если у вас есть только один локус, бета работает. Если у вас несколько локусов, то Dirichele.

Спасибо за Ваш ответ. Да, это то, что я знаю о статистике (все равно +1 в качестве благодарности). Я не понимаю, почему обычно $\alpha_j = \left(\frac{1}{F^{ij}_{ST}}-1\right) p_{ij}$ а не, скажем так $\alpha_j = F^{ij}_{ST} p_{ij}$ или что-нибудь еще. (Я добавлю эту точность в свой вопрос).

Статистическая генетика: частоты аллелей, соответствующие распределению Дирихле.

Реми.б

Ганс

Ответы (1)

кмм

Реми.б

Внутри и между разнообразием аллельных классов

По коэффициенту отбора

Как получить среднее число попарных различий среди популяций?

Понимание F-статистики в популяционной генетике

Простой вывод приближения Кимуры для вероятности фиксации мутации.

Диффузионное приближение к генетическому дрейфу

Почему наклон регрессии родитель-потомок равен наследуемости в узком смысле?

Какая часть сайтов должна быть полиморфной?

Возникают ли мутантные аллели в результате мутации дикого типа?

Почему количество мутаций на человека подчиняется распределению Пуассона?