Простой вывод приближения Кимуры для вероятности фиксации мутации.

Приближение Кимуры для вероятности фиксации мутации при отборе до настоящего времени неоднократно использовалось в моделях популяционной генетики. Я пытаюсь понять математическую основу этого уравнения, но ни один из учебников или онлайн-ресурсов, которые я проверил, не дает простого вывода этого приближения, а просто цитирует статью Кимуры 1962 года .

п исправить 1 е 4 Н с п 1 е 4 Н с ( 1 )

Итак, я читал оригинальную статью, но предоставленный вывод не кажется мне ясным.


Подробности

Кимура начинает с определения вероятности изменения частоты аллеля как:

ты ( п , т + дельта т ) знак равно ф ( п + дельта п ; дельта т )   ты ( п + дельта п , т )   г ( дельта п ) ( 2 )

где (точно процитировано)

  • ты ( п , т ) вероятность того, что аллель зафиксируется в интервале времени т учитывая, что его начальная частота п .
  • ф ( п + дельта п ; дельта т ) – плотность вероятности изменения от п к п + дельта п


Затем он использует аппроксимацию ряда Тейлора, чтобы получить уравнение следующего вида:

ты ( п , т ) т знак равно В 2 2 ты п 2 + М ты п ( 3 )

Он определяет М и В как среднее и дисперсия изменения п за поколение. Формально они определяются как:

М знак равно лим дельта т 0 1 дельта т ( дельта п ) .   ф ( п + дельта п ; дельта т ) .   г ( дельта п )

В знак равно лим дельта т 0 1 дельта т ( дельта п ) 2 .   ф ( п + дельта п ; дельта т ) .   г ( дельта п )

( В на самом деле должен быть просто второй момент согласно математическому определению, а не дисперсия)

Затем он решает уравнение 3 в установившемся режиме с граничными условиями ты ( 0 , т ) знак равно 0 и ты ( 1 , т ) знак равно 1 чтобы получить это:

ты ( п ) знак равно 0 п грамм ( Икс ) г Икс 0 1 грамм ( Икс ) г Икс ( 4 )

куда:

грамм ( Икс ) знак равно опыт ( 2 М В г Икс )

Я понял вывод до этого момента.

Затем он просто ставит:

М знак равно с Икс ( 1 Икс )
В знак равно Икс ( 1 Икс ) / 2 Н

и получает уравнение 1.


Суммируя

Есть ли простой вывод уравнения 1?
Если нет, может ли кто-нибудь объяснить мне, как M и V были аппроксимированы, как указано выше?

хороший вопрос! Возможно, стоит попробовать спросить об этом на математическом стеке (или как там это называется), поскольку большинство биологов, вероятно, не понимают математики, стоящей за этим (я включаю сюда себя, и у меня, вероятно, больше математического образования, чем в среднем)
@Nicolai Возможно, математики действительно хорошо знают эти методы, но я боюсь, что без контекста простое знание математических методов не принесет никакой пользы. Я пытаюсь прочитать книгу Кимуры, которая более подробная. Думаю, я найду там ответ. Когда найду, выложу.

Ответы (1)

Предположительно, вы решили это, но в противном случае это потому, что УЧП является обратным уравнением Колмогорова , поэтому коэффициенты первого и второго порядка являются средним значением и дисперсией базового моделируемого стохастического процесса.

Подробно рассмотрим стохастическое дифференциальное уравнение (решение которого дается процессом диффузии Ито):

г п т знак равно мю ( п т , т ) г т + о ( п т , т ) г Вт т
то имеет место следующая система (при некоторых условиях):
т ты ( п , т ) знак равно мю ( п , т ) п ты ( п , т ) + 1 2 о 2 ( п , т ) 2 п 2 ты ( п , т )
куда ты это плотность п в т .

Обратите внимание, что дрейф (бесконечно малая средняя) М знак равно мю ( п , т ) и коэффициент диффузии (бесконечно малая дисперсия) В знак равно о 2 ( п , т ) такие же, как в статье (за исключением отрицательного знака, который, как я полагаю, игнорируется, поскольку он, кажется, в основном заботится только о случае, когда т ты 0 так или иначе). Действительно, они равнозначно пишутся:

мю ( п , т ) знак равно лим дельта т 0 1 дельта т Е [ п т + дельта т п т п т знак равно п ] знак равно М о 2 ( п , т ) знак равно лим дельта т 0 1 дельта т Е [ ( п т + дельта т п т ) 2 п т знак равно п ] знак равно В
как пишет Кимура.

Обратите внимание, что полезное приближение переходной плотности определяется выражением:

(ТД) п [ п т + дельта т п т ] Н ( п т + дельта т п т + мю ( п т , т ) дельта т , о 2 ( п т , т ) дельта т )

Итак, все вышеизложенное — это просто базовая теория стохастических процессов. Таким образом, если у нас есть стохастическая модель динамики населения, мы можем получить значения для М и В из него (путем вычисления его моментов), и они будут перенесены в обратное уравнение Колмогорова, на котором основана работа Кимуры.

Вот где проявляется мое невежество в динамике населения. Однако, поскольку Кимура упоминает Фишера и Райта, я просмотрел модель Райта-Фишера. Похоже, что Кимура использует приближение процесса диффузии модели Райта-Фишера. Похоже, это хорошо изученная и легендарная модель, которую я не могу полностью описать здесь; вместо этого я нашел работу Татару и др . «Статистический вывод в модели Райта-Фишера с использованием данных о частоте аллелей» как отличное ее описание, хотя я не претендую на то, чтобы понять ее большую часть.

Однако важно то, что изменение в генах (плотность перехода) может быть описано биномиальным распределением. Это можно аппроксимировать нормальным распределением:

п [ п т + дельта т п т ] Н ( п т + дельта т п т + а ( п т ) дельта т , п т ( 1 п т ) дельта т )
используя стандартное приближение к биному. Это тогда дает нам прямое уравнение Коломогорова (не обратное), записанное:
т ты знак равно п [ а ( п т ) ты ( п т ) ] + 1 2 2 п 2 [ п т ( 1 п т ) ты ( п т ) ]
Это в основном означает, что В знак равно п ( 1 п ) .

(Я заметил, что еще один способ доказать это — заметить, что приближенная диффузия Райта-Фишера (без каких-либо отборов и т. д.). а 0 ) имеет бесконечно малый генератор, заданный формулой: грамм ф ( п ) знак равно п ( 1 п ) т т ф ( п ) / 2 . Это сразу подразумевает В знак равно п ( 1 п ) . Но может быть менее простым для понимания. )

Однако сбивает с толку то, что в статье изменены временные рамки (переменные), так что дельта т Δ т / ( 2 Н ) , а затем установите дельта т к 1 (наверное для того что бы не пришлось писать 2 Н повсюду). Если мы отменим это преобразование, мы получим

п [ п т + дельта т п т ] Н ( п т + дельта т п т + а ( п т ) дельта т , п т ( 1 п т ) дельта т / ( 2 Н ) )
Если вы сравните это с нашей приблизительной плотностью перехода выше (уравнение (TD)), вы увидите, что это подразумевает:
о 2 знак равно В знак равно п ( 1 п ) / [ 2 Н ]
по желанию.

Теперь, каково бесконечно малое среднее, т.е. а или М ? Ясно, что это зависит от модели отбора, поскольку она определяет, как «среда» детерминистически влияет на процесс. Кимура описывает это как «постоянное преимущество выбора» с коэффициентом с . В статье Татару отмечается, что диффузионное приближение Райта-Фишера при генетическом дрейфе, мутации и отборе определяется следующим образом:

а ( п ) знак равно ν п + ξ ( 1 п ) + 2 Н т п ( 1 п ) [ час ( 1 2 час ) п ]
Если мы (1) проигнорируем мутацию, установив ν знак равно ξ знак равно 0 , (2) удалить эффекты аллельного доминирования, установив час знак равно 1 / 2 , и (3) определить с знак равно Н т , мы получили:
а ( п ) знак равно с п ( 1 п ) знак равно М
что, конечно, мы видим, отмечая М знак равно а ( п ) Спички мю в уравнении (TD) выше. (Обратите внимание, что 2 Н преобразование также произошло здесь, но оно было скрыто внутри с ).

Таким образом, мы получили, где Кимура М и В исходить, хотя и не самым простым способом.

Остается только вывести уравнение (стационарного) для ты . Думаю, я сделаю это для полноты.

Игнорируя стационарные индексы, получаем:

грамм ( Икс ) знак равно опыт ( 2 М В г Икс ) знак равно опыт ( 4 с Н г Икс ) знак равно опыт ( 4 с Н Икс ) ты ( п ) знак равно 0 п грамм ( Икс ) г Икс 0 1 грамм ( Икс ) г Икс знак равно 1 4 Н с [ опыт ( 4 с Н Икс ) ] 0 п 1 4 Н с [ опыт ( 4 с Н Икс ) ] 0 1 знак равно [ опыт ( 4 с Н п ) 1 ] [ опыт ( 4 с Н ) 1 ] знак равно 1 опыт ( 4 Н с п ) 1 опыт ( 4 Н с )
как требуется.


Приносим извинения за любые ошибки. (Я не занимаюсь моделированием динамики населения и не математик, поэтому, пожалуйста, указывайте на любые проблемы).

Большое спасибо. Я не очень хорошо понимаю KBE. Я помню, как читал об уравнении Фоккера-Планка, но я не знаком с ним в контексте диффузии. У меня нет опыта в SDE, поэтому мне может потребоваться некоторое время, чтобы понять.
@WYSIWYG Нет проблем. Основная идея, я думаю, заключается в том, что частота аллелей может быть смоделирована дифференциальным уравнением с шумом (SDE), которое аппроксимирует Райта-Фишера, тогда KBE выпадает из этого. Дайте мне знать, если есть что-то, что я могу расширить.