Диффузионное приближение к генетическому дрейфу

Я читаю из классического учебника «Принципы популяционной генетики» Хартла и Кларка (pdf здесь ).

Вступление

Позволять ф ( п , Икс , т ) обозначают распределение частот аллелей Икс вовремя т зная, что в свое время т знак равно 0 частота была п . Можно смоделировать изменение этого распределения во времени, используя прямое уравнение Колмогорова

ф ( п , Икс , т ) т знак равно [ М ( Икс ) ф ( п , Икс , т ) ] Икс + 1 2 2 [ В ( Икс ) ф ( п , Икс , т ) ] Икс 2

куда М ( Икс ) является «параметром дрейфа», который представляет собой естественный отбор (таким образом, в отсутствие отбора М ( Икс ) знак равно 0 ), и В ( Икс ) - это «параметр диффузии», который представляет генетический дрейф. Параметр диффузии В ( Икс ) знак равно Икс ( 1 Икс ) 2 Н , куда Н это численность населения.

Вопрос

Почему это правда, что В ( Икс ) знак равно Икс ( 1 Икс ) 2 Н ?

Я приветствую интуитивные объяснения и математические доказательства.

Мысли

Я бы подумал, что это происходит от модели дрейфа генов Райта-Фишера, где распределение частоты аллелей в следующем поколении определяется биномиальным распределением.

Какое определение для N в V(x)?
Н это численность населения. Спасибо, что заметили. Вопрос отредактирован.

Ответы (1)

Он действительно исходит из модели Райта-Фишера, а именно из ее приближения процесса диффузии.

Если численность населения Н , то при генерации т количество аллелей А ( т ) , поэтому частота аллелей равна Икс ( т ) знак равно А ( т ) / ( 2 Н ) , предполагая диплоидный случай. Затем Райт-Фишер говорит, что:

А ( т + 1 ) А ( т ) Бин ( 2 Н , Икс ( т ) )
Таким образом, распределение подсчета следующего поколения с учетом последнего имеет биномиальное распределение (при случайном спаривании). Можно найти, что для биномиально распределенной случайной величины б Бин ( м , п ) , среднее значение и дисперсия определяются как :
Е [ б ] знак равно м п & В [ б ] знак равно м п ( 1 п )
Таким образом, мы получаем, что
Е [ А ( т + 1 ) А ( т ) ] знак равно 2 Н Икс ( т ) & В [ А ( т + 1 ) А ( т ) ] знак равно 2 Н Икс ( т ) [ 1 Икс ( т ) ]
Применение Икс ( т ) знак равно А ( т ) / ( 2 Н ) , Мы видим, что
Е [ Икс ( т + 1 ) Икс ( т ) ] знак равно 1 2 Н Е [ А ( т + 1 ) А ( т ) ] знак равно Икс ( т ) В [ Икс ( т + 1 ) Икс ( т ) ] знак равно 1 ( 2 Н ) 2 В [ А ( т + 1 ) А ( т ) ] знак равно Икс ( т ) [ 1 Икс ( т ) ] 2 Н
используя тот факт, что В [ с Икс ] знак равно с 2 В [ Икс ] .

К форварду Колмогорову мы можем отнести это следующим образом. Напомним, что биномиальное распределение может быть аппроксимировано нормальным распределением со средним значением мю и дисперсия о 2 определяется средним значением и дисперсией бинома. Это говорит нам о том, что:

Икс ( т + дельта т ) Икс ( т ) Н ( Икс ( т ) , ( дельта т ) Икс ( т ) [ 1 Икс ( т ) ] / ( 2 Н ) )
Тогда из свойств нормального распределения следует, что
Δ Икс т знак равно Икс ( т + дельта т ) Икс ( т ) Н ( 0 , о 2 ( Икс т ) дельта т )
куда о 2 ( Икс т ) знак равно Икс ( т ) [ 1 Икс ( т ) ] / ( 2 Н ) . Отсюда следует следующее равенство (в распределении):
Δ Икс т знак равно о ( Икс т ) Δ Вт т
куда Δ Вт т Н ( 0 , дельта т ) . В качестве дельта т 0 , получаем стохастическое дифференциальное уравнение ,
г Икс т знак равно о ( Икс т ) г Вт т
где решения представляют собой марковские случайные процессы (в отличие, например, от ОДУ, где есть только одно решение и это детерминированный путь; думайте об этом как об ОДУ с шумом), в частности, в этом случае диффузия Ито . Обратите внимание, что SDE не имеет г т компонента, поскольку среднее значение приращения было 0 . Если затем мы рассмотрим функцию плотности для случайного процесса п ( Икс , т ) , оно должно удовлетворять уравнению Фоккера-Планка (вперед Колмогорова) :
т п ( Икс , т ) знак равно Икс Икс [ п ( Икс , т ) о 2 ( Икс ) / 2 ]
который дает распределение вероятностей по значению аллельной частоты в каждый момент времени (с учетом некоторого начального значения, которое я здесь не указал). Обратите внимание, что В ( Икс ) знак равно о 2 ( Икс ) .


Что касается интуиции, я не совсем уверен. По сути В ( Икс ) измеряет, какое изменение частоты аллелей вы можете ожидать в каждом поколении из-за чисто случайных эффектов, т. е. генетического дрейфа. Заметьте, что возмущение отсутствует , когда Икс знак равно 0 или Икс знак равно 1 , то есть никакие случайные изменения не могут произойти, если ни у кого или у всех нет аллеля. Заметьте также, что эта дисперсия в точности соответствует дисперсии распределения Бернулли . Это похоже на то, что мы преобразовали модель индивидуального уровня в модель уровня популяции, которая просто рассматривает частоту бинарного выбора присутствия аллеля, я полагаю. Дисперсия (шум) максимальна, когда частота 1 / 2 . Это как бы отодвигает аллель от середины, увеличивая шум, когда кто-то идет туда; можно было бы ожидать, что (если работать достаточно долго) любая такая модель столкнется и застрянет на 0 или 1 (не уверен, что это правда). Я немного поискал, есть ли другие интересные интерпретации рассматриваемого здесь sde (например, в физике), но не нашел. По сути, это было бы эквивалентно уравнению теплопроводности, распространяющемуся под некоторой потенциальной функцией, контролируемой о .


Ваш вопрос тесно связан с этим . Мой ответ в значительной степени соответствует Татару и др., Статистический вывод в модели Райта-Фишера с использованием данных о частоте аллелей .