Вопрос
Рассмотрим очень длинную (в конечном итоге бесконечную) последовательность нейтральных участков ДНК. Рассмотрим панмиктическую популяцию постоянного размера. с частотой мутаций на сайт где все люди имеют одинаковую приспособленность.
Какова доля сайтов, которые, как мы ожидаем, будут полиморфными в популяции (SNP)?
Мотивация этого вопроса
Я задаю этот вопрос, чтобы проверить результаты моделирования, которое я запускаю. Например, я запускаю симуляцию с ( будет варьироваться ниже) нейтральные сайты с частотой мутаций для каждого сайта и численность населения . Я запускаю симуляции для 10 000 поколений. Рекомбинации нет. При количестве сайтов:
Есть ли ошибка в моей модели или это то, что мы ожидаем, учитывая параметры?
В геноме человека 1 из 300 сайтов являются полиморфными (SNP) ( ссылка ). Это частота SNP, которая в 100 раз выше, чем та, которую я наблюдаю в своих симуляциях. Обратите внимание, однако, что предположение о нейтральности и вне демографических предположений не будет полностью верным, и этот результат может довольно далеко от нейтрального ожидания. Моя цель не в том, чтобы воспроизвести что-то похожее на геном человека, а лишь в том, чтобы воспроизвести нейтральные ожидания на данный момент.
Повторяя вышеприведенные комментарии. Взгляните на D Tajima. Он дает оценку количества сайтов сегрегации для популяции в модели нейтральной мутации.
Общая форма оценки для диплоидной популяции: . Здесь частота мутаций зависит от генома, а не от сайта, поэтому где это размер генома. Оценка мест сегрегации всей популяции с размером генома где каждый сайт имеет скорость мутации на геном можно было бы ожидать, что . Итак, ваши цифры кажутся выше ожидаемых.
Я написал пример программного обеспечения для моделирования, способного выполнять такие эволюционные сценарии ( рукопись Clotho ). Точно так же вы можете сверить свои цифры с популяцией, сгенерированной с помощью MS .
Доля полиморфных сайтов, существующих в популяции, зависит от биологии организма. Например, вы ожидаете обнаружить разную степень полиморфизма у родственных растений, имеющих разные системы селекции, например, у Silene [ 1 ]. Также ожидается, что прошлые узкие места уменьшат полиморфизмы [ 2 ]. Таким образом, ответ на ваш вопрос будет зависеть от конкретного вида и популяции, на которую вы смотрите.
мы включили скрипт для расчета этого в дополнительный материал
http://onlinelibrary.wiley.com/doi/10.1111/mec.13034/full
.... один сайт сегрегации на локус или максимум четыре SNP, как ожидается для геномных данных с коротким считыванием (см. прилагаемый R-скрипт для оценки).
путнампп
Реми.б
путнампп
Реми.б