Как определить, вызваны ли изменения частоты аллеля генетическим дрейфом или отбором?

Учитывая, что как естественный/искусственный отбор, так и генетический дрейф являются эволюционными механизмами, влияющими на изменение частот аллелей в популяции:

Существуют ли способы определить, вызвано ли изменение частоты конкретного гена/аллеля генетическим дрейфом или отбором? Другими словами: когда мы видим, как аллель захватывает популяцию, есть ли способ узнать, был ли он отобран или просто «повезло»?

ОБНОВЛЕНИЕ : поскольку, по-видимому, этот вопрос довольно сложен в экспериментальной биологии, я хочу уточнить, почему я спрашиваю об этом и что я надеюсь узнать.

Я ищу «теоретический способ» определить, являются ли изменения частот аллелей в последующих поколениях результатом отбора или простым дрейфом.

Я применяю генетический алгоритм для оптимизации веб-сайтов, где каждый ген определяет аспект пользовательского опыта этого веб-сайта. Вопрос в том, появляются ли аллели, которые я вижу в наиболее подходящих решениях (= лучший пользовательский опыт, оцененный посетителями), случайно или действительно способствуют пригодности решения-кандидата (= влияют на формирование пользовательского опыта).

Ответы (1)

Есть ли способ отделить выбор от дрейфа

Да способов на самом деле много... столько разных способов, что невозможно правильно ответить на этот вопрос. Надеюсь, приведенный ниже ответ даст вам некоторое представление о том, почему существует такое разнообразие методов, и предоставит вам источники для расширения ваших знаний по этому вопросу.

Это зависит от данных, которые у вас есть

Ответ во многом зависит от данных, которые вы имеете в виду. Вы смотрите на

  • панмиктическая популяция
  • структурированное население
  • Вы сравниваете большое количество родословных по филогении?
  • есть ли у вас информация о прокси пригодности в этой популяции
  • можете ли вы провести эволюционный эксперимент (во многом зависит от времени генерации)
  • у вас есть генетические данные, которые разделены во времени
  • ...

Кроме того, какой тип отбора вы имеете в виду?

  • балансирующий выбор
  • Вы пытаетесь найти эпистаз для отбора
  • Вы смотрите на какую-то форму сбалансированного выбора
  • Местный выбор
  • ...

Также зависит от того, есть ли у вас данные о потенциально коррелированных переменных, таких как

  • фенотипические данные
  • экологические данные

Существуют десятки (или даже сотни методов, особенно при наличии данных о родственных линиях) под каждым пунктом выше, поэтому ваш вопрос определенно довольно широк.

Источник информации

Статистические тесты, которые с точностью до нуля проверяют отсутствие отбора, часто называют «тестом селективной нейтральности». Вы можете прочитать Nielsen 2001 и Nielsen 2005 , чтобы получить обзор тестов селективной нейтральности в панмиктических популяциях.

Возможно, вы захотите взглянуть на этот ответ , этот ответ и особенно этот ответ .

Что нужно, чтобы понять методы отделения отбора от дрейфа?

Понимание тестов выборочной нейтральности может быть немного сложным, поскольку требует хороших знаний в области классической статистики, байесовской статистики, MCMC, приближенных байесовских вычислений и даже алгоритмов машинного обучения. Это также требует хороших знаний в области популяционной генетики (обычно включая теорию слияния) и статистической филогенетики.

Конкретный пример

К сожалению, я не могу вспомнить ни одного конкретного примера теста, который действительно легко понять без априорных знаний. Классическим, не слишком сложным и исторически сложившимся примером теста на нейтральность в панмиктической популяции является использование D Таджимы (для получения которого требуются базовые знания о процессах ветвления). Возможно, вы захотите узнать об этом, чтобы иметь конкретный пример. Я рекомендую книгу Гиллеспи «Популяционная генетика: краткое руководство» , чтобы узнать об этом тесте. Больше рекомендаций по книгам можно найти здесь .

Я ищу «теоретический способ» определить, являются ли изменения частот аллелей в последующих поколениях результатом отбора или простым дрейфом. Я применяю это к поведению, которое я вижу при применении генетического алгоритма, где каждый ген определяет аспект пользовательского опыта веб-сайта. Вопрос в том, попали ли аллели, которые я вижу в наиболее подходящих решениях, случайно или они действительно способствуют пригодности решения-кандидата. Я, вероятно, должен был уточнить это в своем вопросе, но не сделал этого, потому что не осознавал сложности этой проблемы.
Я бы посоветовал вам открыть новый пост для этого более конкретного вопроса. Не забудьте четко определить модель алгоритма. Априори, если бы я был на вашем месте, в качестве первого шага я бы изучил частотный спектр сайта и выполнил D-тест Tajima.