Все ли фенотипы нормально распределены

Репост с биржи статистики.

Джон Кук в своем блоге https://www.johndcook.com/blog/2015/03/09/why-isnt-everything-normally-distributed/ пишет, что многие из них не являются:

Рост взрослых людей подчиняется закону Гаусса, также известному как нормальное распределение [1]. Обычное объяснение заключается в том, что на определение роста влияет множество факторов, а суммарный эффект многих отдельных причин является приблизительно нормальным из-за центральной предельной теоремы.

Если это так, то почему другие явления не распределяются нормально? Кто-то спросил меня сегодня утром конкретно о фенотипах со многими генетическими входами.

Центральная предельная теорема утверждает, что сумма многих независимых аддитивных эффектов приблизительно нормально распределена [2]. Гены более цифровые, чем аналоговые, и не производят независимых, аддитивных эффектов. Например, эффекты доминантных и рецессивных генов действуют больше как max и min, чем как сложение. Гены не появляются независимо друг от друга — если у вас есть какие-то гены, то, скорее всего, у вас будут и некоторые другие гены, — и они не действуют независимо — одни гены определяют, как экспрессируются другие гены.

На рост влияют эффекты окружающей среды, а также генетические эффекты, такие как питание, и эти эффекты окружающей среды могут быть более аддитивными или независимыми, чем генетические эффекты.

У меня есть два вопроса по этому поводу. Во-первых, я не могу привести ни одного очевидного примера фенотипов, не подчиняющихся нормальному распределению. Кто-нибудь может мне помочь? И, во-вторых, его утверждения, похоже, противоречат этой другой статье: https://www.uvm.edu/~dstratto/bcor102/readings/4_Evol_of_Phenotypes.pdf .

Чтобы понять генетическую основу количественных признаков, важно думать о влиянии конкретного аллеля, а не просто о его наличии или отсутствии. Один локус может давать три дискретных фенотипа, но по мере того, как все больше и больше локусов вносят свой вклад в признак, фенотипическое распределение все больше и больше приближается к нормальному (колоколообразному) распределению.

Кто здесь? Имеет ли значение тот факт, что гены являются цифровыми, а не аналоговыми? А как насчет второго аргумента, что они не независимы. Действительно ли это необходимо (вторая статья, кажется, указывает на обратное, если я правильно понимаю).

А как насчет наиболее очевидных менделевских черт? Это будут фенотипы с бимодальным распределением, потому что они вызываются одним геном всего с двумя аллелями. Многие другие фенотипы также следуют бимодальному распределению по той же причине. По мере того, как вы добавляете больше модулирующих или регулирующих генетических вариаций, вы смазываете распределение, и оно становится более нормальным. Это именно то, что ваши ссылки говорят вам.

Ответы (1)

Многие фенотипы могут иметь нормальное распределение при достаточно большом размере популяции и множестве QTL ( количественных локусов признаков ), поскольку нормальное распределение является простым результатом CTL ( центральной предельной теоремы ). Если вам что-то непонятно, вам обязательно стоит взглянуть на центральную предельную теорему.

Как правило, если количество локусов слишком мало, фенотип может, например, следовать некоторой непрерывной аппроксимации распределения Пуассона. Конечно, если аллельные эффекты коррелируют между локусами, или если существует некоторое неравновесие по сцеплению, или если фенотип является ограниченным, дискретным или номинальным, вы можете не прийти к нормальному распределению фенотипов, но все это является предметом обсуждения для другой темы. время.

Я не могу привести ни одного очевидного примера фенотипов, которые не подчиняются нормальному распределению.

Как говорится во второй цитате, подумайте о любом фенотипе, который является дискретным. Вот несколько примеров

  • секс
  • правша / левша
  • цвет глаз

Теперь, если вам нужен количественный фенотип, который не распределяется нормально, тогда рост (который является плохим примером вашей первой цитаты) очень немного бимодальный из-за средней разницы в росте между мужчинами и женщинами (посмотрите на Являются ли мужчины выше, чем женщины у людей ? ). Вы также можете думать о любых ограниченных фенотипах. Например, скорость бега. Спортсмены вызовут очень длинный правый хвост, а люди в инвалидных колясках сделают большой стек вероятностной массы в 0 км/ч.

Есть много вещей, которые следует учитывать, пытаясь угадать, является ли a нормально распределенным или нет в популяции. Потребуются хорошие знания статистики и хорошее знание генетики населения.

Спасибо за этот четкий ответ! Меня никогда не убеждал аргумент «высота не может быть нормально распределена, потому что она не может быть отрицательной», поскольку она все еще может быть достаточно хорошо аппроксимирована нормалью. Скорость бега кажется чем-то, что вы не можете приблизить к норме, но я не знал, что это считается фенотипом! Любой явный пример чего-то, что следует распределению Пуассона?
Почти что угодно можно считать фенотипом. Фенотип — это любой эффект, который генотип оказывает на окружающий мир, который в основном включает все характеристики (поведение, анатомию, физиологию и т. д.) тела. Я должен был сказать «какое-то« непрерывное приближение »к распределению Пуассона» (сейчас отредактировано). Это просто некоторая теоретическая реальность модели, в которой есть несколько локусов, полностью биаллельных с аллельным эффектом 0 или 1, тогда вы увидите признак распределения Пуассона. Я не могу привести конкретный пример.