Репост с биржи статистики.
Джон Кук в своем блоге https://www.johndcook.com/blog/2015/03/09/why-isnt-everything-normally-distributed/ пишет, что многие из них не являются:
Рост взрослых людей подчиняется закону Гаусса, также известному как нормальное распределение [1]. Обычное объяснение заключается в том, что на определение роста влияет множество факторов, а суммарный эффект многих отдельных причин является приблизительно нормальным из-за центральной предельной теоремы.
Если это так, то почему другие явления не распределяются нормально? Кто-то спросил меня сегодня утром конкретно о фенотипах со многими генетическими входами.
Центральная предельная теорема утверждает, что сумма многих независимых аддитивных эффектов приблизительно нормально распределена [2]. Гены более цифровые, чем аналоговые, и не производят независимых, аддитивных эффектов. Например, эффекты доминантных и рецессивных генов действуют больше как max и min, чем как сложение. Гены не появляются независимо друг от друга — если у вас есть какие-то гены, то, скорее всего, у вас будут и некоторые другие гены, — и они не действуют независимо — одни гены определяют, как экспрессируются другие гены.
На рост влияют эффекты окружающей среды, а также генетические эффекты, такие как питание, и эти эффекты окружающей среды могут быть более аддитивными или независимыми, чем генетические эффекты.
У меня есть два вопроса по этому поводу. Во-первых, я не могу привести ни одного очевидного примера фенотипов, не подчиняющихся нормальному распределению. Кто-нибудь может мне помочь? И, во-вторых, его утверждения, похоже, противоречат этой другой статье: https://www.uvm.edu/~dstratto/bcor102/readings/4_Evol_of_Phenotypes.pdf .
Чтобы понять генетическую основу количественных признаков, важно думать о влиянии конкретного аллеля, а не просто о его наличии или отсутствии. Один локус может давать три дискретных фенотипа, но по мере того, как все больше и больше локусов вносят свой вклад в признак, фенотипическое распределение все больше и больше приближается к нормальному (колоколообразному) распределению.
Кто здесь? Имеет ли значение тот факт, что гены являются цифровыми, а не аналоговыми? А как насчет второго аргумента, что они не независимы. Действительно ли это необходимо (вторая статья, кажется, указывает на обратное, если я правильно понимаю).
Многие фенотипы могут иметь нормальное распределение при достаточно большом размере популяции и множестве QTL ( количественных локусов признаков ), поскольку нормальное распределение является простым результатом CTL ( центральной предельной теоремы ). Если вам что-то непонятно, вам обязательно стоит взглянуть на центральную предельную теорему.
Как правило, если количество локусов слишком мало, фенотип может, например, следовать некоторой непрерывной аппроксимации распределения Пуассона. Конечно, если аллельные эффекты коррелируют между локусами, или если существует некоторое неравновесие по сцеплению, или если фенотип является ограниченным, дискретным или номинальным, вы можете не прийти к нормальному распределению фенотипов, но все это является предметом обсуждения для другой темы. время.
Я не могу привести ни одного очевидного примера фенотипов, которые не подчиняются нормальному распределению.
Как говорится во второй цитате, подумайте о любом фенотипе, который является дискретным. Вот несколько примеров
Теперь, если вам нужен количественный фенотип, который не распределяется нормально, тогда рост (который является плохим примером вашей первой цитаты) очень немного бимодальный из-за средней разницы в росте между мужчинами и женщинами (посмотрите на Являются ли мужчины выше, чем женщины у людей ? ). Вы также можете думать о любых ограниченных фенотипах. Например, скорость бега. Спортсмены вызовут очень длинный правый хвост, а люди в инвалидных колясках сделают большой стек вероятностной массы в 0 км/ч.
Есть много вещей, которые следует учитывать, пытаясь угадать, является ли a нормально распределенным или нет в популяции. Потребуются хорошие знания статистики и хорошее знание генетики населения.
Брайан Краузе