Взаимосвязь между генетическим разнообразием внутри и между видами

Вот цитата из Вагнера (2008)

Вторая линия доказательств [против нейтрализма] исходит из соотношения между средним числом полиморфных различий между аллелями внутри вида, π , а количество фиксированных различий между генами у двух видов, г . Для нейтральных мутаций положительная связь между π и г должны существовать, потому что нейтральная теория предсказывает, что обе величины линейно пропорциональны скорости возникновения нейтральных мутаций. Вместо этого недавние данные в масштабе генома показывают, что эта связь на самом деле отрицательная.

Какое отношение имеют друг к другу «среднее число полиморфных различий между аллелями внутри вида» и «число фиксированных различий между генами у двух видов»? Почему вообще должны быть какие-то отношения? И под «двумя видами» они имеют в виду восточных желтоспинных вьюрков и западных желтоспинных вьюрков или любых двух произвольных видов, таких как кишечная палочка и ондатры?

Я нашел этот связанный вопрос , но он ничего не говорит о разных видах.

Хороший вопрос +1. Я отредактировал ваш пост, чтобы избавиться от того, что я считал ненужной информацией. Не стесняйтесь откатиться, если вам не нравится редактирование.
Предполагая, что все остальные здесь имеют необходимый опыт, все в порядке. Я не биолог, поэтому теории нейтрализма/селекционизма были для меня новостью.

Ответы (1)

Показатели интереса

Две интересующие вас метрики:

  • π - среднее количество различий между двумя случайно выбранными (с заменой) аллелями в популяции
  • г - среднее количество различий между двумя случайно выбранными (с заменой) аллелями, происходящими от двух разных видов.

Рассмотрим две последовательности

  • ATCGTCAAT
  • АТАГТТААТ

Между этими двумя последовательностями есть 2 попарных различия (позиции 3 и 6).

Весь смысл здесь в том, чтобы понять, что две особи одной и той же популяции сливаются в определенный момент в прошлом точно так же, как две особи происходят из двух разных видов. Количество парных различий как раз равно скорости накопления мутаций, умноженной на время слияния. Позвольте мне развить эту идею с помощью нескольких уравнений ниже.

Нейтральные ожидания

Давайте сделаем математику! Ниже мы сделаем два важных предположения.

  1. Каждая мутация создает новый аллель (это модель бесконечного аллеля).
  2. Все мутации являются заменами (без вставок, без дупликации генов и т. д.).

Введение в теорию коалесценции

Давайте сначала убедимся, что вы понимаете концепцию слияния. Представьте, что вы должны были посмотреть на эволюцию населения назад во времени. Слияние — это событие, в результате которого две линии становятся одной (оглядываясь назад во времени). Для простоты рассмотрим случай бесполой популяции (но будущие расчеты не делают этого предположения). В бесполой популяции два родных брата объединились в предыдущее поколение, поскольку в предыдущем поколении гены, которые они несут, были у одного человека (их родителя).

Ниже мы увидим, как рассчитать время слияния между двумя случайно выбранными особями из популяции и как мы можем сделать вывод о генетическом разнообразии по этому времени слияния.

Скорость накопления нейтральных мутаций

Скорость накопления нейтральной мутации также называют скоростью фиксации нейтральных мутаций. Позволять ф я Икс быть эта скорость фиксации. Рассмотрим панмиктическую диплоидную популяцию постоянного размера. Н . В заданном интересующем локусе частота мутаций равна мю . Число мутаций, происходящих в каждом поколении в этой популяции, равно 2 Н мю ( 2 происходит из-за того, что в диплоидной популяции есть две гомологичные копии каждого гена в каждой клетке). Если мутация нейтральна, то каждый отдельный индивидуум в популяции имеет одинаковую вероятность в конечном итоге стать родителем всей популяции через долгое время в будущем. Другими словами, если начать смотреть на эту проблему из будущего и оглянуться назад во времени, любой индивидуум, находящийся достаточно далеко в будущем, происходит от единственного индивидуума в настоящем. Как следствие, вероятность того, что новая мутация зафиксируется, равна 1 2 Н . Умножая вероятность фиксации на скорость возникновения мутаций во всей популяции, получаем 1 2 Н 2 Н мю "=" мю . Другими словами, скорость фиксации новых нейтральных мутаций просто равна скорости возникновения мутаций.

Ключевое уравнение:

ф я Икс "=" 1 2 Н 2 Н мю "=" мю

г - количество попарных различий между случайно выбранными (с заменой) аллелями, происходящими от разных видов

Рассмотрим два вида, у которых жил общий предок. Т поколения назад. Каждая линия накапливала мутации со скоростью мю (и объяснено выше), и поэтому ожидаемое (среднее) общее количество попарных различий равно г ¯ "=" 2 мю Т . Вероятность того, что именно г попарные различия исходят из распределения Пуассона со скоростью 2 мю Т ( п ( Д "=" г ) "=" п о я с с о н ( 2 мю Т ) ).

Ключевое уравнение:

г ¯ "=" 2 мю Т

π - количество попарных различий между случайно выбранными (с заменой) аллелями, происходящими из одной и той же популяции

Здесь расчеты следуют той же логике, что и выше. π "=" 2 мю Т . Весь вопрос в том, что Т (время коалесценции) пока неизвестно, и нам нужно его рассчитать.

Позволять п ( Т ) — вероятность того, что два случайно отобранных (с заменой) особей из диплоидной панмиктической популяции слились точно Т поколения назад. Вероятность слияния в данном поколении — это просто вероятность рисования одного и того же индивидуума, т. е. 1 2 Н а вероятность не слиться ни в одном последующем поколении равна 1 1 2 Н . Перебирая поколения, мы получаем

п ( Т ) "=" 1 2 Н ( 1 1 2 Н ) Т 1 2 Н е Т 2 Н

, где е 2,7 число Эйлера. Приведенное выше приближение является точным для больших Н (скажем, больше 100). Если вам интересно, вы найдете в этом посте Math.SE объяснение этого приближения.

Ожидаемое значение (среднее) Т ¯ этого распределения Т ¯ "=" 2 Н (и дисперсия в а р ( Т ) "=" 4 Н 2 ). Как следствие, ожидаемое количество попарных различий между этими двумя индивидуумами равно π "=" 2 мю 2 Н "=" 4 Н мю

Короче говоря, эти расчеты можно расширить, чтобы рассчитать время слияния между к случайно выбранные аллели. Тогда ожидаемое время коалесценции равно Т ¯ "=" 4 Н к ( к 1 ) и поэтому некоторая алгебра показывает, что общее ожидаемое время (по всем ветвям) равно 4 Н я "=" 1 к 1 1 я а ожидаемое количество разделяющих сайтов равно 4 Н мю я "=" 1 к 1 1 я .

Ключевое уравнение:

π "=" 4 Н мю

Заключение

Из вышеизложенного ясно, что π "=" 4 Н мю и г "=" 2 мю Т коррелируют, поскольку они оба линейно связаны со скоростью мутации. Как сказано в вашей цитате

Для нейтральных мутаций положительная связь между π и г должны существовать, потому что нейтральная теория предсказывает, что обе величины линейно пропорциональны скорости возникновения нейтральных мутаций.

Цитата гласит одно высказывание

Вместо этого недавние данные в масштабе генома показывают, что эта связь на самом деле отрицательная.

Такие негативные отношения между г и π не могут быть вызваны нейтральными процессами. Поэтому отбор должен быть каким-то образом задействован.

Представьте, например, что два вида выбираются при разных оптимумах (противоположные давления отбора). В таком случае вы увидите, что очищающий отбор внутри вида снижает вероятность того, что новая мутация достигнет фиксации, до значения ниже, чем 1 2 Н и, следовательно, снижение скорости фиксации ф я Икс так что ф я Икс < мю . Однако такое противоположное давление отбора среди видов приведет к тому, что виды будут расходиться больше, чем ожидалось, из-за случайных процессов, которые π > 4 Н мю . Такой избирательный паттерн может объяснить наблюдаемую отрицательную связь.

Больше информации

Этот пост предлагает рекомендацию книги по этому вопросу (популяционная генетика).

когда вы говорите «среднее количество различий», как это определяется количественно? Количество различных пар оснований?
Да, точно. Есть два предположения (я забыл об этом в своем ответе, но добавлю их): 1. Все мутации являются заменами (без инделей, без полной дупликации хромосом и т. д.) и 2. каждая мутация создает новый аллель (модель бесконечного аллеля)
Являются ли эти предположения специфическими для нейтральной теории? Я предполагаю, что это должно быть доказательством от противного, поэтому я хочу посмотреть, какие конкретные предпосылки ведут нас к противоречию.
Это очень распространенные предположения, встречающиеся в литературе по нейтральной теории и, в более общем плане, в литературе по генетическому дрейфу. Концепция доказательства от противного применима к математике, но не к эмпирическим наукам (не так ли?). У нас просто есть нулевой прогноз (модель без выбора), и если данные не соответствуют этим, то должно происходить что-то еще. (Спасибо за редактирование)