Сколько ДНК у братьев и сестер, чьи родители являются двоюродными братьями и сестрами?

В среднем два родных брата обычно имеют 50% общего генома. Насколько это увеличивается, если родители братьев и сестер являются двоюродными братьями и сестрами?

Я отредактировал заголовок вашего вопроса, чтобы уточнить, что вы имели в виду братьев и сестер, родители которых являются двоюродными братьями и сестрами. Ваша первоначальная формулировка подразумевала братьев и сестер двоюродных братьев, которые, вероятно, сами были бы двоюродными братьями и сестрами.
Это будет сумма вероятностей. Неплохо. Я пойду за ним.

Ответы (1)

Прежде чем я на самом деле отвечу на ваш вопрос, позвольте нам прояснить некоторые проблемы в ваших предположениях. Тот факт, что вы ожидаете 50-процентного сходства между братьями и сестрами, полон нескольких предположений.

Представьте случай простого диплоидного организма с двумя признаками. Повторим ваше предположение: если оба родителя гетерозиготны по любому из двух признаков, и аллели, присутствующие у любого из родителей по каждому признаку, различны (для каждого признака возможны четыре разных аллеля), то вероятность рождения двух детей с общими 50 % одинаковых аллелей больше, чем любой другой процент совместного использования.

Давайте разберем это. Постепенно будем добавлять сложности.

Для организмов с двумя признаками предположим, что генотип родителей равен АБ, ЭФ и КД, ГХ куда А,Б,В,Г являются аллелями, контролирующими признак 1. Следовательно, для их первого ребенка возможные генотипы ACEG, BCEG, ADEG, BDEG,  и т. д. Поскольку у родителей не было совпадения аллелей, каждый из этих генотипов равновероятен.

Для второго ребенка существуют такие же возможности с равной вероятностью. Теперь я вычислил матрицу, в которой каждый возможный генотип ребенка 1 представлен в виде строк, генотип ребенка 2 — в виде столбцов, а значения представляют собой долю общих аллелей (т. е. общих между ними). введите описание изображения здесь.

Таким образом, между двумя детьми возможны все пропорции обмена. Но, чтобы выяснить наиболее вероятную конфигурацию, мы строим график другого типа.введите описание изображения здесь

Техническое примечание : хотя гистограмма имеет частоты появления в приведенной выше матрице подобия, она эквивалентна вероятностям, поскольку каждый генотип был равновероятным.

Следовательно, случай с двумя братьями и сестрами, разделяющими 50% генома, наиболее вероятен для этого случая. Теперь, если мы расширимся до 3 аллелей, вот соответствующий график.введите описание изображения здесь

Это показывает, что даже если мы увеличиваем количество признаков (по мере того, как мы постепенно приближаемся к случаю человека), максимальная вероятность по-прежнему включает родственные организмы, разделяющие 50% генома.

А что, если родители уже поделились некоторым геномом? Скажем, организмы с двумя признаками уже имеют 50% общего генома. Это равносильно тому, что в рассмотренных выше генотипах А=С, Э=Г . Исходя из этого предположения, я провел аналогичную симуляцию, чтобы получить следующий график.введите описание изображения здесь

Еще одно техническое замечание : хотя на графике по-прежнему показаны частоты появления в матрице, повторения одного и того же генотипа в строках/столбцах пропорционально их вероятности образования сделают эти частоты эквивалентными вероятностям.

Итак, теперь братья и сестры с 75% сходством являются наиболее вероятным результатом.

Давайте теперь спросим для организмов с двумя признаками, с которыми мы работаем, что, если у бабушек и дедушек не было геномного сходства, а двое их детей были внутрипородными, что будет общего у этих двух детей? Для этого мы берем вероятности первого поколения (дети бабушек и дедушек, извините за семантическую мешанину) для каждого % перекрытия и умножаем их на вероятности того, что их дети имеют различные перекрытия, и строим окончательный график. введите описание изображения здесьЭто показывает, что они, скорее всего, будут иметь 50% или 75% общего генома.

Ограничения этого анализа : Он не учитывает сцепление генов. Он предполагает полностью независимый набор аллелей. Он сначала моделирует все сходства в аллелях разных признаков, а затем допускает одинаковые диплоидные пары, т. е. не учитывает наблюдаемые вероятности образования одной и той же диплоидной пары, т. е. случай, когда сходство (общий геном) между двумя людьми возникает потому, что двух одинаковых аллелей одного и того же признака. Он также слеп к любому родительскому импринтингу. Гомозиготность еще не включена в симуляцию, это произойдет через некоторое время.

Ниже приведено моделирование вероятности двух поколений для организма с 4 и 5 признаками.введите описание изображения здесьвведите описание изображения здесь

Максимальная вероятность % сходства в геноме, как вы понимаете, для большого количества признаков будет где-то около 63-64%.

Я опубликую код R через некоторое время, после того, как отформатирую его правильно. Для вычислений более 5 трейтов я напишу лучший движок за день. Извините за неправильное оформление вопроса. Через какое-то время исправлюсь.

Обратите внимание, что этот анализ рассматривает только области, которые различаются между двумя родителями. Более 99% генома идентично у всех людей.