В среднем два родных брата обычно имеют 50% общего генома. Насколько это увеличивается, если родители братьев и сестер являются двоюродными братьями и сестрами?
Прежде чем я на самом деле отвечу на ваш вопрос, позвольте нам прояснить некоторые проблемы в ваших предположениях. Тот факт, что вы ожидаете 50-процентного сходства между братьями и сестрами, полон нескольких предположений.
Представьте случай простого диплоидного организма с двумя признаками. Повторим ваше предположение: если оба родителя гетерозиготны по любому из двух признаков, и аллели, присутствующие у любого из родителей по каждому признаку, различны (для каждого признака возможны четыре разных аллеля), то вероятность рождения двух детей с общими 50 % одинаковых аллелей больше, чем любой другой процент совместного использования.
Давайте разберем это. Постепенно будем добавлять сложности.
Для организмов с двумя признаками предположим, что генотип родителей равен и куда являются аллелями, контролирующими признак 1. Следовательно, для их первого ребенка возможные генотипы и т. д. Поскольку у родителей не было совпадения аллелей, каждый из этих генотипов равновероятен.
Для второго ребенка существуют такие же возможности с равной вероятностью. Теперь я вычислил матрицу, в которой каждый возможный генотип ребенка 1 представлен в виде строк, генотип ребенка 2 — в виде столбцов, а значения представляют собой долю общих аллелей (т. е. общих между ними). .
Таким образом, между двумя детьми возможны все пропорции обмена. Но, чтобы выяснить наиболее вероятную конфигурацию, мы строим график другого типа.
Техническое примечание : хотя гистограмма имеет частоты появления в приведенной выше матрице подобия, она эквивалентна вероятностям, поскольку каждый генотип был равновероятным.
Следовательно, случай с двумя братьями и сестрами, разделяющими 50% генома, наиболее вероятен для этого случая. Теперь, если мы расширимся до 3 аллелей, вот соответствующий график.
Это показывает, что даже если мы увеличиваем количество признаков (по мере того, как мы постепенно приближаемся к случаю человека), максимальная вероятность по-прежнему включает родственные организмы, разделяющие 50% генома.
А что, если родители уже поделились некоторым геномом? Скажем, организмы с двумя признаками уже имеют 50% общего генома. Это равносильно тому, что в рассмотренных выше генотипах . Исходя из этого предположения, я провел аналогичную симуляцию, чтобы получить следующий график.
Еще одно техническое замечание : хотя на графике по-прежнему показаны частоты появления в матрице, повторения одного и того же генотипа в строках/столбцах пропорционально их вероятности образования сделают эти частоты эквивалентными вероятностям.
Итак, теперь братья и сестры с 75% сходством являются наиболее вероятным результатом.
Давайте теперь спросим для организмов с двумя признаками, с которыми мы работаем, что, если у бабушек и дедушек не было геномного сходства, а двое их детей были внутрипородными, что будет общего у этих двух детей? Для этого мы берем вероятности первого поколения (дети бабушек и дедушек, извините за семантическую мешанину) для каждого % перекрытия и умножаем их на вероятности того, что их дети имеют различные перекрытия, и строим окончательный график. Это показывает, что они, скорее всего, будут иметь 50% или 75% общего генома.
Ограничения этого анализа : Он не учитывает сцепление генов. Он предполагает полностью независимый набор аллелей. Он сначала моделирует все сходства в аллелях разных признаков, а затем допускает одинаковые диплоидные пары, т. е. не учитывает наблюдаемые вероятности образования одной и той же диплоидной пары, т. е. случай, когда сходство (общий геном) между двумя людьми возникает потому, что двух одинаковых аллелей одного и того же признака. Он также слеп к любому родительскому импринтингу. Гомозиготность еще не включена в симуляцию, это произойдет через некоторое время.
Ниже приведено моделирование вероятности двух поколений для организма с 4 и 5 признаками.
Максимальная вероятность % сходства в геноме, как вы понимаете, для большого количества признаков будет где-то около 63-64%.
Я опубликую код R через некоторое время, после того, как отформатирую его правильно. Для вычислений более 5 трейтов я напишу лучший движок за день. Извините за неправильное оформление вопроса. Через какое-то время исправлюсь.
пользователь137
Тито Альба