Генетическая связь более 50 сантиморганов

Классически связь между двумя локусами может быть измерена в сантиморганах (сМ), что представляет собой процентную вероятность того, что эти два локуса рекомбинируют нечетное количество раз (с образованием рекомбинантного генотипа).

Ожидается, что из-за независимого ассортимента маркеры на разных хромосомах будут рекомбинировать в 50% случаев. Насколько я понимаю, если провести классический эксперимент и подсчитать различные потомства, а затем сделать вывод о явном сцеплении, значения 50 сМ и более интерпретируются как « невозможно определить, на отдельных хромосомах или просто рекомбинирует очень часто ». См. ( источник ) с исправленной грамматикой:

Последний момент, который нам нужно сделать, касается максимального расстояния, которое мы можем измерить. Из-за того, как выполняются расчеты, у нас никогда не может быть более 50% рекомбинантных гамет. Следовательно, (максимальное) расстояние, на котором два гена могут находиться друг от друга и по-прежнему измерять это расстояние, составляет чуть меньше (чем) 50 сМ. Если два гена находятся на расстоянии более 50 сМ друг от друга, то мы не можем определить, находятся ли они в одной и той же хромосоме или в разных хромосомах.

Википедия дает аналитическое решение, а также отмечает, что (d — физическое расстояние):

Вероятность рекомбинации составляет примерно d/100 для малых значений d и приближается к 50% при стремлении d к бесконечности.

Однако что произойдет, если сцепление больше 50 сМ? Вроде бы если отбросить в сторону классические эксперименты, такая ситуация возможна в реальности.

Например, хромосома IV дрожжей имеет длину 1530 т.п.н. и в среднем 0,31 сМ/т.п.н . Возьмем два гена на Chr.IV:

  • DNF2 находится примерно на +631 кб.
  • TOM1 находится примерно на +1370 кб.

Физическое расстояние между ними составляет около 734 кб. В соответствии со значением сМ/кбп сантиморганное расстояние равно 734  кб 0,31  см / кб знак равно 228  см . Как интерпретировать это 228?

Если я скрещу гаплоидные дрожжи, которые являются DNF2 TOM1, с другими, которые являются dnf2 tom1 (нижний регистр указывает минорный аллель, а не делецию), а затем спорулирую их, каков шанс получить споры с генотипами DNF2 tom1 или dnf2 TOM1 ?

Я понимаю, что значение cM/kbp является лишь упрощением и что на практике сцепление представляет собой более сложное явление. Тем не менее, кажется правдоподобным, что на Chr.IV может произойти несколько перекрестных событий, поскольку он такой большой. Это включает в себя возможность 1, 3, 5 и более кроссоверов, которые создадут гибрид (при условии, что все они происходят между этими двумя локусами), а также возможность 2, 4 и т. д. кроссоверов, которые создадут негибридную спору ( по крайней мере, что касается выбранных нами маркеров).

Ответы (2)

Понимание статистических данных, которые мы используем, когда говорим о скорости рекомбинации, является важным вопросом, который, к сожалению, слишком часто игнорируется во вводном курсе эволюционной биологии или популяционной генетики и многими неправильно понимается. У меня есть частичное понимание этого, но, надеюсь, мне удастся написать достойный ответ.

#Короткий ответ

Скорость рекомбинации и генетическое расстояние (в сантиморганах) — разные вещи. В то время как скорость рекомбинации ограничена от 0 до 0,5, генетическое расстояние ограничено от 0 до бесконечности. Существует взаимно однозначная функция от генетического расстояния до скорости рекомбинации. При малой скорости рекомбинации скорость рекомбинации и генетическое расстояние принимают очень близкие значения, но при больших значениях скорость рекомбинации намного ниже генетического расстояния.

#Длинный ответ

Ниже немного математики. Эти уравнения в основном предназначены для любопытства, поскольку можно понять ответ, не понимая математики, стоящей за ним.

Определения р и М

Вы путаетесь между двумя разными статистическими данными

  • Скорость рекомбинации р между двумя локусами
  • р — вероятность того, что два локуса останутся в одной и той же гамете после того, как произошла рекомбинация. Эта вероятность не может быть больше 0,5 ( 0 р 0,5 ).
  • Расстояние в Моргансе М (или чаще в сантиМорганах) между двумя локусами. М - ожидаемое количество кроссинговеров, происходящих между двумя локусами.

Морганы и сантиМорганы

Вы заметите, что я говорю в Морганах, а не в сантиМорганах, что не типично для литературы, но помогает передать интуитивное понимание того, что это значит. Если 150 сантиМорганы знак равно 1,5 Морганс. Для двух локусов, удаленных на 1,5 Моргана, ожидаемое число кроссинговеров между двумя локусами равно 1,5 (по определению). Ниже приведены еще несколько пояснений к этим двум определениям с некоторыми рисунками :)

Тематическое исследование с локусами AиB

Пока М и р тесно связаны, это не совсем одно и то же. Рассмотрим следующую последовательность с локусами AиB

---[A]------------------[B]---

Предположим, что два локуса находятся очень далеко друг от друга и М знак равно 2 . Вероятность получить именно к поэтому кроссоверы задаются распределением Пуассона со скоростью М знак равно 2

п ( к ) знак равно е М М к к !

Скажем, для данного случая, что к знак равно 1 (произошел одиночный кроссинговер). Этот переход представлен знаком «/» ниже.

---[A]-------------/----[B]---

Здесь ясно, что две последовательности в локусах Aи Bбудут разделены. Скажем теперь, что к знак равно 2 (произошло два кроссовера).

---[A]---/-----/--------[B]---

Здесь, даже если кроссоверы произошли, две последовательности в локусах Aи Bостанутся вместе. Только последовательность между двумя кроссинговерами будет исходить от гомологичной хромосомы.

Отношения между р и М - прописью

Вы можете увидеть это из предыдущего раздела. Вероятность р из этих двух локусов Aи Bбыть разделенными посредством рекомбинации — это вероятность того, что между ними произойдет нечетное число событий рекомбинации (зная, что М ожидаемое количество кроссинговеров).

Отношения между р и М - в уравнении

Сначала посчитаем вероятность п е в е н что происходит четное число кроссинговеров. Эта вероятность как раз

п е в е н знак равно к знак равно 0 е М М 2 к ( 2 к ) !

, где я только что добавил константу 2 перед к как в числителе, так и в знаменателе. С некоторой алгеброй и триггером можно показать, что

п е в е н знак равно к знак равно 0 е М М 2 к ( 2 к ) ! знак равно е М к знак равно 0 М 2 к ( 2 к ) ! знак равно

е М с о с час ( М ) знак равно е М ( е М + е М 2 ) знак равно 1 + е 2 М 2


Как, р знак равно п о д д знак равно 1 п е в е н ,

р знак равно 1 1 + е 2 М 2 знак равно 1 е 2 М 2

Вот так! У нас есть отношения между р и М ! Давайте нарисуем это

#Отношения между р и М - на графике

Я только что нарисовал приведенное выше уравнение в Mathematica ( Plot[y = (1 - Exp[-2 M ])/2, {M, 0, 5}])

введите описание изображения здесь

Вот тот же график, но увеличенный при более низких значениях р и М ( Plot[y = (1 - Exp[-2 M ])/2, {M, 0, 0.1}])

введите описание изображения здесь

На графике хорошо видно, что при малых значениях М , как М увеличивается р возрастают квазилинейно ( М р ). Для больших значений М , р все еще увеличивается, но все медленнее и медленнее, пока не достигнет асимптоты/плато при 1 2 . р действительно ограничено между 0 (когда М знак равно 0 ) и 1 2 (когда М знак равно ).

Обратите внимание на тот факт, что сумма вероятностей каждого четного к в распределении Пуассона всегда меньше или равно 0,5, что само по себе является интересным математическим фактом!

Из удаленного комментария @emre: вы должны начать с п е в е н знак равно к знак равно 0 2 2 д к е д ( к ) ! . Потому что просто, к знак равно 0 д 2 к е д ( 2 к ) ! к знак равно 0 д 2 к е д 2 ( к ) !
@ Remi.b Remi.b Как заметила AliceD, некоторые из ваших математических расчетов были неверны. Я изменил его, чтобы он был действительным, и чтобы по-прежнему демонстрировать рассматриваемое равенство, используя общие тригонометрические тождества с о с час ( Икс ) .
Большое спасибо @Чарльз

Просто для ясности: маркеры на разных группах сцепления (хромосомах) не рекомбинируют в 50% случаев. Просто несцепленные мутации косегрегируют в 50% случаев.

Это прямая цитата из учебника Стрикбергера «Генетика» 3-е изд. 1985 стр. 397:

> После многих тестов с участием многочисленных сцепленных с полом генов была картирована вся Х-хромосома D. melanogaster , и было обнаружено, что ее длина составляет 68 единиц карты. Это, однако, не означает, что частота рекомбинации составляет 68 процентов в эксперименте по сцеплению между желтыми и стриженными , которые находятся на крайних концах Х-хромосомы. Как объяснялось ранее, между любыми двумя локусами ожидается не более 50% рекомбинации, поскольку только две из четырех хроматид в мейотической тетраде вовлечены в любую конкретную точку кроссинговера. На самом деле фактическое значение рекомбинации, наблюдаемое между желтым и каштановымможет быть даже меньше 50 процентов в эксперименте по сцеплению по той простой причине, что не каждый бивалент Х-хромосомы может иметь кроссовер в этом конкретном интервале. <<

1 процент рекомбинации = 1 единица карты

Теперь, когда мы знаем, что это 68 НЕ означает. Можете ли вы объяснить, что это значит и как это интерпретировать?
Если вы пытаетесь использовать мейотическую рекомбинацию между видимыми маркерами для построения генетической карты хромосомы, вам потребуется несколько связанных генетических маркеров. Как только вы упорядочиваете маркеры относительно друг друга, вы делаете дополнительные перекрестные сопоставления, чтобы получить точные скорости рекомбинации (cM) между парами смежных связанных маркеров. Затем вы суммируете эти расстояния, чтобы получить общую длину группы связей в единицах карты.
Итак, если вы знаете, что два гена тесно связаны с двумя теломерами: TEL-A----Z-TEL, и у вас есть еще пара хорошо расположенных между ними генов: TEL-A-----D- ---------H---------Z-TEL. Если A находится в 18 см от D, D — в 20 см от H, а H — в 30 см от Z, то общее расстояние от A до Z составляет 18 + 20 + 30 = 68 единиц карты. Однако если вы нанесете на карту расстояние между A и Z, используя только эти два маркера, вы подсчитаете, что они совместно разделяются в 50% случаев и могут быть несвязаны. Итак, если вы знаете, что они связаны, но получаете 50 сМ, значит, вам нужно больше маркеров для вашей карты.
Да, это именно то, что я бы предложил включить в ответ :)
Ты убиваешь меня! (под чем я подразумеваю ЛОЛ). Извините, я не пытался намеренно быть тупым или тупым. Я был сбит с толку, потому что я знаю, что у вас есть репутация в 10 раз больше моей, и что вы являетесь экспертом по эволюции (среди многих других вещей), но по какой-то причине мое настроение, когда я писал эти комментарии, было таким: «он действительно не знаю, поэтому я попытаюсь объяснить это подробно», и я вообще не понял подтекст мантры StackExchange по улучшению моего существующего ответа. Я почти полностью отказался от Био, я просто нашел это слишком разочаровывающим. Так что, как только мой первоначальный энтузиазм угас, я ушел.