Неравновесие по сцеплению для двух биаллельных локусов определяется как:
куда это частоты гаплотипов , , , соответственно (номер нижнего индекса соответствует двум разным аллелям и а также соответствуют двум разным локусам)
Мои вопросы
Как определены для большего количества локусов и большего количества аллелей?
Как определяется, когда количество аллелей отличается от локуса к локусу?
LD описывает ассоциации между аллелями в разных локусах. Для чего-то большего, чем два биаллельных локуса, вам нужно больше, чем просто одно число, чтобы полностью описать ассоциации. Например, если у нас есть три биаллельных локуса 1-3, нам нужны три парных коэффициента LD плюс один дополнительный трехфакторный коэффициент. В общем, если у нас есть локусы, и место имеет аллели, есть возможных гаплотипов, поэтому для полного описания состояния популяции нам потребуется частоты гаплотипов. Если вместо этого мы хотим использовать частоты аллелей и ассоциации, нам потребуется
Мне, как типичному молекулярному биологу, немного не по себе в терминах классической генетики. Я мог бы переопределить некоторые символы (возможно, чтобы они означали то же самое) [ Это похоже на разговор с самим собой во время размышлений ].
Существует четыре ДНК-блока: A1 , B1 , A2 и B2 . A k и B k являются соседними блоками. [ Возможно, это то же самое, что вы определили символы ]. А и В — смежные участки ДНК, тогда как 1 и 2 — разные хромосомы (гомологичные участки). См. рисунок ниже.
Формула:
Д=Х 11 Х 22 - Х 12 Х 21
в основном означает, что разница между вероятностью того, что локусы находятся в configuration I
( 11 & 22
) или configuration II (swapped)
( 12 & 21
). Допустим, есть третья область (3), которая гомологична двум аллелям , имеющим ДНК-блоки A 3 и B 3 .
По определению LD это разница вероятностей. В зависимости от того, как вы определите, оно будет принимать отрицательное или положительное значение. Когда у вас есть 3 рекомбинационно возможных аллеля , может быть шесть случаев:
В этом случае не существует единой меры различия . Вы также можете сделать что-то вроде этого:
LD 1' = P(C1 ) + P(C2 ) - (P( C3 ) + P(C4 ) + P(C5 ) + P( C6 ))
Где LD 1' — LD области 1, а P(C m ) — частота m -й конфигурации.
Теперь, если есть 3 или более смежных блоков ДНК, вы можете определить LD только попарно. Однако это имеет смысл, потому что связь уменьшается с расстоянием, и вы можете вычислить LD AC = LD AB x LD BC
( A, B и C являются смежными в алфавитном порядке. Если A и B не связаны, то A и C не могут быть связаны. )
WYSIWYG