Что означают rs id, аллель с кодом 0 и аллель с кодом 1?

Итак, для проекта, над которым я работал (другая история), я искал проект HapMap и их бесплатные онлайн-файлы. В своем файле README они говорят о том, что для каждого файла легенды для каждой хромосомы / региона есть идентификатор rs, аллель, закодированная 0, 1, и положение пары оснований.

Теперь, посмотрев на это некоторое время, становится совершенно очевидно, что положение пары оснований означает, где расположен каждый нуклеотид в генетической последовательности... это правильно?

И что означают rs id и другие слова? Любая помощь будет принята с благодарностью!

Вот ссылка на файл README, в этом же каталоге лежат файлы об участниках, только включая SNP (снипы!).

Ссылка на файл README проекта HapMap

Канал данных последовательности проекта HapMap (этап 2)

Ответы (1)

rs id — это эталонный идентификатор кластера SNP, см. здесь . По сути, это уникальный идентификатор.

Эта таблица взята по вашей ссылке:

rs              position        0       1
rs11089130      14431347        C       G  
rs738829        14432618        A       G  
rs915674        14433624        A       G

Коды аллелей - это 3-й и 4-й столбцы. SNP — это сайт, в котором разные основания находятся в разных версиях одного и того же гена (разные версии генов — это аллели). Для данного SNP различные аллели обозначаются как 0 или 1 аллель. Таким образом, в таблице первый SNP, rs11089130, имеет две аллели: аллель 0 имеет C в позиции SNP (14431347), тогда как аллель 1 имеет G в этой позиции. Код аллеля не имеет биологического значения.

Я не уверен, что произошло бы, если бы в SNP было три аллеля, но предположительно тогда также был бы SNP, закодированный как 2 .

Редактировать: Аллель 0 является остатком эталонного генома. Аллель 1 представляет собой изучаемый остаток, SNP.

то есть 0 — стандартный аллель, а 1 — мутировавший аллель?
@higgs241 0— это остаток, обнаруженный в эталонном геноме 1, и остаток, обнаруженный в других. Пожалуйста, не ссылайтесь на «мутированные аллели», вариации - это норма...
@terdon является ли эталонный геном одинаковым для каждого зарегистрированного SNP? Я имею в виду, если вы возьмете аллель 0 в каждом SNP, зарегистрированном с помощью rsID, вы получите генетический профиль одного конкретного человека? Кажется, нет: я прочитал на en.wikipedia.org/wiki/Reference_genome , что «геном человека Консорциума по справочным материалам генома (сборка 37) получен от тринадцати анонимных добровольцев из Буффало, штат Нью-Йорк». Этот геном используется в качестве эталона для маркировки 0/1 SNP? И что делать, когда в этой группе людей наблюдается полиморфизм? Может быть, я мог бы задать новый вопрос...
@bli На странице WP, на которую вы ссылаетесь, кажется довольно ясным, что эталонный геном является кураторской конструкцией и поэтому не соответствует одному человеку. на самом деле страница включает следующее предложение: «Система групп крови ABO различается у людей, но эталонный геном человека содержит только аллель O (хотя другие аллели аннотированы)».
@ Алан Бойд Да, я должен был прочитать страницу дальше. Итак, есть этот «геном человека GRC (сборка 37)», который является искусственным гаплоидным эталоном. Это ссылка на все зарегистрированные SNP? Может быть, но у меня нет уверенности. Одна из причин моих сомнений заключается в следующем: может ли случиться так, что новый SNP будет идентифицирован в части генома, еще не представленной в этом эталонном геноме? Я подозреваю, что это становится редкостью, но когда это упоминание было на более ранних стадиях строительства, возможно, это могло произойти.