Эталонная последовательность для определения однонуклеотидных полиморфизмов

Однонуклеотидный полиморфизм (SNP) или генетическая изменчивость в целом по определению относятся к эталонной последовательности. Когда мы говорим о базах данных SNP, таких как («dbSNP — база данных полиморфизмов одиночных нуклеотидов и других классов малой генетической изменчивости» или «Карта вариаций последовательности генома человека, содержащая 1,42 миллиона полиморфизмов одиночных нуклеотидов» — названия хорошо известных исследований статьи), что такое эталонный геном? Точно так же для определения «карты / профиля SNP» человека (в медицинской геномике) какова последовательность эталонного генома? Есть ли ссылка де-факто или она зависит от контекста? На http://www.cancer есть предложение «Ученые пытаются идентифицировать все различные SNP в геноме человека» .- при чем здесь эталонный геном?

в качестве эталонного генома обычно используется hg19 (UCSC) или GRCh38 (NCBI). Для популяционных исследований, включающих что-то вроде эндемичной популяции, можно использовать ссылку, зависящую от контекста.

Ответы (2)

Я не вижу твоей точки зрения. Если мы возьмем, например, определение из Википедии :

SNP «является вариацией последовательности ДНК, возникающей, когда один нуклеотид ... в геноме ... различается между представителями биологического вида или парными хромосомами»,

нет места для эталонного генома. SNP — это просто переменная позиция с (обычно) двумя альтернативами у особей одного и того же вида. В проектах полногеномного секвенирования могут быть обнаружены некоторые SNP (именно те, которые находятся в гетерозиготном состоянии), но точно не все.

Исследовать SNP и/или использовать их в качестве генетических маркеров можно независимо от наличия эталонного генома. Так делают для немодельных организмов — например, используя RAD Seq : вы обнаруживаете SNP одновременно с генотипированием.

Как определяется местоположение/положение генома, где мы ищем изменчивость/альтернативу?
Если вы говорите о координатах, то они определяются либо по местоположению на эталонном геноме, либо по положению на генетической карте, либо вообще не определяются.

dbSNP фактически индексирует себя по нескольким референсным геномным сборкам, включая hg19. вы можете увидеть это в записях ssID — мы используем массовые загрузки, и вы можете увидеть их там.

Любое различие в отношении любых двух построений генома на самом деле является вариантом. Вы можете видеть это в случае три- и четырехаллельных вариантов. Бывают случаи, когда целые длины последовательностей добавляются или удаляются по сравнению со сборкой эталонного генома. Это так называемые варианты вставки/удаления, которые также могут содержать короткие или однонуклеотидные варианты.

постараюсь заполнить это немного позже... быстрый ответ здесь.

SNP обнаруживаются не только в проектах полногеномного секвенирования. Это просто тип молекулярных маркеров.
конечно это так.