Выполнив выравнивание с использованием Bowtie2 и GRCh38 в качестве эталонной последовательности, я получил необычные совпадения на chrUn
. Вот небольшая часть файла SAM :
@SQ SN:chr22 LN:50818468
@SQ SN:chrX LN:156040895
@SQ SN:chrY LN:57227415
@SQ SN:chrM LN:16569
@SQ SN:chrUn_KI270424v1 LN:2140
Все остальные chr
значения мне понятны (M указывает на митохондриальную ДНК, а 22, Y и X — просто обычные номер/название хромосомы), но я не мог понять, что chrUn
означает и как насчет этого кода после _
?
Я предполагаю , что chrUn_KI270424v1 относится к каркасу или последовательности, которая еще не была назначена хромосоме. Обозначение после Un (неизвестно или не присвоено?) может относиться к конкретной одиночной последовательности или каркасу. Вы сможете определить это, изучив эталонную последовательность и ее документацию.
(Мое предположение основано на том, что можно найти в различных версиях эталонных геномов дрозофилы , с которыми я знаком. Поэтому я не могу помочь вам со спецификой человеческого генома.)
Это для неназначенных последовательностей. См. эту ссылку в FAQ по браузеру генома UCSC: https://genome.ucsc.edu/FAQ/FAQdownloads.html#download11 .
скаймнинген
алек_джинн
скаймнинген