Что означает chrUn в выводе Bowtie, работающего с человеческими последовательностями?

Выполнив выравнивание с использованием Bowtie2 и GRCh38 в качестве эталонной последовательности, я получил необычные совпадения на chrUn. Вот небольшая часть файла SAM :

@SQ     SN:chr22   LN:50818468
@SQ     SN:chrX    LN:156040895
@SQ     SN:chrY    LN:57227415
@SQ     SN:chrM    LN:16569
@SQ     SN:chrUn_KI270424v1     LN:2140

Все остальные chrзначения мне понятны (M указывает на митохондриальную ДНК, а 22, Y и X — просто обычные номер/название хромосомы), но я не мог понять, что chrUnозначает и как насчет этого кода после _?

Обычно «Неизвестно». Последовательности, которые не были отнесены ни к одной из хромосом. Я думаю, что это из генома человека, в котором есть несколько последовательностей, не связанных с хромосомой, поэтому у них есть идентификаторы (KI...)
@skymningen Спасибо. Если вы добавите ссылку и опубликуете ее как ответ, я приму ее.
Для этого нет никакой ссылки, кроме опыта, извините.

Ответы (2)

Я предполагаю , что chrUn_KI270424v1 относится к каркасу или последовательности, которая еще не была назначена хромосоме. Обозначение после Un (неизвестно или не присвоено?) может относиться к конкретной одиночной последовательности или каркасу. Вы сможете определить это, изучив эталонную последовательность и ее документацию.

(Мое предположение основано на том, что можно найти в различных версиях эталонных геномов дрозофилы , с которыми я знаком. Поэтому я не могу помочь вам со спецификой человеческого генома.)

Это для неназначенных последовательностей. См. эту ссылку в FAQ по браузеру генома UCSC: https://genome.ucsc.edu/FAQ/FAQdownloads.html#download11 .