Насколько я понимаю, при секвенировании генома «пробелы» относятся к фрагментам, которые не были секвенированы в секвенаторе.
Это правильно? Какие существуют другие значения термина «зазор»?
Вы не ошиблись, но разрыв может означать нечто большее. Хорошей недавней ссылкой является эта статья: Генетическая изменчивость и сборка геномов человека de novo .
По сути, пробел возникает, если в нашем геноме происходит что-то, что нельзя объяснить однородностью. Поскольку наш геном очень сложен, вы можете ожидать, что пробел — это нечто большее, чем просто неправильная последовательность. Упомянутый вами разрыв упоминается sequence-coverage gaps
ниже.
В этой статье есть раздел о типах гэпов.
1. Пробелы в охвате последовательностей
Пробелы в секвенировании возникают в самых простых условиях, когда для конкретной части генома не были взяты образцы прочтений последовательности.
2. Сегментарные разрывы, связанные с дублированием
Более одной трети (206/540) эухроматиновых пробелов в референсном геноме человека (GRCh38) окружены крупными, очень идентичными сегментарными дупликациями.
3. Пробелы, связанные со спутниками
К ним относятся короткие и длинные ряды тандемных повторов, обозначаемые как короткие тандемные повторы (STR, также известные как микросателлиты), переменное количество тандемных повторов (VNTR, также известные как макросателлиты) и центромерные сателлитные повторы размером с Mb.
4. Приглушенные пробелы
Приглушенные пробелы определяются как области, которые непреднамеренно закрыты в сборке, но которые на самом деле показывают дополнительные или другие последовательности у подавляющего большинства людей.
5. Пробелы в аллельных вариациях
Некоторые области генома также демонстрируют необычные образцы аллельной изменчивости, часто отражающие глубокое эволюционное слияние.
Слово «пробел» может использоваться как в широком смысле, так и в определенных геномных контекстах, как указано @Student T. Использование, которое, кажется, связано с вашим вопросом — «Пробелы в покрытии последовательностей» — довольно хорошо проиллюстрировано в статье Википедии «Contig » . Ниже я воспроизвожу измененную форму иллюстрации из него (общественное достояние).
Последовательности «контигов» (см. легенду) полностью известны как перекрывающиеся «прочтения» (сплошные синие стрелки в легенде), хотя «фрагменты» (см. легенду) содержат неупорядоченные области. Однако, поскольку длину фрагментов можно определить приблизительно (например, с помощью гель-электрофореза) — здесь фрагмент 5 является ключевым — два контига могут быть собраны в «каркас» с промежутком (приблизительно) известной длины. Я отметил это как «Пробел» зеленым цветом.
МаленькиеШахматы
Дэйвид