Как именно пробелы определяются в геномике?

Насколько я понимаю, при секвенировании генома «пробелы» относятся к фрагментам, которые не были секвенированы в секвенаторе.

Это правильно? Какие существуют другие значения термина «зазор»?

Ответы (2)

Вы не ошиблись, но разрыв может означать нечто большее. Хорошей недавней ссылкой является эта статья: Генетическая изменчивость и сборка геномов человека de novo .

По сути, пробел возникает, если в нашем геноме происходит что-то, что нельзя объяснить однородностью. Поскольку наш геном очень сложен, вы можете ожидать, что пробел — это нечто большее, чем просто неправильная последовательность. Упомянутый вами разрыв упоминается sequence-coverage gapsниже.

В этой статье есть раздел о типах гэпов.

введите описание изображения здесь

1. Пробелы в охвате последовательностей

Пробелы в секвенировании возникают в самых простых условиях, когда для конкретной части генома не были взяты образцы прочтений последовательности.

2. Сегментарные разрывы, связанные с дублированием

Более одной трети (206/540) эухроматиновых пробелов в референсном геноме человека (GRCh38) окружены крупными, очень идентичными сегментарными дупликациями.

3. Пробелы, связанные со спутниками

К ним относятся короткие и длинные ряды тандемных повторов, обозначаемые как короткие тандемные повторы (STR, также известные как микросателлиты), переменное количество тандемных повторов (VNTR, также известные как макросателлиты) и центромерные сателлитные повторы размером с Mb.

4. Приглушенные пробелы

Приглушенные пробелы определяются как области, которые непреднамеренно закрыты в сборке, но которые на самом деле показывают дополнительные или другие последовательности у подавляющего большинства людей.

5. Пробелы в аллельных вариациях

Некоторые области генома также демонстрируют необычные образцы аллельной изменчивости, часто отражающие глубокое эволюционное слияние.

Слово «пробел» может использоваться как в широком смысле, так и в определенных геномных контекстах, как указано @Student T. Использование, которое, кажется, связано с вашим вопросом — «Пробелы в покрытии последовательностей» — довольно хорошо проиллюстрировано в статье Википедии «Contig » . Ниже я воспроизвожу измененную форму иллюстрации из него (общественное достояние).

Каркас, Contig и Gap

Последовательности «контигов» (см. легенду) полностью известны как перекрывающиеся «прочтения» (сплошные синие стрелки в легенде), хотя «фрагменты» (см. легенду) содержат неупорядоченные области. Однако, поскольку длину фрагментов можно определить приблизительно (например, с помощью гель-электрофореза) — здесь фрагмент 5 является ключевым — два контига могут быть собраны в «каркас» с промежутком (приблизительно) известной длины. Я отметил это как «Пробел» зеленым цветом.

Спасибо за объяснение. Пожалуйста, проверьте мой ответ.
Хорошая категоризация @Student T! Я изменил вступительный абзац моего ответа, чтобы связать его с вашим. Я думаю, что его стоит сохранить, так как он более подробно описывает пробелы в покрытии последовательностей и вводит некоторые другие соответствующие термины.