Как получить среднее число попарных различий среди популяций?

У меня есть генетические данные в формате .structure и .vcf (и я могу легко получить доступ к другим форматам с помощью PGDSpider ). Интересующая популяция структурирована, и я хотел бы рассчитать среднее количество попарных различий (по заданному окну) между любой парой популяций.

Есть ли существующий инструмент, который мог бы это сделать?

Ответы (1)

Что касается другого вопроса о биопроводниках , я бы указал вам на эти пакеты;

  1. VariantAnnotation : Предоставляет функциональные возможности для чтения файлов vcf и управления ими.
  2. GenomicRanges : предоставляет функциональные возможности для создания интервалов генома. Также предоставляет функции перекрытия для расчета перекрытий между различными диапазонами.
  3. rtracklayer : позволяет легко менять форматы между различными форматами биологических файлов.
  4. AnnotationHub : Делает многие распространенные и необычные файлы аннотаций доступными в терминале R в различных форматах, таких как TxDb, OrgDb и т. д. и т. д.

Вот учебник, очень похожий на то, что вы просите. Он использует некоторые из упомянутых выше пакетов. В основном это AnnotationHub, GenomicRanges и VariantAnnotation.

Если вам нужно руководство по этим пакетам, они доступны на связанных страницах.