У меня есть генетические данные в формате .structure и .vcf (и я могу легко получить доступ к другим форматам с помощью PGDSpider ). Интересующая популяция структурирована, и я хотел бы рассчитать среднее количество попарных различий (по заданному окну) между любой парой популяций.
Есть ли существующий инструмент, который мог бы это сделать?
Что касается другого вопроса о биопроводниках , я бы указал вам на эти пакеты;
Вот учебник, очень похожий на то, что вы просите. Он использует некоторые из упомянутых выше пакетов. В основном это AnnotationHub, GenomicRanges и VariantAnnotation.
Если вам нужно руководство по этим пакетам, они доступны на связанных страницах.