Как говорилось в предыдущем ответе, есть некоторые общедоступные данные HP1 ChIP-seq от D. melanogaster, если не из DGRP, из modENCODE и, возможно, других. В случае modENCODE они опубликовали не только чтения, но и пиковые вызовы (сопоставление с Eland + вызовы с MACS).
BEDTools ( https://github.com/arq5x/bedtools2 ) — это хороший инструмент командной строки для управления интервалами с геномными координатами, а команда Bedtools Nearest может вычислить расстояние до ближайшего объекта. Это будет выглядеть примерно так:
bedtools closest -d -a genomic_features.gff3 -b peak_calls.gff3
Где часть «genomic_features» будет любым подмножеством аннотации генома, которое вас интересует.
Я проработал небольшой пример с данными modENCODE, аннотацией стенограммы Flybase и BEDTools:
http://martinsbioblogg.wordpress.com/2014/07/04/finding-the-distance-from-chip-signals-to-genes/
Ваше здоровье,
м.