Я впервые пишу на этот форум, но искал помощи в аспектах данных этого проекта.
Мои инструменты выбора были бы в python/R .
Цель: я пытаюсь создать специфический для заболевания профиль только SNP и SNP в миРНК и сайтах-мишенях миРНК.
ЧАСТЬ 1: TCGA Мой первый шаг — использование данных TCGA, в которых перечислены тонны вредных мутаций в формате LOH .txt. Я хотел бы иметь возможность сопоставить эти мутации с SNP, генами или микроРНК (к каким бы объектам они ни принадлежали). Даташит TCGA находится здесь . Пример данных здесь. для рака молочной железы. Думаю, я также могу использовать эти данные микроРНК и мРНК.
Вопросы здесь:
miRNA/мишени и SNPs Следующим шагом является получение специфичных для рака miRNAs и mRNAs и сопоставление с ними SNP? Я предполагаю использование баз данных dbSNP или Sanger miRNA для получения miRNA/мишеней и начальных последовательностей.
Я немного не понимаю, как объединить все эти фрагменты информации, какие форматы использовать для вывода (связанные с отдельными фрагментами) и какие инструменты, если таковые имеются, использовать для сбора всех этих данных с помощью python. Этот инструмент является полезным инструментом mirdsnp.
Вы можете взглянуть на этот учебник , чтобы понять файлы TCGA MAF. И вы можете найти список файлов TCGA MAF, содержащих мутации, сопоставленные с генами и микроРНК, по адресу https://www.synapse.org/#!Search:syn1710680 .
бэп
пруссияп
бэп