Я работаю над своим первым проектом, связанным с секвенированием, и пытаюсь найти белки с определенным идентификатором PFAM ( PF11999 ). Проект называется «MMETSP», я искал аннотации для этого идентификатора, идентифицировал сигнальные пептиды с помощью SignalP и их целевые местоположения с помощью инструмента под названием MultiLoc2 (я искал только внеклеточные мишени).
Из очень немногих последовательностей, которые остались после всей этой фильтрации, ни один из битов ДНК не начинался с кода пары оснований «ATG» для метионина. Как это может быть?
Я использовал оболочку, чтобы подсчитать, что только 1,83% всех последовательностей начинаются с ATG.
Любые идеи по этому поводу?
Если кто-нибудь наткнется на этот вопрос, я выяснил, в чем проблема, в конце концов:
вопреки моему предположению, что последовательности ДНК расположены в правильном 5'3'-направлении, оказалось, что мы нашли точную ORF на комплементарной цепи. в другую сторону и кто знает куда еще. К счастью, в MMETSP-Data также есть каталог /pep, в котором необходимые последовательности были найдены в чистой версии. Спасибо за чтение и удачи.
Девон Райан
Бирг3р
Девон Райан
Бирг3р
Девон Райан
Бирг3р