Эти данные последовательности (ДНК) имеют очень мало метиониновых стартов. Как это возможно?

Я работаю над своим первым проектом, связанным с секвенированием, и пытаюсь найти белки с определенным идентификатором PFAM ( PF11999 ). Проект называется «MMETSP», я искал аннотации для этого идентификатора, идентифицировал сигнальные пептиды с помощью SignalP и их целевые местоположения с помощью инструмента под названием MultiLoc2 (я искал только внеклеточные мишени).

Из очень немногих последовательностей, которые остались после всей этой фильтрации, ни один из битов ДНК не начинался с кода пары оснований «ATG» для метионина. Как это может быть?

Я использовал оболочку, чтобы подсчитать, что только 1,83% всех последовательностей начинаются с ATG.
Любые идеи по этому поводу?

Какие именно последовательности вы ищете?
Я ищу антифризные белки (PF11999) в морских диатомовых водорослях, которые расположены во внеклеточной области. Используя сайт расщепления, предоставленный SignalP, я могу выделить целевой пептид. Однако эти пептиды, по-видимому, не имеют «стартового» кода. Я получил последовательности, просматривая идентификаторы белков в файлах fasta, которые я получил в результате поиска по аннотациям.
Значит, вы просто смотрите на последовательность расщепленного пептида? Нет причин, по которым им нужно начинать с метионина, если только они не относятся к типу I и не получают дальнейшего N-концевого процессинга.
Ну, я смотрю на ДНК, кодирующую пептид. Пептид расположен перед «материнским» белком, поэтому ORF должна начинаться с метионина, не так ли?
Если у этого вида нет UTR и CDS аннотирован как полная длина, тогда да. В противном случае нет.
Тогда должно быть "да". В понедельник я поговорю со своим начальником. Спасибо за ваше время!

Ответы (1)

Если кто-нибудь наткнется на этот вопрос, я выяснил, в чем проблема, в конце концов:
вопреки моему предположению, что последовательности ДНК расположены в правильном 5'3'-направлении, оказалось, что мы нашли точную ORF на комплементарной цепи. в другую сторону и кто знает куда еще. К счастью, в MMETSP-Data также есть каталог /pep, в котором необходимые последовательности были найдены в чистой версии. Спасибо за чтение и удачи.