Я ввел эту белковую последовательность:
MEPVDPRLEPWKHPGSQPKTACTTCYCKKCCFHCQVCFTTKALGISYGRKKRRQRRRPPQGSQTHQVSLSKQPTSQPRGDPTGPKE
с этого веб-сайта вместе с опцией COBEpro. Теперь вывод, отправленный этим сайтом на мою электронную почту, выглядит следующим образом:
Имя: temp_prot Аминокислоты: MEPVDPRLEPWKHPGSQPKTACTTCYCKKCCFHCQVCFTTKALGISYGRKKRRQRRRPPQGSQTHQVSLSKQPTSQPRGDPTGPKE Прогнозируемые непрерывные В-клеточные эпитопы:
НАИБОЛЕЕ ВЕРОЯТНЫЕ ЭПИТОПЫ:
0,82848577 39 TKALGIS CCCCCEE eee-ee
0,82036375 39 TKALGI CCCCCE eee-e-
0,76503265 38 TTKALGI ECCCCCE ee-e-
0,73178638 73 TSQPRGDPeeCCee CCCCe
…
и еще несколько. Теперь не могли бы вы мне сказать, если учесть самый первый результат, который я смог найти TKALGIS
в родительской последовательности, но не смог найти CCCCCEE
. Что это CCCCCEE
? И что это eee-e-e
значит?
CCCEEE и т. д. являются второстепенными структурными элементами. В этом случае термин C
относится к неспиральным областям, т.е. к петлевым областям, а не к спиральной области. Или обычноC
относится к тому , является ли остаток спиральным ( ) или частью нити ( ). будет использоваться для обозначения спирали, однако в вопросе выясняется, что спиралей нет. Эти буквы часто различаются в разных программах: это просто точка семантики между разными программами.E
C
E
H
e
или -
относится к тому, открыта ли аминокислота в этом положении или нет ( -
= скрыта).
Для метода вот статья COBEpro , хотя она кажется очень технической. Страница справки содержит более легкодоступную информацию о выводе.
АлисаД