У меня есть технический вопрос относительно синтаксиса в файлах Protein Data Bank. В белке с PDB# 1AE9 ( файл pdb ) в файле .pdb есть две строки:
HELIX 4 4 MET A 255 ILE A 265 1 11
SHEET 2 B 2 ILE A 253 MET A 255 -1 N ILE A 253 O ILE A 248
Насколько я понимаю из документации, это означает, что существует альфа-спираль, начинающаяся от остатка «MET A 255» до остатка «ILE A 265». Существует также бета-цепь от «ILE A 253» до «MET A 255». Мы видим, что альфа-спираль и бета-цепь имеют общий остаток «MET A 255».
Документация описывает их как:
Формулировка предполагает, что «начальный» остаток включен, но я не уверен, будет ли включен «конечный» остаток.
Вопрос : Должен ли я считать этот остаток принадлежащим как альфа-спирали, так и бета-цепи? Или я должен считать «терминальный» остаток не принадлежащим элементу вторичной структуры? (Или что-то другое?)
TLDR; Ответ: Можно было бы считать, что этот конкретный остаток принадлежит обоим структурным элементам, но это сложный вызов и зависит от метода присвоения вторичной структуры.
Неоднозначное выделение вторичной структуры встречается довольно часто. Хотя очевидно, что не многие люди смогут использовать именно этот белок, описанный ниже подход может быть полезен для других белков.
В PyMol я использовал fetch 1ae9
и выделил M в позиции 255 в цепочке A красным цветом. Я понимаю, почему это неудовлетворительное представление: распределение бета-листа очень короткое, и рассматриваемый остаток явно является началом спирали.
Чтобы выполнить более консервативное выделение вторичной структуры, запустите dss
pymol (разбавленный dssp). Это показывает, что бета-листы на самом деле были весьма предполагаемыми.
Мы можем понять почему, когда посмотрим на модель палки (ниже). Есть только несколько (2-4) пар остатков поблизости, которые были бы доступны для водородных связей, даже если предположить, что все 4 образуют Н-связи, называть это добросовестным бета-листом можно было бы рассматривать как немного великодушное.
Глядя на этот пример (1ae9), мы видим возможность Н-связи с другим предполагаемым бета-листом, а также угол остова, который начинает формировать спираль. Это классический случай неоднозначного двойного назначения. @AlexanderDScouras делает разумный вывод, что и то, и другое в порядке, и прямо отвечает на вопрос: возможно двойное назначение и разрешено . Я бы предпочел исключить бета-листы в этом конкретном случае, но при условии, что кто-то подчеркнет наличие большого количества водородных связей в петле шпильки.
Пока вы можете разумно обосновать назначение, это, вероятно, нормально. Вы можете вручную назначить любой остаток и вторичную структуру .
# set residue 155 to be alpha-helical
alter 155/, ss='H'
# update the scene in PyMOL to reflect the changes.
rebuild
Доказательства — это всегда хорошая идея для поддержки ручных назначений. Быстрым и тщательным способом было бы запустить последовательность через несколько предсказателей вторичной структуры или использовать метасервер Genesilico , чтобы избавить себя от некоторых хлопот (вам понадобится учетная запись) ( это похоже на шаг назад, поскольку теперь у вас есть структуры, поэтому будьте осторожны — если предсказание последовательности не выглядит правильным в соответствии со структурой, это, вероятно, не так ). Другой метод, предложенный Шигетой, заключается в прогоне этого через сюжет Рамачандрана ( любимый вариант – RAMPAGE ).
Если это очень-очень неясно, обсудите это тщательно и четко, когда эта часть белка имеет значение. В конце концов, эти назначения вторичной структуры имеют несколько произвольные ограничения, и когда ситуация приближается к пороговым значениям, важно подходить к ситуации с ясностью и конкретностью.
Источник изображения сюжета Рамачандрана: Автор Dcrjsr — собственная работа, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=9105708
Это почти больше философский вопрос о том, как вы хотели бы определить спирали и листы, которые, я бы сказал, не так хорошо определены. Шигета упоминает, что у них есть четко определенные координаты рамачандрана, но это для центральных остатков. Терминальные остатки гораздо более гибкие. Более традиционное определение соответствует алгоритму DSSP, то есть какова их структура водородных связей в основной цепи.
Алгоритм DSSP немного консервативен в отношении присвоений, часто пропуская первый и последний остатки как в листах, так и в спиралях. В депонированных структурах вы можете сравнить авторские аннотации с DSSP и STRIDE и увидеть, что авторы часто назначают более длинные прогоны, чем любой из них. И я, конечно, видел структуры, в которых остаток аннотируется как оба, особенно когда он находится на стыке между двумя элементами вторичной структуры.
Глядя на структуру, остатки 254 и 255 явно связаны водородными связями в бета-лист с одной стороны и альфа-спираль с другой, поэтому я не вижу причин, по которым они не должны быть аннотированы в обоих.
шигета