Как распознать консервативные мотивы белка

Я хотел бы убедиться, что мои рассуждения верны. Предполагая, что я знаю последовательность аминокислот интересующего белка. Я ничего не могу сказать о структуре, глядя только на аминокислотную последовательность этого белка. Но если я знаю этот белок из другого организма и известна структура этого белка, то я могу сравнить обе последовательности и сделать какой-то вывод, верно? я имею в виду, что не существует конкретной последовательности, соответствующей, например, мотиву спираль-два-витка-спирали, и что я могу взять эту последовательность, проверить, есть ли она в моем белке, и сказать, что есть спираль-два-витка -спиральный мотив или нет. Я могу сделать это только путем сравнения с белком, структура которого уже известна, верно?

Да. Вы должны знать мотив последовательности (другим примером этого могут быть мотивы связывания факторов транскрипции), а затем вы можете проводить сравнения последовательностей. Они дадут вам подсказку, какие структуры могут присутствовать, но вам все равно придется провести кристаллографию, чтобы получить определенное доказательство. Но это даст вам направление. Другой возможностью было бы изучение гомологичных белков других видов, о структуре которых известно больше, если это возможно. Сравнение последовательностей даст вам здесь более точную картину.
Спасибо. «Вы должны знать мотив последовательности» — вы имеете в виду, что, например, мотив спираль-два-витка-спираль имеет одинаковую специфику для каждой белковой последовательности? или что мне нужно идентифицировать этот мотив в гомологичном белке, а затем проверить, есть ли у меня такая же последовательность в моем белке?
Я сделал это для мотивов спираль-петля-спираль. Здесь мы сопоставили один известный белок с рядом различных видов. И мы смогли определить некоторые мотивы, которые сохранялись между видами, в то время как другие регионы не сохранялись. Я думаю, что гомологичные белки были бы лучше, но вы также можете попробовать с другими белками спираль-поворот-спираль.

Ответы (1)

Мне кажется, вы спрашиваете о моделировании гомологии. В этом случае да, вам нужно сравнить интересующий вас белок с белком (или белками) известной структуры. Моделирование гомологии в двух словах включает три (четыре?) шага: идентификация шаблона/выравнивание шаблона, моделирование, оценка качества.

Вы начинаете с поиска шаблона для вашего моделирования. Обычно это делается путем выравнивания последовательностей, например, BLASTing. Предпочтительно использовать множественное выравнивание последовательностей, которое более чувствительно выравнивает консервативные области. Затем вам нужен шаблон с как можно более высокой идентичностью последовательности (выше 50 % обычно дают модели со среднеквадратичной ошибкой около 1 Å [ 1 ] в атомах основной цепи. Избегайте менее 30 %, когда ошибки моделирования быстро возрастают).

Затем существует ряд различных стратегий моделирования ( википедия ). Но в основном все они направлены на то, чтобы как можно лучше предсказать структуру консервативного белкового ядра (обычно это то, что вас действительно интересует). Периферические аминокислоты более динамичны и более подвержены эволюции, и поэтому их труднее предсказать. Затем, самое главное, вы оцениваете качество вашей модели. Это можно сделать путем расчета нарушений статистических потенциалов или физических конформационных энергий (или с использованием более продвинутых методов, таких как методы многомерной регрессии ). Как и в любом моделировании, это действительно самый важный шаг, потому что предсказание с помощью плохой модели вводит в заблуждение и совершенно бесполезно.

Если вы не найдете какой-либо шаблон, вы можете прибегнуть к захватывающей области предсказания структуры белка De novo , где цель состоит в том, чтобы предсказать структуру только по аминокислотной последовательности. Я не очень хорошо знаком с их методами, но предсказать de novo сложно (!). Я не помню точных цифр, но количество конформаций в белке нормального размера астрономически велико, что приводит к большим алгоритмическим и вычислительным проблемам. Кроме того, без какой-либо эталонной последовательности допущения модели больше, чем допущения при моделировании гомологии. Хотя я слышал, что в последние несколько лет в этой области наблюдается большой прогресс.


Редактировать: меня поразило, что вы можете также спрашивать о распознавании белковых складок. Существует большое количество различных инструментов и методов для распознавания и локализации белковых доменов с использованием аминокислотной последовательности в качестве исходных данных. Многие из них доступны в качестве веб-серверов. Например, phyre использует профиль аминокислот и предсказанные вторичные структуры для поиска в библиотеках структур. Методы на основе потоков, такие как MUSTER . Также существует число, основанное на скрытых марковских моделях (HMM). Например, FISH , в котором используются HMM с привязкой к структуре.