Я хотел бы убедиться, что мои рассуждения верны. Предполагая, что я знаю последовательность аминокислот интересующего белка. Я ничего не могу сказать о структуре, глядя только на аминокислотную последовательность этого белка. Но если я знаю этот белок из другого организма и известна структура этого белка, то я могу сравнить обе последовательности и сделать какой-то вывод, верно? я имею в виду, что не существует конкретной последовательности, соответствующей, например, мотиву спираль-два-витка-спирали, и что я могу взять эту последовательность, проверить, есть ли она в моем белке, и сказать, что есть спираль-два-витка -спиральный мотив или нет. Я могу сделать это только путем сравнения с белком, структура которого уже известна, верно?
Мне кажется, вы спрашиваете о моделировании гомологии. В этом случае да, вам нужно сравнить интересующий вас белок с белком (или белками) известной структуры. Моделирование гомологии в двух словах включает три (четыре?) шага: идентификация шаблона/выравнивание шаблона, моделирование, оценка качества.
Вы начинаете с поиска шаблона для вашего моделирования. Обычно это делается путем выравнивания последовательностей, например, BLASTing. Предпочтительно использовать множественное выравнивание последовательностей, которое более чувствительно выравнивает консервативные области. Затем вам нужен шаблон с как можно более высокой идентичностью последовательности (выше 50 % обычно дают модели со среднеквадратичной ошибкой около 1 Å [ 1 ] в атомах основной цепи. Избегайте менее 30 %, когда ошибки моделирования быстро возрастают).
Затем существует ряд различных стратегий моделирования ( википедия ). Но в основном все они направлены на то, чтобы как можно лучше предсказать структуру консервативного белкового ядра (обычно это то, что вас действительно интересует). Периферические аминокислоты более динамичны и более подвержены эволюции, и поэтому их труднее предсказать. Затем, самое главное, вы оцениваете качество вашей модели. Это можно сделать путем расчета нарушений статистических потенциалов или физических конформационных энергий (или с использованием более продвинутых методов, таких как методы многомерной регрессии ). Как и в любом моделировании, это действительно самый важный шаг, потому что предсказание с помощью плохой модели вводит в заблуждение и совершенно бесполезно.
Если вы не найдете какой-либо шаблон, вы можете прибегнуть к захватывающей области предсказания структуры белка De novo , где цель состоит в том, чтобы предсказать структуру только по аминокислотной последовательности. Я не очень хорошо знаком с их методами, но предсказать de novo сложно (!). Я не помню точных цифр, но количество конформаций в белке нормального размера астрономически велико, что приводит к большим алгоритмическим и вычислительным проблемам. Кроме того, без какой-либо эталонной последовательности допущения модели больше, чем допущения при моделировании гомологии. Хотя я слышал, что в последние несколько лет в этой области наблюдается большой прогресс.
Редактировать: меня поразило, что вы можете также спрашивать о распознавании белковых складок. Существует большое количество различных инструментов и методов для распознавания и локализации белковых доменов с использованием аминокислотной последовательности в качестве исходных данных. Многие из них доступны в качестве веб-серверов. Например, phyre использует профиль аминокислот и предсказанные вторичные структуры для поиска в библиотеках структур. Методы на основе потоков, такие как MUSTER . Также существует число, основанное на скрытых марковских моделях (HMM). Например, FISH , в котором используются HMM с привязкой к структуре.
Крис
Ала
Крис