Могут ли исчерпывающие алгоритмы создавать MSA, подходящие для трехмерного моделирования конструкций?

При прогнозировании трехмерной структуры белка с помощью моделирования гомологии наиболее важным шагом является множественное выравнивание последовательностей матричных последовательностей с целевым белком, трехмерная модель которого должна быть предсказана. На этом этапе, согласно моей книге «Выравнивание нескольких последовательностей», используется программное обеспечение T-coffee или Praline; эти программы носят эвристический характер и основаны на методе прогрессивного выравнивания. Всегда есть опасения относительно чувствительности и специфичности эвристических алгоритмов.

Чтобы избежать этой проблемы, я думаю, что один из вариантов - использовать исчерпывающие алгоритмы. Можем ли мы на этом этапе выравнивания, который очень важен в 3D-моделировании, использовать исчерпывающие алгоритмы для получения хороших моделей?

О каких исчерпывающих алгоритмах вы говорите? Поиск правильного гомолога, AKAIK, является NP-полной задачей, поэтому используются эвристические методы.
Я говорю о моделировании динамического программирования, поскольку оно исчерпывающее.
@WYSIWYG, не могли бы вы объяснить свой ответ, пожалуйста, чтобы я мог лучше понять.
Эвристические/жадные алгоритмы работают быстрее, чем DP. Я не эксперт в области компьютерных наук, чтобы объяснять это подробно. Вы можете посмотреть этот пост SO .

Ответы (1)

Нет.

Методы множественного выравнивания последовательностей (MSA), такие как T-coffee, который вы упомянули, и Clustal ( http://www.clustal.org ), который также широко используется, используют эвристику для выравнивания по очень веской причине, что исчерпывающие алгоритмы для этого являются NP-полными.

В своем комментарии вы упоминаете алгоритм динамического программирования как исчерпывающий. Выравнивание двух последовательностей с помощью динамического программирования имеет порядок временной сложности (большой O) н 2 и может занять несколько минут в зависимости от длины последовательности и т. д. Выравнивание трех имеет большой O из н 3 и это можно сделать, если у вас много свободного времени, но должно быть очевидно, что это предел количества последовательностей, которые можно выровнять с помощью динамического программирования.

В эвристиках нет ничего постыдного. Возможно, наиболее широко используемая программа биоинформатики в мире, BLAST, использует эвристику. (И ваш мозг каждый день принимает решения, от которых зависит ваша жизнь, используя эвристики.)

Методы, использующие эвристики для MSA, были последовательно модифицированы для работы с известными факторами, которые могут вызывать проблемы, поэтому часто они работают очень хорошо. Как вы можете сказать? Что вам нужно сделать при использовании программ MSA, так это выполнить «проверку работоспособности» любого выравнивания, которое производят программы, — выглядит ли оно разумным, хорошо ли оно соответствует сходным областям, есть ли большие пробелы или пропущены очевидные области гомологии. И если вы занимаетесь 3D-моделированием и у вас не получается выравнивание, которое выглядит хорошо, то ваше моделирование вряд ли будет работать.

Наконец, вы всегда должны учитывать возможность того, что не существует белков с известной структурой, похожих на тот, который вы хотите смоделировать, поэтому вы никогда не получите хорошего MSA.