Как сделать множественное выравнивание последовательностей?

У меня есть последовательность ДНК, которая производит белок 1. но теперь я попросил:

  1. сравнить аминокислотную последовательность белка 1 с девятью гомологичными белками и провести множественное выравнивание последовательностей (MSA) последовательностей.

  2. Определите консенсусную последовательность для белков на основе MSA.

  3. Найдите какие-либо конкретные части белков, которые являются консервативными, а затем объясните, почему эти части являются консервативными.

Хорошим началом будет загрузка вашей последовательности в инструмент/программное обеспечение для выравнивания. Я бы предложил использовать MUSCLE ( drive5.com/muscle ). Он относительно прост в использовании.

Ответы (1)

Инструменты MSA

сравнить аминокислотную последовательность белка 1 с девятью гомологичными белками и сделать множественное выравнивание последовательностей.

У EBI есть портал для многих инструментов MSA , а также другие инструменты MSA, доступные в других местах.

В исследованиях рекомендуется использовать несколько методов выравнивания и смотреть, какой из них создает разумные вставки . Обычно это наименьшее количество событий indel.

Clustal Omega , вероятно, самый сложный инструмент MSA, размещенный на сайте EBI, однако он относительно новый и не так хорошо зарекомендовал себя, как T-coffee или MUSCLE .

Обратите внимание , что эти инструменты довольно регулярно обновляются. Этот вопрос и лучший ответ о «передовых» инструментах MSA 2014 года относятся к статье 2011 года , в которой делается попытка сравнить инструменты MSA. Как вы можете себе представить, современные инструменты быстро меняются (например, был выпущен clustal-w2, а теперь и clustal omega, начиная с этой бумаги по бенчмаркингу). Однако для большинства исследователей это личное предпочтение, и разные инструменты MSA «лучше» для разных ситуаций (скорость вычислений, количество выравниваний, сходство последовательностей, сложность вторичной структуры, локальное или глобальное выравнивание и т. д.) .

Консенсусная последовательность

Определите консенсусную последовательность для белков на основе множественного выравнивания.

Это полностью зависит от информации из вашего мировоззрения.

Обычный способ получить консенсусную последовательность - просто взять наиболее распространенный остаток в каждом положении в MSA. Мне не нравится этот подход, потому что он повышает значимость обильных остатков и уменьшает появление менее обильных остатков. Это искажает биохимию и может легко привести к последовательностям, которые были бы невозможны или бесполезны в биологии. Я всегда предпочел бы видеть необработанное выравнивание.

Сохранение среди выравниваний

Найдите какие-либо конкретные части белков, которые являются консервативными, а затем объясните, почему эти части являются консервативными.

Сохранение обычно подразумевает функцию, и, надеюсь, у вас будет гомолог с категоризированной функцией. Возможно, в вашем случае эту функцию можно было бы приписать консервативной последовательности в других гомологах.

Один блестящий инструмент называется consurf .

изображение структурных и последовательных выравниваний, окрашенных в соответствии с консервацией

Вы можете загрузить в него свой файл MSA, и он будет окрашивать области сохранения от фиолетового до синего. Фиолетовая область означает, что эволюционный отбор не изменил эту область, подразумевая, что это «функциональная» область.

Consurf лучше работает с большим количеством последовательностей, поэтому, возможно, он не подходит для этого проекта. Вместо этого попробуйте загрузить выравнивание в Jalview и показать «сохранение последовательности».

Изображение гистограммы, показывающей разные оценки сохранности в разных позициях последовательности

Осторожность.

При выполнении MSA помните, что алгоритм предполагает, что последовательность гомологична, и это предположение может привести к ошибкам. Если это выглядит неправильно, возможно, так оно и есть!