Значение слова «мотив» в молекулярной биологии

Я хотел бы понять значение термина « мотив» , используемого в молекулярной биологии.

В статье в Nature Biotechnology Патрик Д'Хаселер утверждает:

Мотивы последовательности - это короткие повторяющиеся паттерны ДНК, которые, как предполагается, выполняют биологическую функцию. Часто они указывают сайты связывания, специфичные для последовательности, для белков, таких как нуклеазы и факторы транскрипции (TF).

Означает ли это, что в последовательности ДНК гена есть повторяющиеся паттерны/подпоследовательности ДНК, которые, как предполагается, выполняют биологическую функцию? Если да, то можно ли найти такие мотивы просто с помощью программного обеспечения, обнаруживающего повторяющиеся подстроки в строке?

Что касается биологической функции таких мотивов, я хотел бы пояснить этот отрывок из статьи Williams et al. :

ORF PF1193 P. furiosus показал 12-кратное увеличение уровня мРНК через 20 минут после облучения (таблица S1). PF1193 содержит ферритиноподобный мотив ди-железо, обнаруженный в ферритино- и Dps-подобных белках и бактериоферритинах, и, как было обнаружено, принадлежит к новому подклассу ферритиноподобного надсемейства карбоксилатов ди-железа (Ramsay et al. 2006; Tatur et al. 2005).

Под «мотивом» авторы подразумевают, что ген PF1193 имеет подпоследовательность, которая много раз встречается в последовательности ДНК гена, кодирующего ферритин- и Dps-подобные белки, и что это может указывать на то, что они (гены и родственные им кодируемые белки) имеют схожие характеристики/свойства?

Как это связано с предложением в отрывке из статьи Nature Biotechnology ?

Часто они указывают сайты связывания, специфичные для последовательности, для белков, таких как нуклеазы и факторы транскрипции (TF).

Они, безусловно, означают не слишком плохое выравнивание, вы должны взорвать (AA) свой белок или некоторые его части, чтобы увидеть, насколько он хорош.
В отрывке из вашей связанной статьи «мотив» относится к образцу последовательности белка, а не к образцу последовательности ДНК.
@reuns означает ли AA аминокислоты? Я «взорвал» белок и обнаружил некоторое сходство с ферритиноподобным белком Pleurocapsa (и другим белком защиты ДНК других бактерий). Затем я сопоставил последовательность ДНК гена PF1193 с последовательностью ДНК гена, кодирующего ферритиноподобный белок Pleurocapsa, и нашел сходство и там...
Я отредактировал ваш вопрос, чтобы он соответствовал английскому научному стилю. Я сменил биологию на молекулярную биологию, так как орнитологи понимают под мотивом нечто совершенно иное. Я упростил самую последнюю часть, потому что не мог понять, что вы пытались сказать. Вы увидите, что вопрос стал более компактным и читабельным. Обратите внимание, что при ссылке на опубликованные статьи утверждения в них должны быть отнесены к авторам, а не к журналу. Приписывайте мнения журналам только тогда, когда они появляются в редакционных статьях.
@ Дэвид, спасибо.
@Давид большое спасибо! Я действительно хотел бы полностью понять вопросы моего поста, которые вы выделили курсивом.

Ответы (2)

Значение мотива в молекулярной биологии

В английском языке слово мотив (заимствованное из французского) имеет множество значений в разных областях. Молекулярная биология заимствует узор вместе с оттенком, возможно, эмблемы или значка.

Слово « паттерн» указывает как на повторение, так и на мастер-форму, с которой делаются копии. В молекулярной биологии это указывает на то, что это не уникально, это происходит неоднократно. Эмблема слова предполагает средство идентификации группы, к которой что-то принадлежит. В молекулярной биологии это связано с общей функцией членов группы.

Типы мотивов в молекулярной биологии

Здесь слово « мотив» применяется в основном к трем родственным макромолекулам: ДНК, РНК и белку. Все они представляют собой линейные цепочки ограниченных разновидностей определенных компонентов (четыре нуклеотида, 20 аминокислот), расположенных определенным образом, которые мы относим к последовательности макромолекулы. В общей последовательности могут быть подпоследовательности, которые, если они повторяются, представляют собой закономерности и могут иметь функциональное значение. Мы относимся к таким образцам, как:

  • Мотивы последовательности ДНК
  • Мотивы последовательности РНК
  • Белковые (или аминокислотные) мотивы последовательности

Первый из них — это то, на что ссылается Д'аселеер. Следует отметить, что эти мотивы последовательности могут быть абсолютными или состоять из консенсусных последовательностей , таких как та, что для сайта связывания ROX 1 в цитируемой статье: который может создать узор. Мотивы в молекулярной биологии могут состоять из структурных компонентов. Это выражается в следующем определении белкового мотива :
Консенсусная последовательность сайта связывания ROX

Белковые мотивы представляют собой небольшие области трехмерной структуры белка или последовательности аминокислот , общие для разных белков. Это узнаваемые области структуры белка, которые могут (или не могут) определяться уникальной химической или биологической функцией.

И аналогичное определение , которое рассматривает только структурные мотивы в белках, добавляет: «Пример… это мотив спираль-поворот-спираль. Это мотив в некоторых белках, связывающих ДНК.

Идентификация мотивов последовательности с помощью компьютера

Ограничение предлагаемого подхода состоит в том, что статистически можно было бы ожидать, что любой небольшой образец последовательности будет повторяться в ДНК, и проблема состоит в том, как определить, какие повторяющиеся образцы имеют биологическое значение. Следует понимать, что не только мотив последовательности делает его функциональным, но и контекст, в котором он находится. Таким образом, был обнаружен ТАТА-бокс или другие мотивы ДНК, которые действуют как сайты связывания факторов транскрипции (и отличаются от других случайных или нефункциональных вхождений в геноме) своей близостью к позициям, где инициируется транскрипция. Их функция была подтверждена экспериментально, например, путем связывания РНК-полимеразы с ДНК. (Надеюсь, это ответ на последний вопрос о функции мотивов как сайтов связывания с белком.)

Так что, в общем, нет. Хотя я признаю, что лично использовал вычислительные подходы для обнаружения новых небольших белковых мотивов с водородными связями (несколько специализированная область).

Ферритиноподобный мотив ди-железа

Это не мотив последовательности ДНК. Это даже не мотив белковой последовательности, а структурный белковый мотив. Определение можно найти на InterPro :

Эта запись представляет собой группу белков, содержащих ферритиноподобный домен, который представляет собой домен из примерно 145 остатков, состоящий из четырехспирального пучка, окружающего негемовый, не содержащий серы, дижелезный сайт с оксомостиками. Участок дижелеза содержится в скрученном левостороннем пучке из четырех спиралей, состоящем из двух пар антипараллельных спиралей, соединенных левозакрученным перекрестным соединением.

Здесь показано, что спирали окрашены в желтый цвет, а атомы железа - в красные сферы:

Ферритиноподобный мотив ди-железа

[Из deMare et al. (1996) ]

Сноски

  1. Спираль-виток-спираль также называют доменом . Различие между мотивом и доменом заключается в размере (обратите внимание на небольшой размер в определении белкового мотива). Однако InterPro ссылается на ферритиноподобный образец ди-железа как на мотив, так что это можно рассматривать как приемлемое использование.

  2. Можно возразить, что поскольку последовательность и структура белков задаются в ДНК, мотив также должен быть в ДНК. Это заблуждение. Информация есть, но в зашифрованном виде. Избыточность генетического кода означает, что последовательности белков гораздо более консервативны, чем соответствующие последовательности ДНК, а трехмерные структурные паттерны не очевидны при изучении аминокислотных последовательностей.

Большое спасибо @David. Ситуация сложнее, чем я думал. Но есть ли программы, которые обнаруживают мотивы? Например, если я даю в качестве входных данных последовательность ДНК гена и дает мне их ... Я читал о локаторе «SSR» на этом форуме biology.stackexchange.com/questions/38913/…
Некоторое программное обеспечение, которое реализовало нужный вам биологический контекст и экспериментальные доказательства (так что это своего рода «база данных» мотивов).
Наконец, просто чтобы окончательно прояснить этот важный момент: когда вы говорите Эмблема слова, подразумевается средство идентификации группы, к которой что-то принадлежит. В молекулярной биологии это связано с общей функцией членов группы. Означает ли это, что если два гена имеют общий мотив последовательности ДНК, они разделяют биологическую функцию по отношению к этому мотиву?
Мотивы последовательности ДНК @Manuella обычно связаны с распознаванием белками - для связывания и, возможно, расщепления или химической модификации. Обычно мы не говорим о биологической функции мотива ДНК, и, как я пытался намекнуть, такие мотивы могут быть необходимы, но недостаточны для инициации транскрипции. Эта тема освещена во многих обзорах транскрипции, в некоторых из которых, несомненно, будут таблицы мотивов.
@Manuella Угол предсказания более актуален в белках, где определенные мотивы последовательности могут указывать на то, что белок помечен для транспорта в конкретную органеллу. Таким образом, такие сайты, как SwissProt, имеют базы данных конкретных белковых мотивов и позволяют вам ввести белковую последовательность, чтобы узнать, какие мотивы она содержит. 3D структура несколько иная. Был проведен ряд проектов, определяющих структуру неизвестных белков. Предполагаемая функция часто основывается на выявленных структурных мотивах, как правило, с использованием опыта, хотя существует программное обеспечение для сравнения трехмерных структур.
Хорошо, большое спасибо. Таким образом, мотивы последовательности ДНК обычно связаны с распознаванием белками... поэтому я думаю, что моя первоначальная идея была совершенно неправильной. Итак, самый последний вопрос @David, чтобы официально подтвердить, что мои предположения, к сожалению, были чепухой.
Под биологической функцией я просто имел в виду, что если два гена имеют общий мотив последовательности ДНК, возможно, кодируемые ими белки могут иметь некоторые общие «функциональные» свойства... например, если я рассмотрю ген, кодирующий белок ферритина, я знаю, что белок ферритин обладает способностью избегать образования свободных гидроксильных радикалов, которые могут катализировать окислительное повреждение биомолекул, поскольку они могут накапливать железо и избегать реакции Фентона.
Так что, если я рассмотрю другой ген, у которого есть подпоследовательность в его последовательности гена ДНК, которая является мотивом для гена, кодирующего белок ферритин, могу ли я сказать, что этот последний ген может кодировать белок, который имеет такое же хорошее свойство, как белок ферритина, хранить Железо и предотвращение образования свободных гидроксильных радикалов ?
Один момент, который я не подчеркнул в своем ответе (который я могу включить в более позднюю редакцию): большинство мотивов последовательности ДНК находятся за пределами области гена, который определяет последовательность аминокислот. Таким образом, если два гена имеют такой общий мотив, это подразумевает некоторое сходство в контроле их экспрессии, а не в их белковых продуктах. Я не эксперт по транскрипции, но, например, многие гены транскрибируются в ответ на интерферон, и у них есть общие мотивы — элементы, чувствительные к интерферону. Однако гены кодируют множество различных типов белков, необходимых для борьбы с вирусами.
Хорошо ! @David Это было то, что я хотел сказать в нескольких словах ... если эти мотивы будут обнаружены в CDS (чья последовательность определяет последовательность аминокислот в белке), что произойдет. Сходны ли функции кодируемых белков? Это обсуждение дало мне понять, что я хочу это знать.
@Manuela — см. сноску 2. Тогда лучше посмотреть на последовательности аминокислот. Мотивы последовательности в белках могут указывать на функцию, как в протеинкиназах, но также могут быть транспортными метками. SwissProt, как правило, скажет вам.

Ре:

Когда говорят «мотив», имеют ли они в виду, что ген PF1193 имеет подпоследовательность, которая многократно встречается в последовательности ДНК гена, кодирующего ферритин- и Dps-подобные белки? И это может означать, что они имеют схожие характеристики/свойства?

Да, хотя последовательности мотивов могут быть не совсем идентичными, поскольку действительно важна создаваемая трехмерная структура и, следовательно, ее функция (будь то связывающая, ферментативная или какая-либо еще). Вы можете думать о них как о узнаваемых функциональных единицах, часто, но не всегда, самодостаточных. Например, промоторная последовательность в ДНК будет считаться мотивом, как цинковый палец в белке, так и поли-А-хвост на мРНК.

Проблема с использованием последовательностей мотивов для идентификации генов родственной функции заключается в том, что в ходе эволюции последовательности могли измениться, даже если трехмерная структура (и функция) остаются сходными. Вот документ, работающий над этой проблемой примерно десятилетней давности:

Дж. Биол. Хим. 8 июня 2012 г .; 287(24): 20565–20575. Опубликовано в Интернете 25 апреля 2012 г. doi: 10.1074/jbc.M112.367458 PMCID: PMC3370241 PMID: 22535960 «Использование структурных филогенетических сетей для классификации ферритиноподобного суперсемейства»

Взорвите белок и посмотрите, будут ли первые результаты ферритиноподобными!
Спасибо @Арманд! Да, я также читал в ncbi, что мотивы используются в качестве основы для классификации белков. Но так как вы подтвердили то, что я написал (отрывок, о котором вы сообщили), по крайней мере, концептуально, в качестве грубой оценки могу ли я найти мотивы с помощью кода Python, который находит повторяющиеся подстроки в строке? (где строка представляет собой последовательность ДНК гена)
Этот ответ неверен в отношении ферритиноподобного ди-железного мотива, упомянутого в вопросе. Это мотив структуры белка, а не мотив ДНК. Идентификация семейств генов по последовательностям ДНК, конечно, важна, но она делается на основе общего сходства последовательностей, а не обычно на основе конкретных мотивов, и я не думаю, что это то, о чем спрашивал постер в Условия компьютерного анализа. Я интерпретирую ее вопрос как использование компьютеров для обнаружения мотивов, а не их идентификации в последовательностях ДНК.
@David, на самом деле меня особенно интересовало определение мотивов в последовательностях ДНК ... но да, в ответе не хватало некоторых вещей.