Как получить логическое выражение (на основе KO) для реакций из KEGG?

Является ли модуль полным или нет, можно легко проверить, оценив Definitionзапись, связанную с модулем; например, в модуле M00010 это определяется как

Definition  K01647 (K01681,K01682) (K00031,K00030)

который можно перевести на

K01647 AND (K01681 OR K01682) AND (K00031 OR K00030)

Если это выражение оценивается как TRUE, модуль завершен.

Теперь мне интересно, существует ли аналоговая информация для одной реакции. Так, например, для R00352 можно найти следующую информацию об ортологии:

введите описание изображения здесь

Но как мне теперь узнать, в каком логическом отношении находятся КО?

Так что это может быть

K01648 AND K15230 AND K15231 

или

K01648 OR (K15230 AND K15231)

и так далее.

Можно ли получить эту информацию из KEGG, и если да, то как?

РЕДАКТИРОВАТЬ:

В приведенном выше примере правильным выражением будет:

K01648 OR (K15230 AND K15231)

Один либо нужен K01648, либо другой две субъединицы вместе. Так что, к сожалению, это не так просто, как описывает @aretaon в своем ответе, поскольку одного из двух подразделений будет недостаточно. Поэтому нельзя просто связать KO, связанные с реакцией, с помощью логического OR.

Ответы (1)

Перефразируя то, что вы уже упомянули в своем вопросе: для завершения модуля KEGG (чтобы организм мог выполнять определенную функцию) вам нужен определенный набор функциональных единиц или ферментов. Таким образом, чтобы оценить способности организма, вы должны проверить его геном на наличие последовательностей генов, связанных с модулем, выполнив логическую операцию, которую вы упомянули выше.

Модуль состоит из химических веществ (C) и реакций (R), как вы можете видеть в данном примере . Чтобы объяснить различия между модулями и реакциями, лучше всего взглянуть на последнюю реакцию, изоцитрат в 2-оксоглутарат. Есть три реакции в штучной упаковке (одна из них представляет собой комбинацию двух), которые все приводят к оксоглутарату. Когда вы посмотрите на ортологию (участвующие ферменты) для реакций в первом поле ( R01899+R00268 ) и во втором поле ( R00267 ), вы увидите, что один и тот же фермент (K0030) выполняет разные реакции. Теперь третья коробка содержит реакцию ( R00709), выполняемый вторым ферментом (К0031), который действует так же (он отличается тем, что в качестве акцептора электронов используется НАД+ вместо НАДФ+). Таким образом, для завершения модуля вы можете использовать любой из двух (это причина для оператора ИЛИ в логической операции).

Если вы теперь хотите оценить, происходит ли определенный тип реакции в данном организме, достаточно иметь один из возможных ферментов, катализирующих эту реакцию. Так:

K01648 OR K15230 OR K15231 
Спасибо за ваш ответ. К сожалению, это не так просто (см. мой РЕДАКТИРОВАТЬ), но хотелось бы... ;)
Я пытался найти другой способ, но я думаю, что его нет. Описанный вами логический синтаксис определен только для модулей, а модули охватывают только избранные части всех путей. Таким образом, чтобы быть уверенным, что фермент в реакции является только частью мультиферментного комплекса (как в вашем примере), вы даже не можете вернуться к путям, потому что там также не определены необходимые части.
Да. Я попытался вывести это из структуры модуля и списка реакций, но это тоже не работает, поскольку, к сожалению, это несовместимо между модулями ... Жаль, что, похоже, нет решения этой проблемы.