Является ли модуль полным или нет, можно легко проверить, оценив Definition
запись, связанную с модулем; например, в модуле M00010 это определяется как
Definition K01647 (K01681,K01682) (K00031,K00030)
который можно перевести на
K01647 AND (K01681 OR K01682) AND (K00031 OR K00030)
Если это выражение оценивается как TRUE
, модуль завершен.
Теперь мне интересно, существует ли аналоговая информация для одной реакции. Так, например, для R00352 можно найти следующую информацию об ортологии:
Но как мне теперь узнать, в каком логическом отношении находятся КО?
Так что это может быть
K01648 AND K15230 AND K15231
или
K01648 OR (K15230 AND K15231)
и так далее.
Можно ли получить эту информацию из KEGG, и если да, то как?
РЕДАКТИРОВАТЬ:
В приведенном выше примере правильным выражением будет:
K01648 OR (K15230 AND K15231)
Один либо нужен K01648
, либо другой две субъединицы вместе. Так что, к сожалению, это не так просто, как описывает @aretaon в своем ответе, поскольку одного из двух подразделений будет недостаточно. Поэтому нельзя просто связать KO, связанные с реакцией, с помощью логического OR
.
Перефразируя то, что вы уже упомянули в своем вопросе: для завершения модуля KEGG (чтобы организм мог выполнять определенную функцию) вам нужен определенный набор функциональных единиц или ферментов. Таким образом, чтобы оценить способности организма, вы должны проверить его геном на наличие последовательностей генов, связанных с модулем, выполнив логическую операцию, которую вы упомянули выше.
Модуль состоит из химических веществ (C) и реакций (R), как вы можете видеть в данном примере . Чтобы объяснить различия между модулями и реакциями, лучше всего взглянуть на последнюю реакцию, изоцитрат в 2-оксоглутарат. Есть три реакции в штучной упаковке (одна из них представляет собой комбинацию двух), которые все приводят к оксоглутарату. Когда вы посмотрите на ортологию (участвующие ферменты) для реакций в первом поле ( R01899+R00268 ) и во втором поле ( R00267 ), вы увидите, что один и тот же фермент (K0030) выполняет разные реакции. Теперь третья коробка содержит реакцию ( R00709), выполняемый вторым ферментом (К0031), который действует так же (он отличается тем, что в качестве акцептора электронов используется НАД+ вместо НАДФ+). Таким образом, для завершения модуля вы можете использовать любой из двух (это причина для оператора ИЛИ в логической операции).
Если вы теперь хотите оценить, происходит ли определенный тип реакции в данном организме, достаточно иметь один из возможных ферментов, катализирующих эту реакцию. Так:
K01648 OR K15230 OR K15231
Клеб
Аретаон
Клеб