Как подтвердить регуляторные взаимодействия, выведенные из данных об экспрессии генов?

Мой алгоритм изучает регуляторное взаимодействие между генами, используя подход байесовской сети на основе данных об экспрессии генов. После того, как алгоритм сойдется в сети взаимодействующих генов, как проверить правильность взаимодействий? Я использовал набор данных по раку легких из NCBI GEO с идентификатором: GDS2771. Кроме того, как получить набор генов, ответственных за заболевание (в данном случае рак легких), и как количественно определить уровни их экспрессии как избыточные или недостаточные?

для этого может потребоваться более подробная информация об используемой вами модели, например, модель могла просто случайным образом выбрать 10 генов и сказать, что они взаимодействуют, хотя я предполагаю, что она делает что-то более сложное :)
И да, я согласен с GriffinEvo в том, что вы должны сначала убедиться, что алгоритм использовался правильно, правильно настроены параметры и т. д.
Некоторыми важными параметрами алгоритма являются пороги дискретизации для классификации значений экспрессии генов как избыточной, недостаточной или нормальной экспрессии. Я также не уверен, какими должны быть пороговые значения, а другой важный параметр — это максимальное количество регуляторов для гена? Любая идея о том, как разобраться с этим?
Я также пометил ваш пост как биоинформатика. Если ваш запрос связан с оптимизацией модели, уточните это в вопросе.

Ответы (1)

Вы можете проверить взаимодействие, отключив (KD) или сверхэкспрессируя (OE) ген и проверив изменение уровней экспрессии нижестоящих узлов. Вы можете сделать это с высокой пропускной способностью, используя микрочип или RNAseq. Для белка вы можете сделать ЖХ-МС. Однако этот метод не может помочь вам в:

  1. Различие прямых и косвенных взаимодействий
  2. Нахождение регулирования при наличии петель и других нелинейных взаимодействий в сети

Циклы сложны, но выборка через несколько интервалов времени может дать вам знать, существуют ли колебания или нет. Для большинства обычных случаев этот подход работает.

Обычно за этим следует еще один раунд проверки с использованием относительно низкой пропускной способности, но чувствительного метода, такого как

  • ПЦР в реальном времени (KD против OE)
  • Вестерн-блоты (KD против OE)
  • Репортерные анализы (KD против OE) выявляют прямые взаимодействия. Например, возможный промотор для TF (фактора транскрипции) (выше гена-Y) используется для экспрессии GFP, чтобы увидеть, отвечает ли GFP на TF; тем самым подтверждая влияние TF на Gene-Y через промотор.

В некоторых случаях вам, возможно, придется выполнить ChIP-seq, чтобы узнать, есть ли у гена сайты связывания для TF в его промоторе/энхансере. Вы также можете использовать предсказания для сайтов связывания TF. Чтобы найти регуляцию микроРНК, вы можете увидеть этот пост.

Для обнаружения сложной динамики, такой как импульсы и колебания, вам необходимо собрать данные о динамике во времени.

как количественно определить их уровни экспрессии как чрезмерные или недостаточные?

Для этого вам сначала нужно определить свое управление (регулировка вверх/вниз относительно чего?). Сделав это, вы можете сравнить выражение и использовать правильные статистические тесты для проверки дифференциальной регуляции. Если у вас есть только один образец, то большинство тестов не будут работать. Для RNAseq используются алгоритмы EM, которые используют байесовскую модель для получения правдоподобия и p-значения (я использовал запонки и eXpress). Затем можно выполнить коррекцию FDR при сравнении теста с контролем. Я не очень уверен в алгоритмах, используемых для сравнения данных ЖХ-МС для белков.

ну, я не провожу никаких мокрых лабораторных экспериментов, я использую методы машинного обучения на матрице данных выражения. Тогда как я могу сбить или сверхэкспрессировать паттерн экспрессии гена? Установить низкие значения для нокдауна и высокие значения для сверхэкспрессии, а затем проверить, как меняются регуляторные взаимодействия для этого гена?
@Aparajita Вы сказали «подтвердить».. Вы должны провести эксперименты в мокрой лаборатории, чтобы подтвердить. Ваша модель может делать прогнозы только на основе заданных данных. Вам нужно будет проверить, правильно ли он предсказывает, контрольный эксперимент. Если нет, вам следует обновить параметры модели.