Как подтвердить регуляторные взаимодействия, выведенные из данных об экспрессии генов?

Question

Как подтвердить регуляторные взаимодействия, выведенные из данных об экспрессии генов?

Биология
биоинформатика
генная экспрессия
генная регуляция
молекулярная биология

Апараджита

Мой алгоритм изучает регуляторное взаимодействие между генами, используя подход байесовской сети на основе данных об экспрессии генов. После того, как алгоритм сойдется в сети взаимодействующих генов, как проверить правильность взаимодействий? Я использовал набор данных по раку легких из NCBI GEO с идентификатором: GDS2771. Кроме того, как получить набор генов, ответственных за заболевание (в данном случае рак легких), и как количественно определить уровни их экспрессии как избыточные или недостаточные?

рг255

для этого может потребоваться более подробная информация об используемой вами модели, например, модель могла просто случайным образом выбрать 10 генов и сказать, что они взаимодействуют, хотя я предполагаю, что она делает что-то более сложное :)

WYSIWYG

И да, я согласен с GriffinEvo в том, что вы должны сначала убедиться, что алгоритм использовался правильно, правильно настроены параметры и т. д.

Апараджита

Некоторыми важными параметрами алгоритма являются пороги дискретизации для классификации значений экспрессии генов как избыточной, недостаточной или нормальной экспрессии. Я также не уверен, какими должны быть пороговые значения, а другой важный параметр — это максимальное количество регуляторов для гена? Любая идея о том, как разобраться с этим?

WYSIWYG

Я также пометил ваш пост как биоинформатика. Если ваш запрос связан с оптимизацией модели, уточните это в вопросе.

Ответы (1)

Как подтвердить регуляторные взаимодействия, выведенные из данных об экспрессии генов?

для этого может потребоваться более подробная информация об используемой вами модели, например, модель могла просто случайным образом выбрать 10 генов и сказать, что они взаимодействуют, хотя я предполагаю, что она делает что-то более сложное :)
И да, я согласен с GriffinEvo в том, что вы должны сначала убедиться, что алгоритм использовался правильно, правильно настроены параметры и т. д.
Некоторыми важными параметрами алгоритма являются пороги дискретизации для классификации значений экспрессии генов как избыточной, недостаточной или нормальной экспрессии. Я также не уверен, какими должны быть пороговые значения, а другой важный параметр — это максимальное количество регуляторов для гена? Любая идея о том, как разобраться с этим?
Я также пометил ваш пост как биоинформатика. Если ваш запрос связан с оптимизацией модели, уточните это в вопросе.

WYSIWYG · Answer 1

Вы можете проверить взаимодействие, отключив (KD) или сверхэкспрессируя (OE) ген и проверив изменение уровней экспрессии нижестоящих узлов. Вы можете сделать это с высокой пропускной способностью, используя микрочип или RNAseq. Для белка вы можете сделать ЖХ-МС. Однако этот метод не может помочь вам в:

Различие прямых и косвенных взаимодействий
Нахождение регулирования при наличии петель и других нелинейных взаимодействий в сети

Циклы сложны, но выборка через несколько интервалов времени может дать вам знать, существуют ли колебания или нет. Для большинства обычных случаев этот подход работает.

Обычно за этим следует еще один раунд проверки с использованием относительно низкой пропускной способности, но чувствительного метода, такого как

ПЦР в реальном времени (KD против OE)
Вестерн-блоты (KD против OE)
Репортерные анализы (KD против OE) выявляют прямые взаимодействия. Например, возможный промотор для TF (фактора транскрипции) (выше гена-Y) используется для экспрессии GFP, чтобы увидеть, отвечает ли GFP на TF; тем самым подтверждая влияние TF на Gene-Y через промотор.

В некоторых случаях вам, возможно, придется выполнить ChIP-seq, чтобы узнать, есть ли у гена сайты связывания для TF в его промоторе/энхансере. Вы также можете использовать предсказания для сайтов связывания TF. Чтобы найти регуляцию микроРНК, вы можете увидеть этот пост.

Для обнаружения сложной динамики, такой как импульсы и колебания, вам необходимо собрать данные о динамике во времени.

как количественно определить их уровни экспрессии как чрезмерные или недостаточные?

Для этого вам сначала нужно определить свое управление (регулировка вверх/вниз относительно чего?). Сделав это, вы можете сравнить выражение и использовать правильные статистические тесты для проверки дифференциальной регуляции. Если у вас есть только один образец, то большинство тестов не будут работать. Для RNAseq используются алгоритмы EM, которые используют байесовскую модель для получения правдоподобия и p-значения (я использовал запонки и eXpress). Затем можно выполнить коррекцию FDR при сравнении теста с контролем. Я не очень уверен в алгоритмах, используемых для сравнения данных ЖХ-МС для белков.

ну, я не провожу никаких мокрых лабораторных экспериментов, я использую методы машинного обучения на матрице данных выражения. Тогда как я могу сбить или сверхэкспрессировать паттерн экспрессии гена? Установить низкие значения для нокдауна и высокие значения для сверхэкспрессии, а затем проверить, как меняются регуляторные взаимодействия для этого гена?
@Aparajita Вы сказали «подтвердить».. Вы должны провести эксперименты в мокрой лаборатории, чтобы подтвердить. Ваша модель может делать прогнозы только на основе заданных данных. Вам нужно будет проверить, правильно ли он предсказывает, контрольный эксперимент. Если нет, вам следует обновить параметры модели.

Как подтвердить регуляторные взаимодействия, выведенные из данных об экспрессии генов?

Апараджита

рг255

WYSIWYG

Апараджита

WYSIWYG

Ответы (1)

WYSIWYG

Апараджита

WYSIWYG

Базы данных для графов сети регуляции генов?

Могут ли гены экспрессироваться последовательно?

Генное возмущение, для чего оно используется, объясните компьютерщикам? [закрыто]

Действительно ли подчиненные гены репрессированного оперона «выключены»?

Использование секвенирования РНК для сравнения экспрессии генов у пациентов, а не между контрольными и экспериментальными условиями.

Помогите найти определенные последовательности типов генов BlaZ в Genbank

Регулирование количества копий и CNV

Каким образом репрессор CI может одновременно активировать и репрессировать промотор PRMPRMP_{RM}, обнаруженный в фаге λλ\lambda?

Сколько времени требуется различным механизмам регуляции генов, чтобы они начали действовать?

Как определить направление регуляции гена, сравнивая экспрессию генов?