Объясните генную сеть первокурснику

У меня есть матрица смежности со списком генов, связанных друг с другом, что означает генную сеть. Как вы получаете эту информацию о том, что один ген связан с другим в первую очередь. Вы проводите микрочиповый анализ и находите гены, которые активируются и подавляются, и предполагаете, что все гены, которые активизированы, регулируют друг друга. Пожалуйста, объясните.

PS Пример с микрочипом - это то, что я предполагал. Это не означает, что именно таким образом выводится генная сеть. Моя сеть ненаправленная.

Что касается неконтролируемых сетей, вы можете начать с объяснения некоторых элементарных методов вывода сети. Вот хороший обзор ncbi.nlm.nih.gov/pmc/articles/PMC3956069 .

Ответы (1)

Однозначного ответа нет, потому что сети (или графы , как их называют в дискретной математике) — это гибкие инструменты, которые можно использовать для моделирования всевозможных отношений между генами, транскриптами, белками или другими объектами в биологии. (Сети также являются полезными моделями во многих других дисциплинах, таких как социология .) В зависимости от типа сети, которую вы рассматриваете, существуют различные экспериментальные методы определения связей. Ниже я приведу лишь пару примеров. Общие сведения о сетях как абстрактных моделях см. в теории графов .

Генетические регуляторные сети

Регуляторная сеть генов представляет собой ориентированный граф, в котором один ген (А) регулирует другой (В). В этом случае связи между генами являются направленными и могут быть представлены стрелками А B. В зависимости от того, как именно вы определяете «регулирование», соединение A B может означать разные вещи, например:

  • Ген A кодирует фактор транскрипции, который связывается с геном B. В этом случае доказательство A B исходит из анализов белков, связывающихся с ДНК, таких как иммунопреципитация хроматина (ChIP). Большие коллекции таких данных доступны в таких базах данных, как Transfac .
  • Экспрессия гена А вызывает регуляцию гена В любым механизмом (возможно, косвенно). В этом случае данные о взаимодействии могут быть получены из экспериментов, в которых ген А индуцируется (принудительно экспрессируется) или подавляется/удаляется, а результирующие изменения в других генах измеряются, например, с помощью микрочипов или секвенирования РНК. Известным ранним примером этого является набор данных «Розетта» о мутантах с делецией дрожжей.

Вывод о сетях регуляции генов — большая и сложная тема, которую я не могу здесь осветить. Это зависит от многих факторов, например от того, как вы моделируете измерение времени (у вас есть устойчивые или переходные данные) и как вы параметризуете сеть для количественного моделирования данных выражения. Обзор , предложенный @CMosychuk , выглядит хорошим местом для начала.

Сети коэкспрессии

Этот тип сети представляет собой коэкспрессию между генами (или, точнее, между мРНК или белками). Обычно это представление парных корреляций между генами в некотором наборе условий, поэтому источником данных может быть любой набор данных экспрессии мРНК или белка. (Вот один пример .) Поскольку корреляции симметричны, связи в сети этого типа не имеют направления и могут быть представлены просто как ссылка A В (не стрелка). Частичные корреляции иногда используются для фильтрации косвенных ассоциаций, но все же эти сети не содержат информации о причинности, и их не следует путать с направленным типом.

Сети белок-белковых взаимодействий

Это ненаправленные сетевые модели, в которых ссылка A B означает, что два белка взаимодействуют физически. Данные, подтверждающие такие связи, получены из различных биохимических анализов взаимодействия белков, таких как двухгибридный анализ или иммунопреципитация . Существуют большие базы данных, собирающие данные о взаимодействии белок-белок, которые можно использовать для построения этих сетевых моделей, например, BioGRID .

Есть много других типов сетей, но это уже длинный ответ :) Как видите, важно четко понимать, с каким типом сети вы работаете. Часто имеющиеся у вас данные определяют, какая сетевая модель подходит — например, если у вас есть только набор несвязанных профилей транскриптома и нет информации о причинно-следственных связях, лучшей моделью может быть сеть коэкспрессии.