Биологическое значение/интерпретация коэффициента кластеризации

Я долго искал ответ на следующий вопрос. Буду признателен за любую помощь/совет или направление.

Я очень часто работаю с большим количеством белков и оцениваю их важность в биологической сети. Традиционно существует два метода, используемых для визуализации белков в сети и получения выводов исключительно на основе сетевой архитектуры, прежде чем подробно рассмотреть лучшие результаты с использованием баз данных. Один из них — степень, а другой — коэффициент кластеризации.

Степень относится к узлу, соединенному с ребрами. Чем выше степень, тем больше узлов подключено к данному узлу. Традиционно люди интерпретируют узлы с высокой степенью как биологически важные, так называемые узлы. Поскольку концентраторы настолько тесно связаны, это означает, что отказ биологического концентратора имеет катастрофические последствия, поскольку функции многих белков связаны/зависят от концентраторов.

Однако меня смущает биологический смысл коэффициента кластеризации узла в данной сети. Я знаю, что коэффициент кластеризации относится к тенденции соседей узлов соединяться друг с другом; однако я не был уверен, что это означает биологически и означает ли это, что узел с высоким коэффициентом кластеризации более «важен», чем узел с низким коэффициентом кластеризации. Мне это кажется маловероятным, потому что белки-концентраторы считаются важными белками; однако концентраторы обычно имеют низкий коэффициент кластеризации, но это не означает, что они менее важны, поскольку они тесно связаны (высокая степень). Поэтому, говоря простым языком, почему люди используют коэффициент кластеризации в биологических сетях и какую биологическую информацию он им предоставляет?

Поэтому я был бы признателен за любые объяснения/советы и ссылки, которые вы могли бы предоставить, которые помогли бы мне понять биологический смысл/интерпретацию коэффициента кластеризации.

Ответы (1)

Прежде всего, я нахожу это интересным вопросом.

Суммируя:

  • Коэффициент кластеризации широко используется

  • Широко признано, что узловые гены более важны, чем плохо связанные гены.

  • но исследования не всегда интересуют узловые гены/белки/молекулы (например, в большинстве метаболических путей участвует вода)

Отвечая на ваш вопрос, почему люди захотят использовать этот метод: если вы возьмете случайную модель (путь), большинство линий будут равномерно распределены между узлами. Это не относится к большинству биологических сетей. Из-за этого глобальный коэффициент кластеризации можно использовать, чтобы увидеть, может ли сеть быть биологической. Коэффициент кластеризации также можно использовать, чтобы узнать о более конкретных узлах. Например, если белок имеет отношения с двумя другими белками (связывание, регуляция и т. д.), два других белка также с большей вероятностью будут иметь отношения друг с другом (аналогично социальной сети).

Использованная литература:

http://en.wikipedia.org/wiki/Clustering_coefficient

http://www.biomedcentral.com/1752-0509/6/34

http://www.pnas.org/content/99/12/7821.full.pdf+html

Да, часть о коэффициенте кластеризации конкретного узла отвечает на мой вопрос! Я также подумал, что, возможно, узел с высоким коэффициентом кластеризации показывает некоторую избыточность этого узла в подкластере сети, поскольку, если его соединение с его непосредственными соседями прервано, эти соседи узлов все равно останутся подключенными. Это тоже будет правильным толкованием? Большое спасибо за ссылки!
Я думаю, это зависит от того, что представляют узлы. В случае с генами-концентраторами я не думаю, что слово «избыточность» является правильным (поскольку вода, очевидно, необходима для метаболизма).