Я делаю проект по вычислительной биологии, в котором я моделирую эволюцию при различных наборах правил наследования и создаю филогенетические деревья (красиво визуализированные в Python с помощью ete3 ).
У меня вопрос: где я могу найти и проверить некоторые простые показатели, которые могут описать эти деревья с точки зрения «ветвистости» (вы можете сказать, что я не биоинформатик или филогенетик!). Я ищу дескрипторы среднего поля деревьев. Что-то вроде распределения степеней для сетей.
Моя конкретная цель, как и в науке о сетях, состоит в том, чтобы попытаться увидеть, могу ли я различать различные наборы правил, которые создали дерево, исследуя [статистические] свойства самого дерева.
Вот несколько показателей, которые вы можете рассчитать для начала. Вы можете использовать R для выполнения этих вычислений.
Чистая скорость диверсификации равна (скорость видообразования - скорость вымирания). Вы можете вычислить его с помощью функций bd.ms
или в пакете для R.bd.km
geiger
Индекс Коллесса измеряет, насколько несбалансировано дерево. Он суммирует различия в количестве кладов в каждой паре таксонов. Вы можете вычислить его с помощью colless
функции в apTreeshape
пакете для R.
Гамма-статистика измеряет, насколько позже или раньше происходят времена ветвления, чем вы ожидаете от нормального процесса рождения-смерти. Отрицательное значение означает, что время ветвления происходит раньше, положительное значение означает, что время ветвления происходит позже. Вы можете измерить гамму (и создать график происхождения во времени (ltt), как показано ниже), используя ltt
функцию в пакете Rphytools
(Из этой статьи в Nature )
Это лишь некоторые из многих параметров, которые можно рассчитать для филогенетического дерева. Этого должно быть достаточно, чтобы вы начали.
Реми.б
ракконнектор