Какие полезные (начальные) метрики можно использовать на филогенетических деревьях?

Я делаю проект по вычислительной биологии, в котором я моделирую эволюцию при различных наборах правил наследования и создаю филогенетические деревья (красиво визуализированные в Python с помощью ete3 ).

У меня вопрос: где я могу найти и проверить некоторые простые показатели, которые могут описать эти деревья с точки зрения «ветвистости» (вы можете сказать, что я не биоинформатик или филогенетик!). Я ищу дескрипторы среднего поля деревьев. Что-то вроде распределения степеней для сетей.

Моя конкретная цель, как и в науке о сетях, состоит в том, чтобы попытаться увидеть, могу ли я различать различные наборы правил, которые создали дерево, исследуя [статистические] свойства самого дерева.

Есть ли какая-то конкретная цель, которую вы хотите достичь, сравнивая эти показатели между разными деревьями? Вы можете подсчитать количество ветвей, время до общего предка всех представленных линий, общее количество «эволюционного времени» как общую длину всех ветвей, среднее время видообразования...
Конкретная цель состоит в том, чтобы, как и в науке о сетях, попытаться увидеть, могу ли я различать различные наборы правил, которые создали дерево, исследуя [статистические] свойства самого дерева.

Ответы (1)

Вот несколько показателей, которые вы можете рассчитать для начала. Вы можете использовать R для выполнения этих вычислений.

Чистая ставка диверсификации (r)

Чистая скорость диверсификации равна (скорость видообразования - скорость вымирания). Вы можете вычислить его с помощью функций bd.msили в пакете для R.bd.kmgeiger

г = 1: введите описание изображения здесь

г = 2: введите описание изображения здесь

Дисбаланс дерева: бесколлекторный индекс (I)

Индекс Коллесса измеряет, насколько несбалансировано дерево. Он суммирует различия в количестве кладов в каждой паре таксонов. Вы можете вычислить его с помощью collessфункции в apTreeshapeпакете для R.

я = 0 введите описание изображения здесь

я = 21 введите описание изображения здесь

Время ветвления (гамма)

Гамма-статистика измеряет, насколько позже или раньше происходят времена ветвления, чем вы ожидаете от нормального процесса рождения-смерти. Отрицательное значение означает, что время ветвления происходит раньше, положительное значение означает, что время ветвления происходит позже. Вы можете измерить гамму (и создать график происхождения во времени (ltt), как показано ниже), используя lttфункцию в пакете Rphytools

(Из этой статьи в Nature )введите описание изображения здесь

Это лишь некоторые из многих параметров, которые можно рассчитать для филогенетического дерева. Этого должно быть достаточно, чтобы вы начали.

Потрясающие! огромное спасибо. я использую python, поэтому надеюсь, что смогу найти аналогичные пакеты для измерения этих вещей (может быть, в ete3?)
ура за это. Я проверю это.