Из чего состоит хорошее филогенетическое дерево?

Как можно улучшить филогенетическое дерево? Если бы кто-то сделал «золотой стандарт» филогенетических деревьев, какие бы у него были черты? Будет ли он очень надежным, хорошо решенным и т.д.? Какие еще функции важно стремиться максимизировать, когда дело доходит до улучшения филогенетических деревьев?

Не могли бы вы объединить два ваших вопроса в один, поскольку они тесно связаны? Кроме того, вы можете поработать над своим отношением. Здесь никто не обязан отвечать, поэтому вы, вероятно, захотите сократить использование как можно скорее. Дополнительно: как выглядит ваше собственное исследование, что вы узнали?
Я обнаружил, что филогенетическое дерево является оценкой истинных эволюционных отношений между видами. Таким образом, мы не можем реально измерить точность дерева, потому что мы не знаем «истинного значения», т. е. каков фактический образец эволюционных отношений. Я знаю, что деревья, которые хорошо разрешены, построены с использованием нескольких генов и обладают высокой надежностью/повторяемостью (на что указывают высокие значения начальной загрузки), считаются лучшими, чем другие, но я хотел бы, чтобы некоторые ссылки подтверждали мои выводы, поскольку я делаю проект последнего года обучения. Объективного списка того, что делает хорошую филогению, может не существовать.

Ответы (1)

«Хорошее» филогенетическое дерево должно быть полностью уточненным, должным образом бинарным, иметь высокую поддержку начальной загрузки для всех его ветвей и реконструировать клады, которые, как мы думаем, существуют с высокими значениями поддержки.

Как правило, высокие значения поддержки (помимо начальной загрузки есть и другие методы, но это вопрос в другой раз) являются мерой хорошего дерева. Есть и другие проблемы, например, дерево, в котором нет зон Фельзенштейна , вероятно, лучше, чем дерево, в котором их много.

Однако мы можем знать о деревьях гораздо больше, чем вы думаете. С помощью моделирования мы можем создать наборы данных с известной филогенетической историей, а затем посмотреть, насколько хорошо методы реконструируют историю. Есть еще проблемы (ошибки в используемой модели, просто случайная ошибка, ILS, HGT и другие вещи), но в основном такие исследования говорят нам, как выглядят хорошие филогении.

Очень легко создать множество различных филогений. Используя разные методы, разные модели или схемы аппроксимации, разные гены или последовательности для каждого вида или просто загружая «новые» образцы из вашего существующего набора данных. У филогенетика обычно есть десятки деревьев на выбор, что само по себе является своего рода грубым методом начальной загрузки. Если деревья выглядят одинаково, они, вероятно, довольно хороши. Если их нет, у вас проблемы.

Не могли бы вы уточнить, что значит для дерева быть «полностью очищенным»? Мне интересно, но я не знаком с тем, о чем вы здесь говорите.
Некоторые методы представляют неопределенность, создавая внутренние узлы, которые имеют более трех соединений, по сути говоря, «все эти группы примерно в одинаковой степени похожи, я не могу понять их расположение». Поиск схемы с меньшим количеством этих внутренних узлов содержит больше информации и называется «уточнением» дерева. «Звездное дерево», где все связано одинаково, является наименее очищенным деревом и не содержит никакой информации. «Полностью очищенное» дерево является правильно бинарным и содержит максимум информации.