Стандартные наборы данных для тестирования новых алгоритмов множественного выравнивания последовательностей?

Существуют ли открытые и свободно распространяемые стандартные наборы данных для тестирования новых алгоритмов множественного выравнивания последовательностей ?

Добро пожаловать в бета-версию биологии @msa!!! Спасибо, что задали замечательный вопрос, но я предлагаю вам закрыть любой из тех, которые вы задали, поскольку они дублируют друг друга.
Я всегда сам задавался этим вопросом, поэтому было бы здорово получить подробный ответ! но на данный момент, не могли бы вы посмотреть на известные белки или последовательности ДНК, такие как Ras, в организме или разных видах, и сопоставить их? Лучший способ сделать это — зайти на UniProt ( uniprot.org ) и ввести белок, такой как Ras. После того, как вы выберете конкретный Ras, затем в филогеномных базах данных вы можете выбрать OrthoDB, и как только вы войдете на страницу, вы можете выбрать FASTA или разделитель Tab в верхней части страницы!
@DevashishDas Этот вопрос не является дубликатом связанного вопроса, поскольку он запрашивает стандартный набор данных для msa для тестирования нового алгоритма, а на предыдущий вопрос нет ответа, насколько я могу судить, поэтому он не очень помогает!
@Без: Хорошо. Но они кажутся ужасно связанными, их можно задать одним вопросом. В любом случае, я постараюсь ответить на оба.

Ответы (1)

Я бы посоветовал вам PAcAlCI или Prediction of Accuracy in Alignments на основе Computational Intelligence , хотя аббревиатура в странном инструменте хороша для тестирования новых выравниваний Sequence. Они

Но прежде чем вы начнете тестировать свой алгоритм, я предлагаю взглянуть на эти документы:

[1] Кто наблюдает за сторожами? Оценка контрольных показателей для выравнивания нескольких последовательностей

[2] Вопросы сравнительного анализа биоинформатики: тематическое исследование множественного выравнивания последовательностей.

PS: я сам не проверял и не использовал этот инструмент.