Где я могу найти некоторые наборы данных выровненных последовательностей нуклеотидов? И что я должен предположить о точности раскладок там?
(Я хотел бы использовать такие наборы данных для обучения модели выравнивания, над которой я работаю. В частности, чтобы помочь мне получить оценку некоторых параметров, таких как частота одиночных nt INDEL в некоторых местах.)
Вы можете найти 46-стороннее выравнивание multiz в браузере генома UCSC , оно ниже в части сравнительной геномики и помечено как «против 46-стороннее», что представляет собой выравнивание генома 46 видов позвоночных. Вы можете использовать данные своего браузера генома на сайте или получить информацию о загрузке здесь .
Если вас интересуют парные выравнивания, я не знаю ни одной базы данных парных выравниваний, но на самом деле она вам и не нужна. Вы можете искать последовательности нуклеотидов в базе данных нуклеотидов NCBI и выравнивать их с помощью BLAST на их веб-сайте . BLAST, возможно, является наиболее распространенным инструментом для парного выравнивания, а также для поиска выравнивания в базе данных, когда одна последовательность запросов ищет совпадения во всей базе данных последовательностей. Если вы хотите сделать большое количество выравниваний, вы можете скачать BLAST на свой компьютер, чтобы делать их быстрее.
Крис
Анас Эльгафари
Бехзад Роушанраван
Анас Эльгафари
Анас Эльгафари
WYSIWYG
Анас Эльгафари
WYSIWYG
Анас Эльгафари
Анас Эльгафари
WYSIWYG
Анас Эльгафари
rmccloskey