Я статистик, и я хотел бы проверить свой новый метод на биологических данных. Для этого я ищу данные о генотипах ряда особей. То есть я ищу что-то вроде этого:
| Индивидуальный 1 | Индивидуальный 2 | Индивидуальный 3 | Индивидуальный 4 | .... Хромосома 1 SNP 1 | АА | БА | АБ | ББ | Хромосома 1 SNP 2 | АБ | АА | АБ | БА | Хромосома 2 SNP 1 | ББ | АБ | ББ | АБ | и т.д.
Меня вообще не волнуют виды. В идеале я хотел бы иметь данные для сложных и менее сложных генотипов (разное количество хромосом и количество SNP).
Существуют ли какие-либо общедоступные наборы данных, подобные этому? Я искал в Интернете, но я не могу найти.
это заявленная цель проекта тысячи геномов.
проект тысячи геномов имеет... 1000 геномов.
все это можно скачать.
Как насчет базы данных частот аллелей?
http://alfred.med.yale.edu/alfred/index.asp
Одна из основных проблем с базами данных SNP заключается в том, что их очень много, и вы можете быстро заблудиться. Этот вид дает некоторый обзор доступных ресурсов:
http://www.humgen.nl/SNP_databases.html
Надеюсь это поможет.
Существует огромное количество данных о генотипах, доступных в обозревателе популяционной биологии VectorBase , это база данных насекомых, которые ведут себя в соответствии со многими математическими предположениями, например, непересекающиеся дискретные поколения и однородный ландшафт спаривания.