Мне было интересно, сколько человеческих белков имеют решенную трехмерную структуру. Есть ли база данных только с человеческими белками? Я посмотрел на pdb, но не смог найти фильтр.
6405 белков, картированных 5220 генам, согласно Ensembl.
В BioMart от Ensembl вы можете выбрать идентификатор PDB в качестве внешней ссылки. Экспортируйте результаты и подсчитайте уникальные белки/гены, имеющие идентификатор PDB.
PDB — хороший ресурс для ответов на такие вопросы, поскольку он позволяет фильтровать результаты по многим дополнительным параметрам. Для подсчета и извлечения трехмерных структур белков человека:
Advanced
вкладку поиска на веб-сайте PDB.Biology
-> Source organism
в меню.Homo sapiens (human)
.Remove Similar Sequences at n% identity
ниже.Чтобы добавить дополнительные фильтры, нажмите Refine Query with Advanced Search
. Там вы можете извлечь структуры по дате осаждения, качеству (например, разрешение или R-факторы для структур, решенных с помощью рентгеновской дифракции), лигандам, классификации ферментов и т. д. (путем проверки Add Search Criteria
)
Поиск белков человека с удалением гомологов с отсечкой идентичности 90% дает 7117 структур. Количество рентгеновских белковых структур хорошего качества (разрешение <2,5A) в настоящее время составляет 3964 (с таким же пределом идентичности).
Затем вы можете загрузить полученный список или создать собственные отчеты (меню ниже).
Хорошим инструментом (также используемым PDB) для создания неизбыточных наборов данных белков является cd-hit .
Из ваших комментариев не похоже, что вы против написания некоторых пользовательских сценариев, поэтому одним из вариантов было бы воспользоваться базой данных NCBI Structure. Вы можете отфильтровать его по организму , а затем загрузить результаты в виде текстового файла / XML. Если вам нужен доступ к необработанным данным PDB, вы можете загрузить архив PDB и изучить те, которые находятся в вашем отфильтрованном списке.
Новая поисковая система PDBe предназначена для ответов именно на такие вопросы http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules
показывает, что в PDB есть 6964 уникальных макромолекулы человека со структурными данными.
Конечно, многие из них будут фрагментами белков, а не целыми молекулами.
GWW
Гергана Вандова
GWW
Конрад Рудольф
пользователь560
шигета