Сколько белков человека имеют решенную трехмерную структуру?

Мне было интересно, сколько человеческих белков имеют решенную трехмерную структуру. Есть ли база данных только с человеческими белками? Я посмотрел на pdb, но не смог найти фильтр.

Я думаю, у вас будет много проблем с избыточностью, особенно если вы хотите узнать количество уникальных белков.
@GWW Я думаю, что написание небольшого сценария может избавиться от избыточности.
Возможно, вам повезет, если вы зададите этот вопрос на сайте biostar .
Обратите внимание, что «решено» очень субъективно. Не все структуры качественные, а некоторые просто некорректны из-за экспериментальных ошибок.
Это очень тематический вопрос по двум причинам: Банк данных белков принимает ЯМР и кристаллические структуры белков, которые предлагают различные степени разрешения и точности. Эти структуры также несколько субъективны, поскольку белок может принимать различные конформации в зависимости от его соответствующего биологического контекста. В-третьих, при экстракции растворителем может возникнуть ошибочная структура.
многие из этих белков имеют только один или два домена, решенные как структуры. животные белки тяжелы таким образом. вот где этот вопрос становится немного сложным imho.

Ответы (4)

6405 белков, картированных 5220 генам, согласно Ensembl.

В BioMart от Ensembl вы можете выбрать идентификатор PDB в качестве внешней ссылки. Экспортируйте результаты и подсчитайте уникальные белки/гены, имеющие идентификатор PDB.

PDB — хороший ресурс для ответов на такие вопросы, поскольку он позволяет фильтровать результаты по многим дополнительным параметрам. Для подсчета и извлечения трехмерных структур белков человека:

  1. Откройте Advancedвкладку поиска на веб-сайте PDB.
  2. Выберите Biology-> Source organismв меню.
  3. Тип Homo sapiens (human).
  4. Вы можете уменьшить избыточность, проверив Remove Similar Sequences at n% identityниже.
  5. Отправить запрос.

Чтобы добавить дополнительные фильтры, нажмите Refine Query with Advanced Search. Там вы можете извлечь структуры по дате осаждения, качеству (например, разрешение или R-факторы для структур, решенных с помощью рентгеновской дифракции), лигандам, классификации ферментов и т. д. (путем проверки Add Search Criteria)

Поиск белков человека с удалением гомологов с отсечкой идентичности 90% дает 7117 структур. Количество рентгеновских белковых структур хорошего качества (разрешение <2,5A) в настоящее время составляет 3964 (с таким же пределом идентичности).

Затем вы можете загрузить полученный список или создать собственные отчеты (меню ниже).

Хорошим инструментом (также используемым PDB) для создания неизбыточных наборов данных белков является cd-hit .

Из ваших комментариев не похоже, что вы против написания некоторых пользовательских сценариев, поэтому одним из вариантов было бы воспользоваться базой данных NCBI Structure. Вы можете отфильтровать его по организму , а затем загрузить результаты в виде текстового файла / XML. Если вам нужен доступ к необработанным данным PDB, вы можете загрузить архив PDB и изучить те, которые находятся в вашем отфильтрованном списке.

Новая поисковая система PDBe предназначена для ответов именно на такие вопросы http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules

показывает, что в PDB есть 6964 уникальных макромолекулы человека со структурными данными.

Конечно, многие из них будут фрагментами белков, а не целыми молекулами.