Как получить список белков, отсортированных по ~1400 уникальным белковым складкам?

Question

Как получить список белков, отсортированных по ~1400 уникальным белковым складкам?

пдб
Биология
база данных
белки
белково-складывающий
белковая структура

Алавкс

Базы данных CATH и SCOP содержат около 1400 уникальных белковых складок, записанных в результате анализа PDB. Однако я не вижу никакого способа получить доступ к этим конкретным данным.

Список каждой из 1400 складок (только идентификационный номер и/или дескриптор)?
Для каждой отдельной складки (из 1400) список идентификаторов PDB для белков, которые, как известно, принимают каждую отдельную складку?

Майк Серфас

Подходит ли rcsb.org/search/browse/scop ?

Ответы (2)

Как получить список белков, отсортированных по ~1400 уникальным белковым складкам?

Дэйвид · Answer 1

Если и существует простой способ сделать это, он очень хорошо спрятан. Утомительный и глупый способ сделать 1 (получить список сгибов), похоже, заключается в том, чтобы свернуть свой собственный:

Перейдите на http://scop.berkeley.edu/ver=2.07 (или любую другую последнюю версию).
Нажмите на каждый из 12 классов по очереди. например (а) все альфа-белки перенаправят вас на http://scop.berkeley.edu/sunid=46456 .
Сохраняйте исходный код каждой страницы как текст.
Напишите и запустите свой собственный синтаксический анализатор, чтобы извлечь sunid ( ) из http://scop.berkeley.edu/sunid= и строку описания, если хотите. (Это предполагает, что вы программируете.) Я думаю, что этот sunid - это идентификатор сгиба.

Если вы можете найти какую-либо базу данных или таблицу, в которой есть значения PDB и sunid, вы можете написать другую программу, чтобы найти ответ на 2.

В качестве альтернативы… (добавлено в январе 2021 г.)

Загрузите dir.cla.scope.2.07-stable.txt (или последнюю версию)
Сохранить как текстовый файл.
Откройте в Mircorsoft Excel. (Простое перетаскивание на значок приложения правильно отформатировало его на моем Mac. Ваш пробег может отличаться.)
Вы можете просто выбрать столбец с идентификаторами, вставить их на другой лист, а затем удалить дубликаты, чтобы получить все разные идентификаторы сгибов. (В качестве альтернативы у вас есть около 276 000 записей, которые вы можете делать с чем угодно.)

Поскольку это всплыло снова примерно через пять лет, и я действительно использовал это недавно, я добавил непрограммный метод для получения информации, просто используя электронную таблицу Excel.

ака DrHouse · Answer 2

Похоже, вы можете загрузить полную базу данных в формате SQL или текстовые файлы с возможностью анализа отсюда: Загрузка SCOP — Беркли

В ссылке также есть ссылка на схему:

Спасибо за ответ, но это не ответ на вопрос. Возможность скачать базу данных не помогает. Схема могла бы быть полезной, за исключением того, что ни одна из таблиц не имеет около ~ 1400 строк или вообще не упоминает складки/топологии в имени или описании таблицы.

Как получить список белков, отсортированных по ~1400 уникальным белковым складкам?

Алавкс

Майк Серфас

Ответы (2)

Дэйвид

Дэйвид

ака DrHouse

Алавкс

Значение спирали αα\alpha и слоев ββ\beta в белках [дубликаты]

Могут ли две вторичные структуры белка «перекрываться» в PDB?

Почему важно предсказывать структуру белка?

Какая доля белков требует фолдинга с помощью шаперонов?

Координаты аминокислот в белковой последовательности

Связь конформационной энтропии и фолдинга белка

Почему денатурированные белки не могут вернуться в нативную форму

Предсказание структуры белка по последовательности аминокислот

Стабилизирующие силы между белковыми последовательностями?

Является ли фолдинг белка симметричным относительно изменения порядка последовательности?