Преобразование имени гена в идентификатор uniprot

У меня есть список имен генов в файле

CHRNB2
EGR2
GCK
KRT14
LMNA
FGF3
TK2
ABCC8

Как я могу сопоставить их с uniprot ID?
PS Я попробовал Uniprot "сопоставление идентификаторов" (из-"GENEID" в-"UNIPROTKB AC"), но он не смог сопоставить.
Пожалуйста, предложите мне, что делать.

Я так понимаю, это человеческие гены?
да вы правы.
попробуй биомарт.. ..
Это и моя рекомендация. Biomart — инструмент швейцарской армии для такого преобразования.
биомарт действительно помог ... большое спасибо
извиняюсь за задержку. Сделаю как можно скорее...

Ответы (2)

сопоставление идентификаторов

Это называется сопоставлением идентификаторов. Раньше это было головной болью, поскольку программный доступ был единственным реальным способом, но в наши дни это довольно тривиально.

Как упоминалось в комментариях, безусловно, самый популярный и простой способ — использовать загрузчик списков Uniprot для сопоставления . Соответствующую публикацию можно найти здесь . Вы должны преобразовать имя гена в идентификатор базы знаний Uniprot.

Программный доступ

Пользовательский веб-интерфейс Uniprot будет работать с тысячами идентификаторов, но может привести к ошибкам для запросов, превышающих 10 000 идентификаторов. В этом случае программные запросы, вероятно, лучше. Я немного изменил это из документов Uniprot , чтобы идентификаторы запрашивались по одному, чтобы избежать ошибок, связанных с превышением размера запроса. Код Python будет:

import urllib,urllib2

list_to_convert = ["CHRNB2", "EGR2", "GCK", "KRT14", "LMNA", "FGF3", "TK2", "ABCC8"]
url = 'http://www.uniprot.org/mapping/'

print "From To"
for i in list_to_convert:
    params = {
    'from':'GENENAME',
    'to':'ACC',
    'format':'tab',
    'query':i
    }

    data = urllib.urlencode(params)
    request = urllib2.Request(url, data)
    contact = "" # Please set your email address here.
    request.add_header('User-Agent', 'Python %s' % contact)
    response = urllib2.urlopen(request)
    page = response.read(200000)
    print page.splitlines()[1] #Ignores the header line returned by uniprot

Результат этого выглядит так:

From    To
CHRNB2  A0A096MXS8
EGR2    A0A096P554
GCK     A0A021WXA1
KRT14   A0A024R1X6
LMNA    A0A096MQV4
FGF3    A0A096NXI3
TK2     A0A096NJ58
ABCC8   A0A088S7J5

для biomart перейдите по ссылке ниже
http://central.biomart.org/converter/#!/ID_converter/gene_ensembl_config_2

Также есть еще один конвертер, который я нашел довольно полезным
http://biodbnet.abcc.ncifcrf.gov/db/db2db.php#biodb

Можете ли вы объяснить, что делают эти ссылки? Плохая практика — просто публиковать ссылки в качестве ответа: meta.stackexchange.com/questions/8231/…
это совершенно не требует пояснений ... в основном для сопоставления двух идентификаторов. Пожалуйста, обратитесь к вопросу для получения более подробной информации.
Ссылка на биомарт битая. Почему вы выбрали biodb.net вместо Uniprot? (Я не хлопаю, я просто никогда не слышал об этом, и мне любопытно, есть ли у него большое преимущество)