Существует ли общедоступная база данных, содержащая эту информацию? Я пытаюсь создать простую программу аннотации генов, которая позволит мне ввести последовательность ДНК, а затем оптимизировать ее на основе одной из этих таблиц, используя , например, предпочтения E. coli .
Попробуйте базу данных об использовании кодонов в Kazusa. Вы можете искать по организму. База данных содержит 35 799 организмов и составлена из 3 027 973 полных генов, кодирующих белок (CDS), но последний раз обновлялась в 2007 году.
Множество программ, выполняющих такие функции. В обзоре открытого доступа 2007 года перечислены >30 таких программ http://www.ncbi.nlm.nih.gov/pubmed/17882154 . Однако корреляции между «наиболее распространенным» кодоном и выходом экспрессии рекомбинантного белка нет. http://www.ncbi.nlm.nih.gov/pubmed/21102527 . Таким образом, эти > 30 программ бессмысленны.
Бобтеджо
пользователь560
Бобтеджо