Прогнозирование последовательности нуклеотидных оснований ДНК из полностью сформированного белка

Я знаю, что существует множество алгоритмов (и множество различных реализаций), которые позволяют предсказать результат синтеза белка по набору нуклеотидных оснований, присутствующих в ДНК. Другими словами, при заданной последовательности таких оснований получается конечный белок (проходя через моделирование различных процессов, которые заканчиваются в белке). Однако существуют ли какие-либо алгоритмы, позволяющие предсказать обратное, т.е. последовательность нуклеотидных оснований, положенных в основу синтеза в данный белок?

Ответы (2)

В принципе это тривиально, но помните, что есть несколько кодонов, которые могут производить одну аминокислоту, поэтому обратный перевод белка либо даст вам наиболее часто используемые кодоны для белка, либо даст вам большое количество возможных последовательностей. .

Здесь и здесь находятся онлайн-программы, которые дадут единый консенсус, а здесь — программа, учитывающая двусмысленности.

Это стандартный метод, используемый в биоинформатике.

Первым шагом является преобразование аминокислотной последовательности в вырожденную нуклеотидную последовательность с использованием соответствующей таблицы кодонов.

Получив вырожденную нуклеотидную последовательность, вы можете сравнить ее со всеми известными нуклеотидными последовательностями, включая целые геномы.

Поскольку вырожденная нуклеотидная последовательность по существу представляет собой вырожденную последовательность кДНК, вы можете просто идентифицировать любые гены с экзонами, способными продуцировать необходимую кДНК посредством сплайсинга.

Этот метод называется tblastn и доступен здесь: https://blast.ncbi.nlm.nih.gov/Blast.cgi .