Вывод длины последовательности белка из длины последовательности ДНК гена

Question

Вывод длины последовательности белка из длины последовательности ДНК гена

любопытный_кот

Существует ли стандартный способ вывести длину последовательности белка из длины последовательности ДНК гена, кодирующего его?

Наивно я предполагал, что amino_acid_seq_length / 3 -1(удаление стоп-кодона) должно работать, но, видимо, не всегда. Есть ли способ лучше?

Предположим, что ген является эукариотическим, в частности геном растения.

например

Или

НАУКА

(AA Seq. / 3) - 1 должно быть хорошим приближением для бактерий и архей. Поскольку обычно транскрипт РНК является зрелым. В эукариотическом организме у вас есть все виды сложности обработки, поэтому, если вы не сплайсируете последовательность интронов, вы не будете знать наверняка последовательность белка.

любопытный_кот

Спасибо @SciEnt. Но если вы экспрессируете эукариотический ген в чем-то вроде кишечной палочки, результирующий рекомбинантный белок все равно должен быть (АА/3)-1, поскольку в них не будет оборудования для постобработки?

НАУКА

любопытный_кот, если это то, чего мы ожидали, вы правы.

Ответы (1)

Вывод длины последовательности белка из длины последовательности ДНК гена

(AA Seq. / 3) - 1 должно быть хорошим приближением для бактерий и архей. Поскольку обычно транскрипт РНК является зрелым. В эукариотическом организме у вас есть все виды сложности обработки, поэтому, если вы не сплайсируете последовательность интронов, вы не будете знать наверняка последовательность белка.
Спасибо @SciEnt. Но если вы экспрессируете эукариотический ген в чем-то вроде кишечной палочки, результирующий рекомбинантный белок все равно должен быть (АА/3)-1, поскольку в них не будет оборудования для постобработки?
любопытный_кот, если это то, чего мы ожидали, вы правы.

Ашафикс · Answer 1

Ашафикс

Если вы посмотрите на последовательность ДНК в патенте , то увидите, что она не начинается с ATG и не заканчивается стоп-кодоном. Раскрываемая последовательность содержит несколько дополнительных оснований, отсюда и несоответствие длины белка и ДНК. Эти дополнительные основания почти всегда встречаются в кДНК, например, из-за полиаденилирования, последовательностей Козака и т. д.

любопытный_кот

Спасибо! Итак, если бы вы захотели использовать последовательность, скажем, для гетерологичной экспрессии, было бы обязательно исправлять эти аберрации? т.е. как сделать вывод о том, какой будет правильная длина аминокислоты или какие именно основания являются дополнительными основаниями? Другими словами, как «очистить» последовательность кДНК?

Ашафикс

Вы можете использовать такой инструмент: web.expasy.org/translate. Просто введите последовательность и найдите самую длинную открытую рамку для чтения.

любопытный_кот

Еще раз спасибо, Ашафикс. Это многое для меня объясняет. Один небольшой вопрос: ваш инструмент предсказывает правильный белок 569 AA в случае моего второго фрагмента. Замечательно. Но в случае с первой последовательностью инструмент дает 569, тогда как во фрагменте патента указано 570 . АА? Я делаю ошибку? Или....?

Ашафикс

Мне это кажется запутыванием патентных данных, фактическая последовательность в патенте 569, но если вы посмотрите на последние 5 аминокислот в переведенной последовательности, это будет PLGEE, а в аминокислотной последовательности патента из ниоткуда появляется аспартат: PLDEE. . Две рекомендации: 1) Начните организовывать свои последовательности с помощью какой-нибудь программы, их легче визуально сравнивать 2) относитесь к патентам с осторожностью, они должны говорить правду, иначе они будут недействительны, но они не обязательно говорят всю правду и это может быть скрыто глубоко в патенте, чтобы запутать читателя.

любопытный_кот

Спасибо за советы! Любые рекомендации для программы для организации моих последовательностей? Что ты используешь?

Ашафикс

Я не думаю, что здесь уместно рекомендовать коммерческое программное обеспечение, но на Researchgate вы найдете много подсказок.

Вывод длины последовательности белка из длины последовательности ДНК гена

любопытный_кот

НАУКА

любопытный_кот

НАУКА

Ответы (1)

Ашафикс

любопытный_кот

Ашафикс

любопытный_кот

Ашафикс

любопытный_кот

Ашафикс

Биологическая проверка компьютерно-определяемого межгенного взаимодействия

Что подразумевается под «генами в стволе эволюционного дерева»?

Анализ вырожденного выравнивания

Что такое «периферийная догма»?

Как подтвердить регуляторные взаимодействия, выведенные из данных об экспрессии генов?

важность секвенирования кДНК определенного гена у разных растений

Как написать последовательность палиндромов по желанию (создать, теоретически)? (самостоятельный ответ)

Как компьютерные предсказания о сворачивании белка могут быть проверены с помощью вычислений?

Транскрипция ДНК в мРНК с помощью интронов