Какая эталонная 16S рРНК?

Недавно я наткнулся на факт, который не беспокоил меня уже много лет. Дело в том, что все универсальные праймеры 16S записываются как "[FR][0-9]+" (в нотации регулярного выражения), то есть имеют позицию относительно ссылки. Я прочитал много статей, в которых вводились эти праймеры, и в большинстве случаев авторы не говорят ничего, кроме «E. coli 16S». Во всяком случае, в одном случае я обнаружил, что это на самом деле эталонная кишечная палочка K12. Но проблема в том, что он имеет 7 различных оперонов рРНК: rrnA, rrnB, rrnC, rrnD, rrnE, rrnF, rrnG. У вас есть ссылка, показывающая конкретный оперон, используемый для обозначения позиции 16S?

Редактировать введите описание изображения здесь

Рисунок 2. Гипервариабельные области в гене 16S рРНК Pseudomonas. Линия на графике отражает колебания изменчивости среди выровненных последовательностей генов 16S рРНК 79 штаммов типа Pseudomonas... ( Bodilis et al., 2012 )

Вы уверены, что они отличаются последовательностью в букваре? Последовательности структурных частей генов, по-видимому, почти идентичны. Вы проверяли GenBank?
@ Дэвид Я сам это не проверял, но вот соответствующая ссылка ... or the same strain may have multiple copies of the 16S rRNA gene that differ by 5% for some regions (such as Escherichia coli K12 [12])... (Нгуен и др., 2016)
@David, хотя праймеры действительно расположены в коротких консервативных областях между гипервариабельными областями, последние чрезвычайно вариабельны. Я добавил рисунок, изображающий эту вариацию у нескольких штаммов Pseudomonas . Поэтому не имеет значения, расположены ли праймеры в консервативных областях или нет, важно то, что они нацелены на области, которые могут различаться как по последовательности, так и по длине.

Ответы (1)

Как вы правильно заметили, разработка оптимальной пары праймеров для секвенирования 16S-рРНК — сложная задача, потому что даже менее вариабельные области неодинаковы у разных штаммов и видов. Sambo et al (2018) даже разработали биоинформатическое программное обеспечение для оптимального дизайна праймеров для секвенирования 16S-рРНК для нескольких бактерий.

Мы предлагаем здесь вычислительный метод оптимизации выбора наборов праймеров, основанный на многокритериальной оптимизации, который одновременно: 1) максимизирует эффективность и специфичность целевой амплификации; 2) максимизирует количество различных бактериальных последовательностей 16S, совпадающих по крайней мере с одним праймером ; 3) сводит к минимуму различия в количестве праймеров, соответствующих каждой бактериальной последовательности 16S. Наш алгоритм может быть применен к любой желаемой длине ампликона без ущерба для вычислительной производительности.

Существует разнообразие генов 16S-рРНК в пределах одного и того же вида, т. е. разные копии не являются точными дубликатами ( Větrovský & Baldrian, 2013 ).

введите описание изображения здесь Ветровски и Балдриан (2013)

Интересно, что разные опероны рРНК в E.coli имеют разные промоторы и даже по-разному экспрессируются в условиях стресса ( Kurylo et al., 2018 ).

Однако Китахара и соавт. (2012) обнаружили, что гены 16S-рРНК, выделенные из образцов почвы вместо исходного гена E.coli , могут поддерживать ее рост. Другими словами , E.coli очень устойчива к мутациям в своей 16S-рРНК.

После контрселекции было получено около 200 клонов производных КТ103 (несущих pRB103, ген 16S рРНК которого был заменен чужеродными генами), из которых было идентифицировано 33 неизбыточных гена 16S рРНК (A01–H03). Путем множественного выравнивания 16S рРНК E. coli и наших метагеномно извлеченных последовательностей 16S рРНК было обнаружено, что по крайней мере 628 (40,7%) из 1542 нуклеотидов были вариабельными, что указывает на заметную мутационную устойчивость 16S рРНК. Поразительно, но функциональные последовательности 16S рРНК (за исключением A10 и F02, которые были на 99,0 % идентичны 16S рРНК E. coli), полученные в этом исследовании, показали только 80,9–89,3 % идентичности с 16S рРНК E. coli, что было значительно ниже значения, указанного в отчете. на данный момент (16S рРНК Proteus vulgaris, 94% идентичность с 16S рРНК E. coli)


На ваш вопрос

Но проблема в том, что он имеет 7 различных оперонов рРНК: rrnA, rrnB, rrnC, rrnD, rrnE, rrnF, rrnG. У вас есть ссылка, показывающая конкретный оперон, используемый для обозначения позиции 16S?

Я не думаю, что какой-либо из них считается эталоном. Полная последовательность 16S-рРНК E.coli, представленная в NCBI , по - видимому, учитывает «консенсус» различных зарегистрированных последовательностей:

[5], [7] содержат обновленные данные о последовательности для оригинальной работы той же лаборатории [4]. Было слишком много расхождений между [4] и [5], [7], чтобы перечислить каждую ревизию в нашей таблице сайтов. Показанная последовательность взята из [7]. [4], [5], [7] указывают на ряд неоднородностей цистрона. Однако существует неопределенность в отношении отнесения этих различных гетерогенностей к конкретным цистронам. Метод РНК, используемый [4], [5], [7], дает среднее значение всех цистронов, присутствующих в клетке [7]. Неоднородности классифицируются по их относительным пропорциям на основные, второстепенные и неопределенные виды. Показанная последовательность соответствует основным видам. Неоднородности были аннотированы как вариации в таблице сайтов. Неизвестно, какой из остатков «с» (основание 633) или «а» (основание 641) подвергается делеции. что приводит к второстепенному компоненту «atctg». [7] предполагает существование одного или двух мутировавших цистронов среди известных семи цистронов рибосомной РНК.За исключением одной делеции основания, эта последовательность идентична текущей последовательности 16S рДНК для гена rRNB E.coli.

На странице NCBI также перечислены различные полиморфизмы и модификации оснований в 16S-рРНК внутри и между разными штаммами/«видами».

NCBI также имеет несколько частичных последовательностей. Когда я проверил P.aeruginosa и B.subtilis , я смог найти только одну или две полные последовательности (остальные были частичными). При этом в каждой записи указывался штамм, из которого она получена. Поэтому я предполагаю, что единой ссылочной последовательности не существует.

Я предполагаю, что люди рассматривают различные варианты при проведении филогенетического анализа (или просто ищут консервативные «сигнатурные» последовательности для данного вида). Я уверен, что существуют вычислительные алгоритмы для оптимальной классификации (см. Chatellier et al., 2014 ). Поскольку у меня нет опыта в этой области, я не могу сказать ничего определенного о рутинной практике. На самом деле исследования по улучшению анализа все еще продолжаются (например, Yang et al., 2016 и Sambo et al., 2018 ).

Хотя у меня нет доступа к оригинальной статье Ehresmann et al. (1972), который, по-видимому, является источником этой последовательности, предварительный просмотр действительно предполагает, что их методология может дать только согласованную последовательность.