Находится ли ген в смысловой или антисмысловой цепи?

На данном изображении показан участок двухцепочечной ДНК.

введите описание изображения здесь

Предположим, это синяя нить, к которой присоединяется РНК-полимераза во время транскрипции. Полученная молекула мРНК затем кодирует белок Икс .

Итак, что из следующего считается геном?

а) Синяя нить (антисмысловая нить), к которой присоединяется РНК-полимераза во время транскрипции и которая технически считывается механизмом транскрипции.

б) Красная цепь (смысловая цепь), последовательность оснований которой совпадает с последовательностью оснований нашей молекулы мРНК (за исключением того, что тимин заменен урацилом).

c) Дуплекс ДНК в целом, как показано на приведенной выше схеме.

Поскольку вы недавно отредактировали этот старый вопрос, я предполагаю, что вы заинтересованы в его обсуждении. Хотя я уже ответил, я намерен значительно пересмотреть свой ответ. Не могли бы вы прояснить два момента. 1. Вы спрашиваете (а) ограничен ли термин ген, как он обычно используется в науке (и определяется, например, в учебниках), одной цепью, ИЛИ (б) должен ли термин ген, который обычно не имеет этого положения, быть изменены или уточнены, чтобы ограничить его одним направлением. 2. Вы уверены, какая прядь? Цепь, фактически скопированная в мРНК, представляет собой красную антисмысловую цепь.
(а) это то, что я хотел спросить
Я отредактировал вопрос, чтобы сделать его более понятным.
В моем пересмотренном ответе конкретно рассматривается пункт (а) - использование, которого нет в принятом вами ответе. Он предоставляет ссылки на примеры использования во всей гамме научной сложности. Это также демонстрирует, что проблемы определения гена гораздо более многочисленны, чем перекрытие генов.

Ответы (2)

Ни одна из выделенных областей на вашем рисунке не является геном. Ген – это участок ДНК, дающий начало продукту. По сути, ген имеет ориентацию (5'→ 3'), т.е. по существу представляет собой одноцепочечную область. Однако цепь, которая механически участвует в синтезе РНК (матрица), имеет обратно-комплементарную последовательность гена (другими словами, антисмысловую). Следовательно, ген, как он аннотируется, является не функциональной сущностью, а геномным представлением продукта. Некоторые вирусы (например, фаг М13 ) имеют одноцепочечный геном; для них транскрипт всегда антисмысловой по отношению к области геномной ДНК.

Один и тот же участок двухцепочечной ДНК может содержать несколько генов в обеих ориентациях, и это ясно видно в вирусах, которые имеют очень компактные геномы. Геномы других прокариот и эукариот также имеют перекрывающиеся гены.

Некоторые связанные сообщения:


Означает ли это, что только указанная область молекулы А является геном? Или указанная часть молекулы A + комплементарная часть, присутствующая в молекуле B, включает один ген, так что A представляет собой смысловую цепь, а B представляет собой бессмысленную цепь одного и того же гена?

Если молекулы А и В экспрессируются из противоположных цепей, то они считаются продуктами разных генов, даже если область гена перекрывается.

Ситуация более неясна, если обе молекулы экспрессируются из одной цепи и транскрибируемый участок перекрывается. Иногда они относятся к одному и тому же гену (варианты сплайсинга), а иногда нет.

Это несколько строк из файла аннотации генома человека, в котором указано расположение генов в геноме ( +и -обозначены противоположные нити):

chr1 ген HAVANA 1567474 1570639 . + . ген_ид "ENSG00000189409.8"; Transcription_id "ENSG00000189409.8"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "MMP23B"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "MMP23B"; уровень 2; havana_gene "OTTHUMG00000074713.4";
chr1 ген HAVANA 1590786 1594063 . + . ген_ид "ENSG00000272004.1"; транскрипт_id "ENSG00000272004.1"; ген_тип "антисмысловой"; ген_статус "РОМАН"; имя_гена "RP11-345P4.10"; расшифровка_типа "антисмысловая"; расшифровка_статуса "РОМАНА"; имя_транскрипта "РП11-345П4.10"; уровень 2; havana_gene "OTTHUMG00000185638.1";
chr1 ген HAVANA 1603429 1604850 . + . ген_ид "ENSG00000269737.1"; Transcription_id "ENSG00000269737.1"; ген_тип "антисмысловой"; ген_статус "РОМАН"; имя_гена "RP11-345P4.7"; расшифровка_типа "антисмысловая"; расшифровка_статуса "РОМАНА"; имя_транскрипта "РП11-345П4.7"; уровень 2; havana_gene "OTTHUMG00000182604.1";
chr1 ген HAVANA 1604714 1605836 . + . ген_ид "ENSG00000269227.1"; расшифровка_идентификатор "ENSG00000269227.1"; ген_тип "псевдоген"; ген_статус "ИЗВЕСТНО"; имя_гена "RP11-345P4.6"; транскрипт_тип "псевдоген"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "РП11-345П4.6"; 1-й уровень; тег «псевдо_консенсус»; havana_gene "OTTHUMG00000182605.1";
chr1 ген HAVANA 1570603 1590473 . - . ген_ид "ENSG00000248333.3"; Transcription_id "ENSG00000248333.3"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "CDK11B"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "CDK11B"; уровень 2; havana_gene "OTTHUMG00000078638.4";
chr1 ген HAVANA 1592939 1624167 . - . ген_ид "ENSG00000189339.7"; Transcription_id "ENSG00000189339.7"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "SLC35E2B"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "SLC35E2B"; уровень 2; havana_gene "OTTHUMG00000078639.1";
chr1 ген HAVANA 1634169 1655766 . - . ген_ид "ENSG00000008128.18"; Transcription_id "ENSG00000008128.18"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "CDK11A"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "CDK11A"; уровень 2; havana_gene "OTTHUMG00000000703.14";
chr1 ген HAVANA 1634175 1669127 . - . ген_ид "ENSG00000268575.1"; Transcription_id "ENSG00000268575.1"; ген_тип "обработанный_транскрипт"; ген_статус "РОМАН"; имя_гена "RP1-283E3.8"; расшифровка_типа "обработанная_расшифровка"; расшифровка_статуса "РОМАНА"; имя_транскрипта "RP1-283E3.8"; уровень 2; havana_gene "OTTHUMG00000183552.1";

В этих примерах это не очевидно, но есть много перекрывающихся генов в противоположных цепях. Антисмысловые lncRNAs могут быть примером, на который можно быстро взглянуть. См . Могут ли оба перекрывающихся гена (в противоположных цепях) производить белки? для примера генов, кодирующих антисмысловые перекрывающиеся белки.


Итог : определение гена постоянно меняется, но обычно ген имеет ориентацию цепи. В частности, если две разные РНК синтезируются с противоположных направлений, но из одной и той же области двухцепочечной ДНК, то говорят, что они происходят из двух разных генов. (ознакомьтесь с этим обзором для некоторых конкретных примеров)

Я пересмотрел свой собственный ответ и не рассматриваю перекрытие генов. Однако мне все еще неясен ваш вывод. Вы утверждаете: «Противоположная цепь также иногда может синтезировать продукт, но в этом случае он считается другим геном». Что такое «это» в этом предложении? Вы говорите, что единственная противоположная цепь является геном, или просто есть два гена, разделяющих двухцепочечную ДНК.
@David, я имею в виду, что два гена могут иметь один и тот же участок двухцепочечной ДНК. я уточню это

Короткий ответ

Говоря о генах на двухцепочечной ДНК-хромосоме (ситуация, предполагаемая в этом вопросе), общее и научное использование термина «ген» включает обе цепи ДНК.

Практическое определение «гена» в последние годы подверглось тщательному анализу по причинам, которые будут обсуждаться, особенно в связи с проектом ENCODE. Однако ни в одном из обсуждений, с которыми я сталкивался, не рассматривается ограничение гена одной цепью.

Общее и образовательное использование термина «ген»

Термин « ген» был придуман в 1909 г. «для описания менделевской единицы наследственности» , задолго до того, как было предложено и установлено, что эти единицы находятся в хромосомной ДНК организмов.

Авторитетный общий словарь Мирриам-Вебстер предлагает современную концепцию этого термина, понятную для неспециализированных читателей:

специфическая последовательность нуклеотидов в ДНК или РНК, расположенная обычно на хромосоме и являющаяся функциональной единицей наследования, контролирующая передачу и экспрессию одного или нескольких признаков путем определения структуры определенного полипептида и особенно белка или контролирующей функцию другого генетического материала
, т.е. «Она унаследовала хороший набор генов от своих родителей».

Аналогичное определение дается профессии врача в книге Morton and Spences Genetics for Surgeons .

Несмотря на знания о сложности генов, накопленные за последние годы, в двух современных учебниках по молекулярной биологии существенной чертой определения является то, что оно носит скорее всеохватывающий , чем ограничительный характер . Таким образом, определение в Alberts et al. Молекулярная биология клетки — это:

Область ДНК, которая контролирует дискретную наследственную характеристику, обычно соответствующую одному белку или РНК. Это определение включает всю функциональную единицу, включая кодирующие последовательности ДНК, некодирующие регуляторные последовательности ДНК и интроны.

И определение в глоссарии Lodish et al. — Молекулярно-клеточная биология очень похожа.

Более свежие соображения о термине «ген» в контексте проекта ENCODE.

Есть несколько особенностей структуры и регуляции хромосомной информации, определяющей белки, которые привели к пересмотру использования термина «ген». Это не просто семантическая проблема, так как у основного проекта ENCODE , целью которого было создание «Энциклопедии элементов ДНК», была практическая задача дать названия описываемым элементам.

Я нашел пару полезных статей других авторов, подробно рассматривающих проблему. Один из них принадлежит Смиту и Адкинсону (2010 г.) , а другой — Портину и Уилкинсу (2017 г.) . Если кратко изложить ситуацию, которую они обсуждают, то есть две основные проблемы. Одной из проблем является отклонение от концепции «один ген — одна мРНК — одна полипептидная цепь», вызванное альтернативным сплайсингом, множественными промоторами и альтернативными сайтами инициации трансляции. Во-вторых, обнаружение регуляции транскрипции последовательностями, значительно удаленными от сайта инициации транскрипции.

Общее мышление состоит в том, чтобы переопределить термин «ген» в терминах сетей или интегрированных взаимодействий. Таким образом, собственное предложение Портина и Уилкинса:

Ген представляет собой последовательность ДНК (компонентные сегменты которой не обязательно должны быть физически смежными), которая специфицирует одну или несколько связанных с последовательностью РНК/белков, которые активируются сетями регуляции генов и участвуют в качестве элементов в сетях регуляции генов, часто косвенно. эффекты, или как выходы сетей регуляции генов, причем последние дают более прямые фенотипические эффекты.

и то, что используется в проекте ENCODE, определено Gerstein et al. как:

Ген представляет собой объединение геномных последовательностей, кодирующих согласованный набор потенциально перекрывающихся функциональных продуктов.

  1. ген представляет собой геномную последовательность (ДНК или РНК), непосредственно кодирующую функциональные молекулы продукта, либо РНК, либо белок.
  2. В случае, когда имеется несколько функциональных продуктов, имеющих общие перекрывающиеся области, принимается объединение всех кодирующих их перекрывающихся геномных последовательностей.
  3. Это объединение должно быть последовательным, т. е. выполняться отдельно для конечных белковых и РНК-продуктов, но не требует, чтобы все продукты обязательно имели общую подпоследовательность.

(Он дополнен онтологической диаграммой, которую я не буду воспроизводить здесь.)

Это сложно, но в связи с беспокойством автора ясно одно: авторы никогда не беспокоятся о запутанности, и нет никаких предположений, что ген ограничивается одной цепью .

Два простых аргумента

Можно возразить, что никто не упоминает о запутанности, потому что все предполагают, что ген находится только на одной цепи. Действительно? В любом случае, я закончу парой приземленных аргументов о том, что запутанность не имеет места в определении генов, перекрывающихся или нет.

  • Сайт связывания транскрипционного фактора/РНК-полимеразы — ТАТА-бокс — считается неотъемлемой частью гена. Для связывания необходимы обе нити ТАТА-бокса. Аналогично другие сайты связывания факторов транскрипции. Следовательно, ген не может находиться только на одной цепи.
  • Одноцепочечные ДНК-вирусы обнаруживаются с так называемыми геномами «положительного» и «отрицательного смысла». Таким образом, среди этих геномов явно есть единицы наследственности, которые читаются как «антисмысловые», а также некоторые «антисмысловые». Согласно тезису об «одноцепочечном гене», ни один из них нельзя назвать геном. От них как от предшественников гена в комплементарной цепи в репликативной форме ДНК нужно было бы придумать какой-то термин!