На данном изображении показан участок двухцепочечной ДНК.
Предположим, это синяя нить, к которой присоединяется РНК-полимераза во время транскрипции. Полученная молекула мРНК затем кодирует белок .
Итак, что из следующего считается геном?
а) Синяя нить (антисмысловая нить), к которой присоединяется РНК-полимераза во время транскрипции и которая технически считывается механизмом транскрипции.
б) Красная цепь (смысловая цепь), последовательность оснований которой совпадает с последовательностью оснований нашей молекулы мРНК (за исключением того, что тимин заменен урацилом).
c) Дуплекс ДНК в целом, как показано на приведенной выше схеме.
Ни одна из выделенных областей на вашем рисунке не является геном. Ген – это участок ДНК, дающий начало продукту. По сути, ген имеет ориентацию (5'→ 3'), т.е. по существу представляет собой одноцепочечную область. Однако цепь, которая механически участвует в синтезе РНК (матрица), имеет обратно-комплементарную последовательность гена (другими словами, антисмысловую). Следовательно, ген, как он аннотируется, является не функциональной сущностью, а геномным представлением продукта. Некоторые вирусы (например, фаг М13 ) имеют одноцепочечный геном; для них транскрипт всегда антисмысловой по отношению к области геномной ДНК.
Один и тот же участок двухцепочечной ДНК может содержать несколько генов в обеих ориентациях, и это ясно видно в вирусах, которые имеют очень компактные геномы. Геномы других прокариот и эукариот также имеют перекрывающиеся гены.
Некоторые связанные сообщения:
Означает ли это, что только указанная область молекулы А является геном? Или указанная часть молекулы A + комплементарная часть, присутствующая в молекуле B, включает один ген, так что A представляет собой смысловую цепь, а B представляет собой бессмысленную цепь одного и того же гена?
Если молекулы А и В экспрессируются из противоположных цепей, то они считаются продуктами разных генов, даже если область гена перекрывается.
Ситуация более неясна, если обе молекулы экспрессируются из одной цепи и транскрибируемый участок перекрывается. Иногда они относятся к одному и тому же гену (варианты сплайсинга), а иногда нет.
Это несколько строк из файла аннотации генома человека, в котором указано расположение генов в геноме ( +
и -
обозначены противоположные нити):
chr1 ген HAVANA 1567474 1570639 . + . ген_ид "ENSG00000189409.8"; Transcription_id "ENSG00000189409.8"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "MMP23B"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "MMP23B"; уровень 2; havana_gene "OTTHUMG00000074713.4"; chr1 ген HAVANA 1590786 1594063 . + . ген_ид "ENSG00000272004.1"; транскрипт_id "ENSG00000272004.1"; ген_тип "антисмысловой"; ген_статус "РОМАН"; имя_гена "RP11-345P4.10"; расшифровка_типа "антисмысловая"; расшифровка_статуса "РОМАНА"; имя_транскрипта "РП11-345П4.10"; уровень 2; havana_gene "OTTHUMG00000185638.1"; chr1 ген HAVANA 1603429 1604850 . + . ген_ид "ENSG00000269737.1"; Transcription_id "ENSG00000269737.1"; ген_тип "антисмысловой"; ген_статус "РОМАН"; имя_гена "RP11-345P4.7"; расшифровка_типа "антисмысловая"; расшифровка_статуса "РОМАНА"; имя_транскрипта "РП11-345П4.7"; уровень 2; havana_gene "OTTHUMG00000182604.1"; chr1 ген HAVANA 1604714 1605836 . + . ген_ид "ENSG00000269227.1"; расшифровка_идентификатор "ENSG00000269227.1"; ген_тип "псевдоген"; ген_статус "ИЗВЕСТНО"; имя_гена "RP11-345P4.6"; транскрипт_тип "псевдоген"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "РП11-345П4.6"; 1-й уровень; тег «псевдо_консенсус»; havana_gene "OTTHUMG00000182605.1"; chr1 ген HAVANA 1570603 1590473 . - . ген_ид "ENSG00000248333.3"; Transcription_id "ENSG00000248333.3"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "CDK11B"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "CDK11B"; уровень 2; havana_gene "OTTHUMG00000078638.4"; chr1 ген HAVANA 1592939 1624167 . - . ген_ид "ENSG00000189339.7"; Transcription_id "ENSG00000189339.7"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "SLC35E2B"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "SLC35E2B"; уровень 2; havana_gene "OTTHUMG00000078639.1"; chr1 ген HAVANA 1634169 1655766 . - . ген_ид "ENSG00000008128.18"; Transcription_id "ENSG00000008128.18"; ген_тип "белковое_кодирование"; ген_статус "ИЗВЕСТНО"; имя_гена "CDK11A"; транскрипт_тип "белковое_кодирование"; расшифровка_статуса "ИЗВЕСТНО"; имя_транскрипта "CDK11A"; уровень 2; havana_gene "OTTHUMG00000000703.14"; chr1 ген HAVANA 1634175 1669127 . - . ген_ид "ENSG00000268575.1"; Transcription_id "ENSG00000268575.1"; ген_тип "обработанный_транскрипт"; ген_статус "РОМАН"; имя_гена "RP1-283E3.8"; расшифровка_типа "обработанная_расшифровка"; расшифровка_статуса "РОМАНА"; имя_транскрипта "RP1-283E3.8"; уровень 2; havana_gene "OTTHUMG00000183552.1";
В этих примерах это не очевидно, но есть много перекрывающихся генов в противоположных цепях. Антисмысловые lncRNAs могут быть примером, на который можно быстро взглянуть. См . Могут ли оба перекрывающихся гена (в противоположных цепях) производить белки? для примера генов, кодирующих антисмысловые перекрывающиеся белки.
Итог : определение гена постоянно меняется, но обычно ген имеет ориентацию цепи. В частности, если две разные РНК синтезируются с противоположных направлений, но из одной и той же области двухцепочечной ДНК, то говорят, что они происходят из двух разных генов. (ознакомьтесь с этим обзором для некоторых конкретных примеров)
Короткий ответ
Говоря о генах на двухцепочечной ДНК-хромосоме (ситуация, предполагаемая в этом вопросе), общее и научное использование термина «ген» включает обе цепи ДНК.
Практическое определение «гена» в последние годы подверглось тщательному анализу по причинам, которые будут обсуждаться, особенно в связи с проектом ENCODE. Однако ни в одном из обсуждений, с которыми я сталкивался, не рассматривается ограничение гена одной цепью.
Общее и образовательное использование термина «ген»
Термин « ген» был придуман в 1909 г. «для описания менделевской единицы наследственности» , задолго до того, как было предложено и установлено, что эти единицы находятся в хромосомной ДНК организмов.
Авторитетный общий словарь Мирриам-Вебстер предлагает современную концепцию этого термина, понятную для неспециализированных читателей:
специфическая последовательность нуклеотидов в ДНК или РНК, расположенная обычно на хромосоме и являющаяся функциональной единицей наследования, контролирующая передачу и экспрессию одного или нескольких признаков путем определения структуры определенного полипептида и особенно белка или контролирующей функцию другого генетического материала
, т.е. «Она унаследовала хороший набор генов от своих родителей».
Аналогичное определение дается профессии врача в книге Morton and Spences Genetics for Surgeons .
Несмотря на знания о сложности генов, накопленные за последние годы, в двух современных учебниках по молекулярной биологии существенной чертой определения является то, что оно носит скорее всеохватывающий , чем ограничительный характер . Таким образом, определение в Alberts et al. — Молекулярная биология клетки — это:
Область ДНК, которая контролирует дискретную наследственную характеристику, обычно соответствующую одному белку или РНК. Это определение включает всю функциональную единицу, включая кодирующие последовательности ДНК, некодирующие регуляторные последовательности ДНК и интроны.
И определение в глоссарии Lodish et al. — Молекулярно-клеточная биология очень похожа.
Более свежие соображения о термине «ген» в контексте проекта ENCODE.
Есть несколько особенностей структуры и регуляции хромосомной информации, определяющей белки, которые привели к пересмотру использования термина «ген». Это не просто семантическая проблема, так как у основного проекта ENCODE , целью которого было создание «Энциклопедии элементов ДНК», была практическая задача дать названия описываемым элементам.
Я нашел пару полезных статей других авторов, подробно рассматривающих проблему. Один из них принадлежит Смиту и Адкинсону (2010 г.) , а другой — Портину и Уилкинсу (2017 г.) . Если кратко изложить ситуацию, которую они обсуждают, то есть две основные проблемы. Одной из проблем является отклонение от концепции «один ген — одна мРНК — одна полипептидная цепь», вызванное альтернативным сплайсингом, множественными промоторами и альтернативными сайтами инициации трансляции. Во-вторых, обнаружение регуляции транскрипции последовательностями, значительно удаленными от сайта инициации транскрипции.
Общее мышление состоит в том, чтобы переопределить термин «ген» в терминах сетей или интегрированных взаимодействий. Таким образом, собственное предложение Портина и Уилкинса:
Ген представляет собой последовательность ДНК (компонентные сегменты которой не обязательно должны быть физически смежными), которая специфицирует одну или несколько связанных с последовательностью РНК/белков, которые активируются сетями регуляции генов и участвуют в качестве элементов в сетях регуляции генов, часто косвенно. эффекты, или как выходы сетей регуляции генов, причем последние дают более прямые фенотипические эффекты.
и то, что используется в проекте ENCODE, определено Gerstein et al. как:
Ген представляет собой объединение геномных последовательностей, кодирующих согласованный набор потенциально перекрывающихся функциональных продуктов.
- ген представляет собой геномную последовательность (ДНК или РНК), непосредственно кодирующую функциональные молекулы продукта, либо РНК, либо белок.
- В случае, когда имеется несколько функциональных продуктов, имеющих общие перекрывающиеся области, принимается объединение всех кодирующих их перекрывающихся геномных последовательностей.
- Это объединение должно быть последовательным, т. е. выполняться отдельно для конечных белковых и РНК-продуктов, но не требует, чтобы все продукты обязательно имели общую подпоследовательность.
(Он дополнен онтологической диаграммой, которую я не буду воспроизводить здесь.)
Это сложно, но в связи с беспокойством автора ясно одно: авторы никогда не беспокоятся о запутанности, и нет никаких предположений, что ген ограничивается одной цепью .
Два простых аргумента
Можно возразить, что никто не упоминает о запутанности, потому что все предполагают, что ген находится только на одной цепи. Действительно? В любом случае, я закончу парой приземленных аргументов о том, что запутанность не имеет места в определении генов, перекрывающихся или нет.
Дэйвид
дичит пудель
дичит пудель
Дэйвид