Насколько я знаю, несколько нитей ДНК составляют ген, так как же каждому гену может соответствовать только одна РНК, и наоборот? Мои знания неверны?
В биологии мало что так однозначно. Здесь нужно учитывать три основных момента.
Большинство эукариотических генов сплайсированы . По сути, это процесс, посредством которого один ген может быть транскрибирован в несколько разных мРНК, каждая из которых затем транслируется в другой белок.
Следовательно, обычно (некоторые гены не подвергаются сплайсингу) нет однозначного соответствия между геном и мРНК, которые он может продуцировать.
Следующая проблема заключается в том, что некоторые гены существуют в нескольких одинаковых копиях в геноме. Для таких генов не всегда возможно узнать, какой из дубликатов действительно был прочитан для получения данной мРНК.
Следовательно, не всегда существует прямое взаимно однозначное соответствие между мРНК и геном, с которого она была транскрибирована. Это, однако, гораздо менее распространено, чем проблема сплайсинга, упомянутая выше, и в большинстве случаев может быть проигнорировано.
Каждый ген находится только на одной цепи ДНК. Да, ДНК двухцепочечная, но каждый ген находится только на одной из двух цепей (другая нить будет обратной комплементарностью гена).
Несмотря на замечания, сделанные выше, на самом деле обычно можно сопоставить молекулу мРНК с геном, который ее произвел. В случае дублирования генов вы просто получите несколько совпадений. Программы, которые существуют для такого рода анализа, могут в основном иметь дело со сплайсингом. Так, например, если у вас есть последовательность 21-й хромосомы человека и последовательность мРНК гена ERG, вы можете сделать (в системе *nix с exonerate
установленной):
exonerate -m coding2genome -t chr21.fasta -q dscam.fasta > out
Что будет производить:
Command line: [exonerate -m est2genome -n 1 -t chr21.fasta -q erg.fasta]
Hostname: [oregano]
C4 Alignment:
------------
Query: gi|609878487|ref|NM_001291391.1| Homo sapiens ERG, ETS transcription factor (ERG), transcript variant 8, mRNA
Target: gi|528476536|ref|NC_018932.2| Homo sapiens chromosome 21, alternate assembly CHM1_1.1, whole genome shotgun sequence:[revcomp]
Model: est2genome
Raw score: 7669
Query range: 0 -> 1546
Target range: 39594417 -> 39332536
1 : GTTTTCACTTGGTCGGAATGGGGAGAGTGTGCAAGAGATCGCTGCGGGACAGGT : 54
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39594417 : GTTTTCACTTGGTCGGAATGGGGAGAGTGTGCAAGAGATCGCTGCGGGACAGGT : 39594364
55 : TCCTAGAGATCGCTCCGGGACGGTCGTGACGGCCCCCGAGGGACATGAGAGAAG : 108
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39594363 : TCCTAGAGATCGCTCCGGGACGGTCGTGACGGCCCCCGAGGGACATGAGAGAAG : 39594310
109 : AGGAGCGGCGCTCAG >>>> Target Intron 1 >>>> GTTATTCCAG : 133
|||||||||||||||++ 76685 bp ++||||||||||
39594309 : AGGAGCGGCGCTCAGgt.........................agGTTATTCCAG : 39517600
134 : GATCTTTGGAGACCCGAGGAAAGCCGTGTTGACCAAAAGCAAGACAAATGACTC : 187
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39517599 : GATCTTTGGAGACCCGAGGAAAGCCGTGTTGACCAAAAGCAAGACAAATGACTC : 39517546
188 : ACAGAGAAAAAAGATGGCAGAACCAAGGGCAACTAAAG >>>> Target In : 226
||||||||||||||||||||||||||||||||||||||++ 9093
39517545 : ACAGAGAAAAAAGATGGCAGAACCAAGGGCAACTAAAGgt.............. : 39517505
227 : tron 2 >>>> CCGTCAGGTTCTGAACAGCTGGTAGATGGGCTGGCTTACTG : 266
bp ++|||||||||||||||||||||||||||||||||||||||||
39517504 : ...........agCCGTCAGGTTCTGAACAGCTGGTAGATGGGCTGGCTTACTG : 39508374
267 : AAGGACATGATTCAGACTGTCCCGGACCCAGCAGCTCATATCAAG >>>> Ta : 312
|||||||||||||||||||||||||||||||||||||||||||||++
39508373 : AAGGACATGATTCAGACTGTCCCGGACCCAGCAGCTCATATCAAGgt....... : 39508326
313 : rget Intron 3 >>>> GAAGCCTTATCAGTTGTGAGTGAGGACCAGTCGT : 345
130340 bp ++||||||||||||||||||||||||||||||||||
39508325 : ..................agGAAGCCTTATCAGTTGTGAGTGAGGACCAGTCGT : 39377955
346 : TGTTTGAGTGTGCCTACGGAACGCCACACCTGGCTAAGACAGAGATGACCGCGT : 399
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377954 : TGTTTGAGTGTGCCTACGGAACGCCACACCTGGCTAAGACAGAGATGACCGCGT : 39377901
400 : CCTCCTCCAGCGACTATGGACAGACTTCCAAGATGAGCCCACGCGTCCCTCAGC : 453
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377900 : CCTCCTCCAGCGACTATGGACAGACTTCCAAGATGAGCCCACGCGTCCCTCAGC : 39377847
454 : AGGATTGGCTGTCTCAACCCCCAGCCAGGGTCACCATCAAAATGGAATGTAACC : 507
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377846 : AGGATTGGCTGTCTCAACCCCCAGCCAGGGTCACCATCAAAATGGAATGTAACC : 39377793
508 : CTAGCCAGGTGAATGGCTCAAG >>>> Target Intron 4 >>>> GAA : 532
||||||||||||||||||||||++ 21741 bp ++|||
39377792 : CTAGCCAGGTGAATGGCTCAAGgt.........................agGAA : 39356027
533 : CTCTCCTGATGAATGCAGTGTGGCCAAAGGCGGGAAGATGGTGGGCAGCCCAGA : 586
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39356026 : CTCTCCTGATGAATGCAGTGTGGCCAAAGGCGGGAAGATGGTGGGCAGCCCAGA : 39355973
587 : CACCGTTGGGATGAACTACGGCAGCTACATGGAGGAGAAGCACATGCCACCCCC : 640
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39355972 : CACCGTTGGGATGAACTACGGCAGCTACATGGAGGAGAAGCACATGCCACCCCC : 39355919
641 : AAACATGACCACGAACGAGCGCAGAGTTATCGTGCCAGCAG >>>> Target : 682
|||||||||||||||||||||||||||||||||||||||||++ 19
39355918 : AAACATGACCACGAACGAGCGCAGAGTTATCGTGCCAGCAGgt........... : 39355875
683 : Intron 5 >>>> ATCCTACGCTATGGAGTACAGACCATGTGCGGCAGTGG : 719
698 bp ++||||||||||||||||||||||||||||||||||||||
39355874 : ..............agATCCTACGCTATGGAGTACAGACCATGTGCGGCAGTGG : 39336142
720 : CTGGAGTGGGCGGTGAAAGAATATGGCCTTCCAGACGTCAACATCTTGTTATTC : 773
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336141 : CTGGAGTGGGCGGTGAAAGAATATGGCCTTCCAGACGTCAACATCTTGTTATTC : 39336088
774 : CAGAACATCGATGGGAAGGAACTGTGCAAGATGACCAAGGACGACTTCCAGAGG : 827
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336087 : CAGAACATCGATGGGAAGGAACTGTGCAAGATGACCAAGGACGACTTCCAGAGG : 39336034
828 : CTCACCCCCAGCTACAACGCCGACATCCTTCTCTCACATCTCCACTACCTCAGA : 881
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336033 : CTCACCCCCAGCTACAACGCCGACATCCTTCTCTCACATCTCCACTACCTCAGA : 39335980
882 : GAGA >>>> Target Intron 6 >>>> CTCCTCTTCCACATTTGACTT : 906
||||++ 867 bp ++|||||||||||||||||||||
39335979 : GAGAgt.........................agCTCCTCTTCCACATTTGACTT : 39335088
907 : CAGATGATGTTGATAAAGCCTTACAAAACTCTCCACGGTTAATGCATGCTAGAA : 960
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39335087 : CAGATGATGTTGATAAAGCCTTACAAAACTCTCCACGGTTAATGCATGCTAGAA : 39335034
961 : ACACAG >>>> Target Intron 7 >>>> GGGGTGCAGCTTTTATTTT : 985
||||||++ 1911 bp ++|||||||||||||||||||
39335033 : ACACAGgt.........................agGGGGTGCAGCTTTTATTTT : 39333098
986 : CCCAAATACTTCAGTATATCCTGAAGCTACGCAAAGAATTACAACTAGGCCAGG : 1039
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39333097 : CCCAAATACTTCAGTATATCCTGAAGCTACGCAAAGAATTACAACTAGGCCAGG : 39333044
1040 : TACGAAAACACCCCTGTGTGATCTCTTCATTGAGAGACATCCCAGATGTCCTGC : 1093
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39333043 : TACGAAAACACCCCTGTGTGATCTCTTCATTGAGAGACATCCCAGATGTCCTGC : 39332990
1094 : TGAGATCCGTGCCCTAAGTCACGTGATACAAAGAGAGCTGATCCCGGAGCTGAA : 1147
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332989 : TGAGATCCGTGCCCTAAGTCACGTGATACAAAGAGAGCTGATCCCGGAGCTGAA : 39332936
1148 : GCCAGTCCCAGACAGTCTTATTCTGCCTCTGTTGATTTGGAGACTAAATCCACT : 1201
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332935 : GCCAGTCCCAGACAGTCTTATTCTGCCTCTGTTGATTTGGAGACTAAATCCACT : 39332882
1202 : CAAACCATTTCATTCAAAGACCACACTAAAGGAATTAAGAGCAGATTAGCCCTT : 1255
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332881 : CAAACCATTTCATTCAAAGACCACACTAAAGGAATTAAGAGCAGATTAGCCCTT : 39332828
1256 : TAACTAGCTTTTCAGAAAGACAGATGGGCAAAGAAGGCATCCTGGATGCCTGGC : 1309
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332827 : TAACTAGCTTTTCAGAAAGACAGATGGGCAAAGAAGGCATCCTGGATGCCTGGC : 39332774
1310 : AGTTAGGAATAGGCCGACTTTTGAACTAACAGAAGGATCTGTCCCTCCTCGGGG : 1363
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332773 : AGTTAGGAATAGGCCGACTTTTGAACTAACAGAAGGATCTGTCCCTCCTCGGGG : 39332720
1364 : GAAGAGCACAAAACAAGGACACTCCCCAGATTCACAGTGACCGATTATCAGTAT : 1417
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332719 : GAAGAGCACAAAACAAGGACACTCCCCAGATTCACAGTGACCGATTATCAGTAT : 39332666
1418 : GTCACAAGAAGCCAGTCTTGCAGAGCAGAAGCATGCAACCAGTAGTATTTACAT : 1471
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332665 : GTCACAAGAAGCCAGTCTTGCAGAGCAGAAGCATGCAACCAGTAGTATTTACAT : 39332612
1472 : CTGAATCTTACTGCCTGTCCTCCAAATGATTTAATTAGGTAATAAATTTACATG : 1525
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332611 : CTGAATCTTACTGCCTGTCCTCCAAATGATTTAATTAGGTAATAAATTTACATG : 39332558
1526 : CCATTCATGCAAAAAAAAAAA : 1546
||||||||||||||| ||| |
39332557 : CCATTCATGCAAAAATAAACA : 39332537
vulgar: gi|609878487|ref|NM_001291391.1| 0 1546 + gi|528476536|ref|NC_018932.2| 39594417 39332536 - 7669 M 123 123 5 0 2 I 0 76681 3 0 2 M 102 102 5 0 2 I 0 9089 3 0 2 M 86 86 5 0 2 I 0 130336 3 0 2 M 218 218 5 0 2 I 0 21737 3 0 2 M 152 152 5 0 2 I 0 19694 3 0 2 M 204 204 5 0 2 I 0 863 3 0 2 M 81 81 5 0 2 I 0 1907 3 0 2 M 580 580
-- completed exonerate analysis
В качестве альтернативы вы можете использовать онлайн-ресурс, такой как страница UCSC BLAT, для сопоставления мРНК с геномом. Вы можете увидеть результаты здесь и на изображении ниже:
Как видите, наша последовательность мРНК запроса (NM_001291391.1) полностью перекрывается с геном ERC.
Между РНК и генами нет однозначного соответствия, но не столько по той причине, которую вы, кажется, имеете в виду (хотя я не уверен, что вы имеете в виду).
Вы должны прочитать статью в Википедии о сплайсинге РНК , она научит вас многому из того, что вам нужно, чтобы получить ответ, который вы, возможно, ищете.
Вы также можете пройти вводный курс, такой как серия «ДНК в РНК в белок» от Академии Хана .
Вэнс Л. Олбо
Тито Альба
StarckOverflar
тердон