1.病毒基因組大小相差較大,與細菌或真核細胞相比,病毒的基因組很小,但是不同的病毒之間其基因組相差亦甚大。如乙肝病毒DNA只有3kb大小,所含信息量也較小,只能編碼4種蛋白質,而痘病毒的基因組有300kb之大,可以編碼幾百種蛋白質,不但為病毒復制所涉及的酶類編碼,甚至為核苷酸代謝的酶類編碼,因此,痘病毒對宿主的依賴性較乙肝病毒小得多。
2.病毒基因組可以由DNA組成,也可以由RNA組成,每種病毒顆粒中只含有一種核酸,或為DNA或為RNA,兩者一般不共存于同一病毒顆粒中。組成病毒基因組的DNA和RNA可以是單鏈的,也可以是雙鏈的,可以是閉環分子,也可以是線性分子。如乳頭瘤病毒是一種閉環的雙鏈DNA病毒,而腺病毒的基因組則是線性的雙鏈DNA,脊髓灰質炎病毒是一種單鏈的RNA病毒,而呼腸孤病毒的基因組是雙鏈的RNA分子。一般說來,大多數DNA病毒的基因組雙鏈DNA分子,而大多數RNA病毒的基因組是單鏈RNA分子。
3.多數RNA病毒的基因組是由連續的核糖核酸鏈組成,但也有些病毒的基因組RNA由不連續的幾條核酸鏈組成如流感病毒的基因組RNA分子是節段性的,由八條RNA分子構成,每條RNA分子都含有編碼蛋白質分子的信息;而呼腸孤病毒的基因組由雙鏈的節段性的RNA分子構成,共有10個雙鏈RNA片段,同樣每段RNA分子都編碼一種蛋白質。還沒有發現有節段性的DNA分子構成的病毒基因組。
4.基因重疊即同一段DNA片段能夠編碼兩種甚至三種蛋白質分子,這種現象在其它的生物細胞中僅見于線粒體和質粒DNA,所以也可以認為是病毒基因組的結構特點。這種結構使較小的基因組能夠攜帶較多的遺傳信息。重疊基因是1977年Sanger在研究ΦX174時發現的。ΦX174是一種單鏈DNA病毒,宿主為大腸桿菌,因此,又是噬菌體。它感染大腸桿菌后共合成11個蛋白質分子,總分子量為25萬左右,相當于6078個核苷酸所容納的信息量。而該病毒DNA本身只有5375個核苷酸,最多能編碼總分子量為20萬的蛋白質分子,Sanger在弄清ΦX174的11個基因中有些是重疊的之前,這樣一個矛盾長時間無法解決。重疊基因有以下幾種情況:
(1)一個基因完全在另一個基因里面。如基因A和B是兩個不同基因,而B包含在基因A內。同樣,基因E在基因D內。
(2)部分重疊。如基因K和基因A及C的一部分基因重疊。
(3)兩個基因只有一個堿基重疊。如基因D的終止密碼子的最后一個堿基是J基因起始密碼子的第一個堿基(如TAATG)。這些重疊基因盡管它們的DNA大部分相同,但是由于將mRNA翻譯成蛋白質時的讀框不一樣,產生的蛋白質分子往往并不相同。有些重疊基因讀框相同,只是起始部位不同,如SV40DNA基因組中,編碼三個外殼蛋白VP1、VP2、VP3基因之間有122個堿基的重疊,但密碼子的讀框不一樣。而小t抗原完全在大T抗原基因里面,它們有共同的起始密碼子。
5.病毒基因組的大部分是用來編碼蛋白質的,只有非常小的一份不被翻譯,這與真核細胞DNA的冗余現象不同如在ΦX174中不翻譯的部份只占217/5375,G4DNA中占282/5577,都不到5%。不翻譯的DNA順序通常是基因表達的控制序列。如ΦX174的H基因和A基因之間的序列(3906-3973),共67個堿基,包括RNA聚合酶結合位,轉錄的終止信號及核糖體結合位點等基因表達的控制區。乳頭瘤病毒是一類感染人和動物的病毒,基因組約8.0Kb,其中不翻譯的部份約為1.0kb,該區同樣也是其他基因表達的調控區.
6.病毒基因組DNA序列中功能上相關的蛋白質的基因或rRNA的基因往往叢集在基因組的一個或幾個特定的部位,形成一個功能單位或轉錄單元。它們可被一起轉錄成為含有多個mRNA的分子,稱為多順反子mRNA(polycistroniemRNA),然后再加工成各種蛋白質的模板mRNA。如腺病毒晚期基因編碼病毒的12種外殼蛋白,在晚期基因轉錄時是在一個啟動子的作用下生成多順反子mRNA,然后再加工成各種mRNA,編碼病毒的各種外殼蛋白,它們在功能上都是相關的;ΦX174基因組中的D-E-J-F-G-H基因也轉錄在同一mRNA中,然后再翻譯成各種蛋白質,其中J、F、G及H都是編碼外殼蛋白的,D蛋白與病毒的裝配有關,E蛋白負責細菌的裂解,它們在功能上也是相關的。
7.除了反轉錄病毒以外,一切病毒基因組都是單倍體,每個基因在病毒顆粒中只出現一次。反轉錄病毒基因組有兩個拷貝。
8.噬菌體(細菌病毒)的基因是連續的;而真核細胞病毒的基因是不連續的,具有內含子,除了正鏈RNA病毒之外,真核細胞病毒的基因都是先轉錄成mRNA前體,再經加工才能切除內含子成為成熟的mRNA。更為有趣的是,有些真核病毒的內含子或其中的一部分,對某一個基因來說是內含子,而對另一個基因卻是外顯子。如SV40和多瘤病毒(polyomavirus)的早期基因就是這樣。SV40的早期基因即大T和小t抗原的基因都是從5146開始反時針方向進行,大T抗原基因到2676位終止,而小t抗原到4624位即終止了,但是,從4900到4555之間一段346bp的片段是大T抗原基因的內含子,而該內含子中從4900-4624之間的DNA序列則是小t抗原的編碼基因。同樣,在多瘤病毒中,大T抗原基因中的內含子則是中T和t抗原的編碼基因。