1.
GenBank屬于一個序列數據庫的國際合作組織,包括EMBL和DDBJ。是NIH遺傳序列數據庫,一個所有可以公開獲得的DNA序列的注釋過的收集。GenBank同日本和歐洲分子生物學實驗室的DNA數據庫共同構成了國際核酸序列數據庫合作。唯一人類基因序列集合(UniGene),人類基因組基因圖譜,分類學瀏覽器,同國立癌癥研究所合作的癌癥基因組剖析計劃(CGAP)等數據庫。GenBank以指數形式增長,核酸堿基數目大概每14個月就翻一個倍。
2. 紀錄樣本 - 關于GenBank的各個字段的詳細描述,以及同Entrez搜索字段的交叉索引。
3.
訪問GenBank - 通過Entrez Nucleotides來查詢。用accession
number,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術語來查詢。關于Entrez更多的信息請看下文。用BLAST來在GenBank和其他數據庫中進行序列相似搜索。用E-mail來訪問Entrez和BLAST可以通過Query和BLAST服務器。另外一種選擇是可以用FTP下載整個的GenBank和更新數據。
4. 增長統計 - 參見公布通知的2.2.6(每個分類的統計),2.2.7(每個物種的統計),2.2.8(GenBank增長)小節。
5. 公布通知,最新 - 最近和即將有的變化,GenBank的分類,數據增長統計,GenBank的引用。
6. 公布通知,舊 - 同上相同,是過去公布的統計。
7. 遺傳密碼 - 15個遺傳密碼的概要。用來確保GenBank中紀錄的編碼序列被正確的翻譯。
向GenBank提交數據 :
1. 關于提交序列數據,收到accession number,和對紀錄作更新的一般信息。
2. BankIt - 用于一條或者少數條提交的基于WWW的提交工具軟件。(請在提交前用VecScreen去除載體)
3.
Sequin -
提交軟件程序,用于一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交。可以獨立使用,或者用基于TCP/IP的“network
aware”模式,可以鏈接到其他NCBI的資源和軟件比如Entrez和PowerBLAST。(請在提交前用VecScreen去除載體)
4. ESTs - 表達序列標簽,短的、單次(測序)閱讀的cDNA序列。也包括來自于差異顯示和RACE實驗的cDNA序列。
5. GSSs - 基因組調查序列,短的、單次(測序)閱讀的cDNA序列,exon trap獲得的序列,cosmid/BAC/YAC末端,及其他。
6. HTGs - 來自于大規模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。(注意:完成的人類的HTG序列可以同時在GenBank和Human Genome Sequencing頁面上訪問。)
7. STSs - 序列標簽位點。短的在基因組上可以被唯一操作的序列,用于產生作圖位點。
8. 注:SNPs - 人類的和其他物種的遺傳變異數據可以提交到NCBI數據庫的單核苷酸多態性庫中(dbSNP)。
國際核苷酸序列數據庫合作組織 :
1.
GenBank,DDBJ,EMBL - 合作計劃的概述,并鏈接到相應的主頁。GenBank,DDBJ(DNA Data Bank of
Japan),and EMBL (European Molecular Biology
Laboratory)數據庫共享的數據是每天都交換的,因此他們是相等的。數據紀錄的格式和搜索方式可能會不一樣,但是accession
number,序列數據和注解都是一模一樣的。即,你可以用accession number
U12345在GenBank,DDBJ或EMBL中查找相應紀錄,得到的結果是完全一樣的序列數據,參考內容等等。?
2. DDBJ/EMBJ/GenBank特性表 — 特性表格式和標準被合作數據庫用在序列記錄的注釋上,使得數據共享成為可能,包括詳細的描述生物特性和特性限定語的附錄,以及IUPAC規定的核苷酸和氨基酸的代號。?