隨著高通量測序技術的發展,轉錄組測序(RNA-seq)已成為系統研究基因轉錄及轉錄后水平調控狀態的常規方法,并在多個物種中得到廣泛應用。海量轉錄組數據以前所未有的速度產生,以數據驅動為導向的大規模數據整合、挖掘與解析面臨挑戰。為更充分展現轉錄組數據蘊含的豐富信息,服務生物醫學基礎研究領域需求,構建標準化數據分析流程和結構化元信息審編模型,建立面向多物種基因轉錄特征的數據集成與管理資源十分必要。
近日,中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數據中心在Nucleic Acids Research上,發表了題為Gene Expression Nebulas (GEN): a comprehensive data portal integrating transcriptomic profiles across multiple species at both bulk and single-cell levels的論文,建立了基于常規轉錄組測序(Bulk RNA-seq)和單細胞轉錄組測序(scRNA-seq)數據挖掘解析的多物種轉錄圖譜整合型數據庫——Gene Expression Nebulas(GEN)。GEN應用結構化審編模型和標準化數據處理流程,對組織和細胞水平轉錄組測序數據集進行統一分析,實現了多物種多層面轉錄調控水平信息的系統整合。目前,GEN整合了323個高質量轉錄組數據集,涵蓋30個物種的50,500個樣本和15,540,169個細胞,提供基準參考、遺傳、表型、環境、時間、空間六類生物學場景下的轉錄圖譜,為生物醫學領域科研人員剖析基因遺傳調控結構和功能機制提供基礎資源。
基于嚴格的數據質控標準,GEN審編來自GSA、GEO、ENA和DRA數據庫的高質量原始轉錄組測序數據和詳細元數據信息,并利用自主搭建的標準化流程分析處理相應數據,為用戶提供包括基因/轉錄本表達、環形RNA表達、RNA選擇性剪接和RNA編輯四個層面的轉錄圖譜。同時,GEN為30個物種的1,191,846個基因提供豐富的注釋信息,包括基本注釋(如基因組位置、生物類型、功能描述),以及基于基因表達數據的定量(不同實驗條件下的表達水平)和定性(差異表達所處的生物學場景)的增值注釋。此外,為方便下游個性化分析,GEN還為用戶提供表達譜數據分析及可視化的在線及離線工具,包括基于Bulk RNA-seq表達譜的差異表達分析、加權基因共表達網絡分析、功能富集分析和基因調控網絡推斷,以及基于scRNA-seq表達譜的質量控制、數據標準化、縮放和回歸、降維、基于圖的聚類、細胞簇標記基因識別、細胞標記、細胞軌跡推斷和細胞類型注釋等多項分析功能。
GEN對用戶免費開放,具備友好的瀏覽、檢索與可視化功能,方便用戶探索多生物學場景下基因/轉錄本的表達及轉錄特征。研究團隊將持續維護并定期更新GEN,以不斷整合更多物種的轉錄圖譜數據資源和集成更豐富的數據分析功能。
研究工作得到中科院戰略性先導科技專項、國家重點研發計劃、中科院青年創新促進會等的資助。
論文鏈接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab878/6378435
GEN數據庫內容和功能模塊概覽
《自然·神經科學》23日發表的一項神經科學研究顯示,使用腦深部電刺激(DBS)繪制功能失調的腦環路圖譜,將有助于改進特定神經疾病的療法。研究結果有助于引領人們認識導致這類疾病的腦環路,從而推動發現進一......
通過分析基因組中數百萬個微小的遺傳差異,就可預測一個人一生中患某種疾病的幾率。在過去的10年中,研究人員為數十種疾病制定了風險評分,希望有一天患者能利用這些信息來降低患病風險。在《自然·醫學》雜志最新......
記國家自然科學基金重大研究計劃“基因信息傳遞過程中非編碼RNA的調控作用機制”在人類遺傳信息傳遞過程中,非編碼RNA不參與編碼蛋白質,占全部RNA的98%,如同宇宙中神秘的“暗物質”,是生命活動調控的......
近日,中國農業科學院深圳農業基因組研究所聯合國內多家單位發布了迄今為止最大的水稻群體水平倒位變異圖譜,并挖掘獲得了新的水稻耐熱優異等位基因,該研究對水稻育種改良具有重要意義。相關研究成果發表在《科學通......
近日,中國農業科學院深圳農業基因組研究所聯合國內多家單位發布了迄今為止最大的水稻群體水平倒位變異圖譜,并挖掘獲得了新的水稻耐熱優異等位基因,該研究對水稻育種改良具有重要意義。相關研究成果發表在《科學通......
近日,中國農業科學院深圳農業基因組研究所動物功能基因組學創新團隊研發出增強子鑒定新技術。該技術與傳統技術相比,平均分辨率提高了約10倍,為基因組的精確注釋提供了新方法。相關研究成果發表在《核酸研究》(......
財庫〔2023〕35號黨中央有關部門,國務院各部委、各直屬機構,全國人大常委會辦公廳,全國政協辦公廳,最高人民法院,最高人民檢察院,各民主黨派中央,有關人民團體,各省、自治區、直轄市、計劃單列市財政廳......
關于印發《一體式計算機政府采購需求標準(2023年版)》的通知財庫〔2023〕31號黨中央有關部門,國務院各部委、各直屬機構,全國人大常委會辦公廳,全國政協辦公廳,最高人民法院,最高人民檢察院,各民主......
美國食品藥品監督管理局(FDA)本月稍早時間宣布,批準CRISPR/Cas9基因編輯療法Casgevy上市,用于治療12歲及以上鐮狀細胞貧血病患者。這是FDA批準的首款CRISPR基因編輯療法。而11......
導讀:這項技術可以及早發現那些可能對患兒生命產生重大影響的罕見疾病。 瑞孚迪的這項首創研究證明了全基因組測序在對看似健康的新生兒的篩查中存在重......