RNA測序是遺傳學家工具箱中的一種常用工具。利用RNA測序,研究人員能夠定量地檢測各種生物體的基因表達,從而更好地了解細胞中正在發生的事情以及特定基因的功能。由于在藥物發現、疾病診斷和基因鑒定中具有潛在作用,RNA測序的應用似乎無極限。
RNA測序的準確性
早在2014年,《Nature Biotechnology》上發表了三篇文章。它們屬于RNA測序質量控制(SEQC)項目的一部分,旨在評估新一代測序平臺的性能以及RNA分析的優勢和局限。研究人員測試了三個常用RNA測序平臺的可靠性、準確性和信息內容,希望確定平臺的使用范圍并尋找變化的來源。
在整個研究過程中,三個研究機構都產生了超過10億個核苷酸的數據。他們還研究了30個不同的RNA測序實驗室所使用的技術以及數百名研究人員使用的生化方法。總的來說,他們認為RNA的提取和分析可以跨機構圓滿完成,即使樣本已嚴重降解,但是遺傳數據仍然可靠。
這些結果讓研究機構以及醫生患者放心,RNA測序是準確且可靠的。一項研究的負責人、梅奧診所的E. Aubrey Thompson評論道:“患者的護理決策似乎受到基因組數據的影響,而這些數據來源于患者樣本的RNA和DNA測序。如今我們知道了這些分析可在多大程度上依賴某個實驗室。”
生物實驗的重復性危機
如今,我們正處于所謂的重復性危機中,越來越多的研究變得難以重復,甚至不可能重復。據估計,單單就美國而言,每年花在無法重復的生物研究上的費用高達280億美元。除了經濟成本之外,不可重復的研究還造成藥物開發的延誤,阻礙疾病療法的開發。
在設計實驗和決定使用哪種技術時,重復性仍然是人們主要考慮的因素。可靠的方法通常是許多人的首-選,比如RNA測序。然而,以色列特拉維夫大學的研究人員開展的薈萃分析表明,RNA測序的數據分析過程中存在技術偏倚,可能造成數據的錯誤解釋和大量錯誤結果1。
RNA測序無法重復?
在分析了35個公開的RNA測序數據集之后,研究人員注意到某些基因反復呈現基因表達的變化。這些數據來自近年發表的人類和小鼠研究,覆蓋了多個生物過程。他們對此感到困惑,想了解這一現象背后究竟是真實的生物學現象,還是實驗過程引入的人為誤差。
在其中30個數據集中,研究人員發現特別長或特別短的基因往往表現出-明顯的基因表達水平變化。大多數短基因編碼了組成核糖體的蛋白質,而許多長基因則編碼了與細胞外基質有關的蛋白質。
經過進一步的研究,他們發現這種現象源于實驗的人為因素,而不是天然的生物反應。在比較相同條件下的重復樣本后,他們發現這種模式是由于技術偏倚,似乎與基因的長度有關。此外,若統計分析中存在缺陷,人們往往將檢測到的偏倚錯誤地標為細胞反應,特別是與核糖體或細胞外基質有關的反應。在許多常用的數據歸一化方法中,這種偏倚并未得到校正,因此可能已包含在許多數據集中。
這種效應被稱為樣本特異性長度效應(sample-specific length effect),之前已在文獻中提到過。許多研究人員已經意識到這一問題,但沒有積極地解決它。在此次分析的數據集中,未經校正的數據比例仍然很高。
不要低估統計分析的重要性
盡管乍一看讓人擔憂,但結果似乎也不是那么嚴重。在文中,研究人員還介紹了如何克服和消除這種偏倚,從而過濾掉錯誤的結果,保持生物學上的相關性。將基因長度視為樣本特異性的協變量,可以明顯減少假陽性結果的數量。
目前還不清楚哪些因素能夠淡化樣本特異性的長度效應,可能還需要進一步研究。作者建議研究人員在自己的研究中注意這種偏倚,并將建議的數據歸一化方法作為默認步驟,應用在RNA-seq數據分析的標準實踐中。
美國北卡羅來納大學教堂山分校的生物統計學家Michael Love表示:“這篇文章很好地證明了質量控制的重要性。”他指出,還有一些偏倚也會影響RNA測序數據的質量,比如GC含量偏倚,各個研究團隊在分析過程中應始終考慮這些因素。他本人并未參與此項研究。
這項研究強調稱,所有技術都不是100%可靠的,因為偏倚的可能性始終存在。隨著各個研究領域的重復性危機浮出水面并獲得關注,這項工作強化了準確開展統計分析的必要性。
美國格拉德斯通研究所團隊開發了兩種新的單分子分析工具,可將所需的DNA量減少90%至95%。該研究成果發表在最新一期《自然·遺傳學》雜志上,展示了這些工具如何幫助科學家解決他們以前無法回答的生物學問題......
近日,國家藥典委員會發布了《微生物全基因組測序技術指導原則》的第二次公示稿,以征求社會各界的意見和建議。公示期為一個月,從即日起至2024年7月1日結束。《微生物全基因組測序技術指導原則》旨在為藥品微......
華大智造近日公布了其2023年的財務報告,2023年的營業收入達到了29.11億元,較2022年的42.31億元降低了31.19%。營業總成本33.31億元,其中研發投入9.1億元,占總收入的31.2......
為便于供應商及時了解政府采購信息,根據《江蘇省財政廳關于做好政府采購意向公開工作的通知》等有關規定,現將南京醫科大學(本部)2024年5月(第1批)政府采購意向公告如下:編號項目名稱采購需求概況采購預......
冠狀動脈旁路移植術(CABG)又被稱為冠狀動脈搭橋術,是改善心臟自身血供的手術,可以有效治療冠心病導致的心肌缺血。該手術從患者身上取下一段健康的血管供體,一端與升主動脈相連,另一端與冠狀動脈堵塞部位的......
西安交通大學計算機科學與技術學院生物信息管理與數字健康研究團隊與南京世和基因生物技術股份有限公司合作,提出了一種基于推薦思想的數據特征與檢測策略動態適配的腫瘤突變檢測方法。該方法基于元學習框架,根據測......
阿爾茨海默病(AD)又稱老年癡呆,起病隱匿,病程緩慢且不可逆,以智能障礙為主。隨著人口老齡化的進展,全球AD患者數量逐年增加,嚴重危害中老年人的健康,也給家庭和社會帶來沉重的負擔。回望2023年,AD......
超高速測序推動基因組診斷快速發展簡化的DNA和RNA測序工作流正在幫助臨床醫生在幾天甚至幾小時內提供迅速的有針對性的護理 約十年前,澳大利亞墨爾本的默多克......
導讀:這項技術可以及早發現那些可能對患兒生命產生重大影響的罕見疾病。 瑞孚迪的這項首創研究證明了全基因組測序在對看似健康的新生兒的篩查中存在重......
2023年12月11日,中國深圳——12月9日,全球基因測序和芯片技術的領導者因美納攜手中國腫瘤液體活檢和基因大數據高新技術企業海普洛斯共同宣布,首臺NextSeq?2000Dx-CN-HAP國產基因......