RNA-seq vs.芯片,你應該如何選擇?
日期:2017-03-09 08:51:01
自二十世紀九十年代中期以來,芯片就一直是基因組表達分析的中堅力量。在這一技術最輝煌的時期,準備研究基因表達模式的人都會想到使用芯片。不過隨著測序成本的直線下降,RNA測序(RNA-seq)成為了越來越受歡迎的轉錄組分析方法。
DNA芯片上排列著大量的核酸探針,可以代表生物的整個基因組或部分基因組,比如外顯子、miRNA、單核苷酸多態性SNP等等。用芯片分析基因表達需要抽提RNA,將其反轉錄為cDNA,然后進行熒光標記。芯片上各點的信號強弱,代表了該探針目的基因的表達量。
RNA-seq主要是將RNA轉化為cDNA文庫,然后進行直接測序。雖然處理原始數據比較麻煩,但RNA-seq能夠做得到芯片做不到的事。RNA-seq可以揭示未知的轉錄本、基因融合和遺傳多態性,而芯片只能檢出明確的已知目標。在測序深度足夠的情況下,RNA-seq在高豐度和低豐度轉錄本檢測中都比芯片有效。
不過由于芯片可以快速分析大量樣本,該技術在這方面還將繼續占據統治地位,FDA國家毒理學研究中心的Weida Tong指出。不過,科學研究最終將完全轉向RNA-seq,Tong說。在此之前,芯片和RNA-seq數據應當更加兼容,RNA-seq數據的分析和儲存必須進一步簡化。“這就像是臨產前的陣痛期,”Tong說。“一旦完成這個痛苦的過程,大家就能真正享受到技術帶來的福利。”
The Scientist雜志與多位專家共同探討了從芯片到RNA-seq的過渡,希望幫助研究者們順利度過這段艱難的轉型期,最終實現華麗轉身。
通向全新世界
芯片分析依賴于已知的基因組信息,這也是該技術的最大局限。顯然,在探索性研究和非模式生物研究中,RNA-seq才是真正的大贏家。RNA-seq的轉錄組分析是無偏好的,可以揭示新剪接點、小RNA以及芯片漏掉的新基因。
“與芯片探針不同,RNA測序不需要預先知道序列信息,”安捷倫科技公司的Kevin Poon說,“因此它是一個理想的研發平臺,能夠獲得轉錄本序列并在此基礎上發現突變和融合轉錄本。”
改用RNA-seq的研究者們往往是“看到了芯片無法檢出的生物學信息,”賽默飛世爾公司的Anup Parikh指出。舉例來說,南佛羅里達大學(USF)Christina Richards實驗室的研究生Mariano Alvarez正在研究2010墨西哥灣漏油事件對當地植物的影響。他們最初是用芯片在評估基因表達,但現在他們已經引入了RNA測序數據,以獲得更為豐富的信息。
沒有底線的檢測
芯片檢測的動態范圍比較窄,在轉錄本豐度很低的情況下,RNA-seq才是你正確的選擇。Tong及其同事去年用Illumina RNA-seq平臺和Affymetrix芯片,評估了大鼠肝臟在藥物處理下的基因表達改變。他們發現,在檢測豐度較高的基因時,RNA-seq和芯片的結果基本一致。但在檢測表達水平低的基因時,RNA-seq更加準確。這一結論也得到了其他一些研究的支持。
造成這種差異的主要原因是,當基因低水平表達時,芯片中結合探針的cDNA發出較弱的熒光,難以壓倒背景熒光。對于RNA-seq而言,覆蓋度越高能檢測的轉錄本水平就越低,沒有絕對的下限。當然,RNA-seq也沒有絕對的檢測上限。而芯片在檢測表達量很高的基因時,可能會出現飽和。
生命力依然頑強
盡管RNA-seq有許多優勢,但許多研究者還是在繼續使用芯片,尤其是樣本量比較大的研究。芯片在臨床研究中也很吃香,因為它的數據處理又快又簡單。“芯片能提供高度一致的數據,分析軟件也相當成熟,”Poon說。“通過分析成百上千的樣本,基因和miRNA的表達特征已經被賦予了臨床上的診斷價值。”
“我會一直使用芯片,”MitoGenetics公司的Kirk Mantione說。“我知道要做些什么,結果也更容易解讀。”
Mantione使用芯片對自己開發的藥物進行評估,在細胞系和動物中分析這些藥物對基因表達的影響。芯片可以快速給出結果,展示藥物對特定基因的作用。不過Mantione也希望用RNA-seq研究那些還不成熟的生物模型,或者尋找之前沒有發現的轉錄本多態性。
有時候,人們繼續使用芯片只是因為想要對新數據和舊數據進行比較,如果所有的數據都是以同樣的方式獲得的,比較起來自然更為容易。
Affymetrix公司建議大家先用芯片快速篩查大量樣本,然后用這些結果指導RNA-seq。此外,芯片也可以用來驗證RNA-seq的數據。
RNA-seq數據分析
RNA-seq有非常廣泛的應用,但沒有哪個分析軟件是萬能的。科學家們一般會根據自己的研究對象和研究目標,采用不同的數據分析策略。現在人們已經發表了大量的RNA-seq和數據分析方案,對于剛入門的新手來說難免有些無所適從。
佛羅里達大學、加州大學Irvine分校等單位的研究人員在一月二十六日的Genome Biology雜志上發表文章,概述了RNA-seq生物信息學分析的現行標準和現有資源,為人們提供了一份帶有注釋的RNA-seq數據分析指南。這將成為開展RNA-seq研究的寶貴參考資料。
這份指南覆蓋了RNA-seq數據分析的所有主要步驟,比如質量控制、讀段比對、基因和轉錄本定量、差異性基因表達、功能分析、基因融合檢測、eQTL圖譜分析等等。研究人員繪制的RNA-seq分析通用路線圖(標準Illumina測序),將主要分析步驟分為前期分析、核心分析和高級分析三類。前期預處理包括實驗設計、測序設計和質量控制。核心分析包括轉錄組圖譜分析、差異基因表達和功能分析。高級分析包括可視化、其他RNA-seq技術和數據整合。
研究人員在文章中探討了每個步驟所面臨的挑戰,也評估了一些數據處理方法的潛力和局限。此外,他們還介紹了RNA-seq數據與其他數據類型的整合。這種數據整合可以將基因表達調控與分子生理學和功能基因組學關聯起來,如今越來越受到研究者的歡迎。