Nature Methods新方法能矯正RNA-seq測序的技術(shù)偏差
日期:2017-03-09 08:50:44
基因表達(dá)分析正越來越多地用于癌癥的診斷和檢測,是生物學(xué)研究的主要工具,一種新型的計(jì)算方法可以提高基因表達(dá)分析的準(zhǔn)確性。
來自卡耐基梅隆大學(xué)和紐約州立大學(xué)石溪分校的研究人員稱,他們的方法(被稱作Salmon)能夠矯正轉(zhuǎn)錄組測序技術(shù)(RNA-seq)中的技術(shù)偏差。而且這種技術(shù)預(yù)估基因表達(dá)水平的速度也與其它快速方法相當(dāng)。
他們的方法已發(fā)表于3月6日的Nature Methods雜志,并且Salmon的資源代碼已經(jīng)被成千上萬的用戶免費(fèi)下載。
來自卡耐基梅隆大學(xué)計(jì)算生物學(xué)系的助理教授Carl Kingsford說,Salmon為RNA-seq實(shí)驗(yàn)及其可能存在的偏差提供了更豐富的計(jì)算模型。為這種技術(shù)越來越多的應(yīng)用于疾病和其壓型的分類、了解發(fā)育過程中的基因表達(dá)變化、以及跟蹤癌癥的進(jìn)程等提供了重要的保障。
盡管生物體基因的構(gòu)成是靜態(tài)的,但是個體基因的活動是隨著時間的推移而變化的,這使得基因表達(dá)成為理解生物體工作方式,以及疾病過程中發(fā)生了什么,的重要指標(biāo)。基因的活性雖然不能被直接測量,但可以通過監(jiān)視RNA來進(jìn)行推斷。
RNA-seq是目前捕捉基因活性的領(lǐng)先技術(shù)。但是,根據(jù)由于不同組織、不同制備方法、不同實(shí)驗(yàn)誤差,導(dǎo)致RNA-seq的讀數(shù)也會比實(shí)際偏高或偏低。
雖然我們知道會存在許多偏差,但是在對它們建模時還是會發(fā)生樣品循序的偏差。為此,倘若你準(zhǔn)備用傳統(tǒng)的方法建立一個更復(fù)雜的偏差模型,那將是非常耗時的。
Salmon結(jié)合了一個新的雙相位并行推理算法、功能豐富的偏差模型,以及超快速讀取映射程序。這是第一個能正確測量GC片段偏差的,全轉(zhuǎn)錄組水平測量技術(shù),能大幅度提高豐度估值的準(zhǔn)確性以及差異表達(dá)分析的靈敏度。
Salmon算法得名于一種擅長逆流而上的魚——鮭魚。當(dāng)實(shí)驗(yàn)數(shù)據(jù)“流過”時,該種算法可以直接估計(jì)出偏差的影響和基因表達(dá)水平。因此,它可以像其他快速分析工具一樣,迅速而準(zhǔn)確地得知基因表達(dá)水平。