Nature子刊:如何利用癌癥研究數據
日期:2014-11-04 08:48:51
故事的一開始很簡單:Nate Silver(著名統計學家) 和Richard Feynman(著名物理學家)走進一家酒吧,撞上了一位生物學家……
雖然接下來要講述的可能有些書呆氣,令人覺得煩悶,但是在現代生物學領域,已經出現了越來越多這樣的故事,多學科多領域的研究人員聚在一起,頭碰頭在海量的基因組數據中尋找意義。
然而即使如此,當我們面對正在以驚人的速度增多的癌癥突變數據時,依然令我們頭皮發麻,無從下手,現在的挑戰就是找到一種有效的方法,能從多種噪音背景中發現信號。
近期一組研究人員迎難而上,聚合多學科的力量,尤其是統計物理學以及人工智能,開發出了一種將癌癥突變數據轉變成多維模型的新方法,這種多維模型能展現出特殊的突變對細胞中蛋白社會性網絡產生的影響。從中研究人員就能推斷出癌細胞中的無數突變在致病過程中的實際功能。
“我們聚焦于統計力學中的一個基本概念,這個概念我們在本科的理論物理課程中就學過,但是之后由于其不適用于我們的日常生活,因此就被遺忘了。但是作為生物學家,這一概念能幫助我們解決癌癥遺傳學中最困難的一個問題,”文章的通訊作者,哈佛醫學院系統藥理學教授Peter Sorger說。
這一研究成果公布在11月2日Nature Genetics雜志上。
目前許多被廣泛研究的癌基因,如p53、Ras等都是多個研究組通過多年的努力而發現的,但是時至今日,我們進入了高通量基因組學時代,可以從成千上萬的樣品中獲得數千倍更多的數據,因此累積至今的癌癥突變數據巨大。
但是并不是所有的突變都會影響腫瘤行為,實際上許多只不過搭搭順風車而已,這些突變被稱為“乘客突變(或偶發突變,passenger mutations)”。為了能將“司機突變,或主導突變”與偶發突變區分開來,研究人員常常會利用一種“輪詢polling”策略,識別最常見的突變,推理哪些是重要的。然后對最重要的候選突變進行詳盡細致的分析,像是p53,Ras此類的研究。
這篇文章的第一作者Mohammed AlQuraishi是一位具有遺傳學,統計學和物理學背景的研究學者,他意識到生物學能從統計學和物理學中受益良多,他開玩笑說:“這就像是Silver 和 Feynman 在一起工作。”
AlQuraishi利用他的平臺分析癌癥基因圖譜中數據,結果獲得了大量詳細的原理注釋圖,可以用來解釋某些突變能改變蛋白復雜大量的細胞內網絡,這一網絡在很大程度上覺得了細胞的健康狀態。
從中AlQuraishi發現常見和罕見的突變其實都會影響蛋白網絡。“這兩種突變同樣重要。在這兩種情況下,大約有 1%的常見突變和1%罕見突變改變腫瘤網絡。但罕見突變基本上被忽略,現在我們要多注意它們。”
出現每一個常見突變,就會有大約四個罕見突變,因此從數量上來說,罕見突變可能比之前我們所認為的更加重要,“我們一直認為大量的罕見突變是暗物質,但在這項研究中,我們發現這些暗物質發揮著作用。”
上一篇: 替代PCR,RPA在癌癥研究中的應用
下一篇: Nature子刊揭示蛋白質翻譯調控新機制