Nature子刊:分子數據透露疾病的關聯
日期:2013-12-17 09:07:51
醫學數據庫(如Disease Ontology)能夠幫助臨床醫生們,在病理學分析和臨床癥狀的基礎上,對疾病進行分類?,F在,為了改進疾病的分類法,科學家們將疾病與分子數據結合起來,發現了14個新的疾病關聯。
Ljubljana大學、倫敦帝國理工和GSK的研究人員,在Nature旗下的Scientific Reports雜志上發表了這項研究。
“我們希望在生物學機制的基礎上,將疾病關聯起來,”Blaz Zupan教授說。“我們相信這一新的疾病分類途徑,更為準確也更貼合治療,可以幫助人們更好的理解疾病的臨床表現和生物學機制。”
這項研究中用于分類的分子數據集,不僅龐大而且非常多樣化。為了處理這些數據,研究人員采用了同步矩陣分解,以便分析11個大型數據源中的四個不同對象:藥物、基因、Disease Ontology條目、和Gene Ontology條目。
據Zupan介紹,研究團隊面臨的主要挑戰是,找到能整合多個數據源的方法。為此,文章的第一作者Marinka Zitnik開發了DFMF(Data Fusion by Matrix Factorization)算法,這種算法可以同時在多個資源中挖掘數據。他們利用這一算法,在三個星期內發現了14個新的疾病關聯。
“這一算法的最大優勢在于,將多個矩陣融合在一起,例如在這項研究中,它整合了11個不同的數據矩陣,”Zupan說。“這些矩陣之間存在共享的對象,例如基因和疾病。我們的同步矩陣分解實現了大規模的數據融合。”
基因組研究者往往需要分析和整合大量的數據源,這一技術也能為此提供幫助“一般科學家們最多分析兩三個數據集,而這一技術可以同時處理十到二十個數據集,”Zupan說。“目前,高通量技術為人們提供了海量的數據,我們的技術可以幫助人們對這樣的數據進行處理。”
目前,研究人員正準備為上述技術開發網站界面,以幫助其他研究者解決問題。
上一篇: Science顛覆40年認知,揭示遺傳密碼的雙重含義
下一篇: Cell子刊:基因沉默的新分子工具箱