又一篇技術突破論文,Nature Methods公布最大人類蛋白互作網絡
日期:2016-11-30 09:58:50
一個國際研究小組公布了迄今為止最大的蛋白互作數據庫資源,這將有助于解析眾多疾病相關的基因如何促發疾病發生和進程的。這項研究由麻省總醫院MGH和Broad研究院領銜完成,相關數據庫: InWeb_InBioMap (InWeb_IM) 在線公布在11月28日Nature Methods雜志上。
“現代遺傳學技術能幫助我們對癌癥或者精神疾病患者的基因組進行常規測序,但是科學家們依然不是很了解受到疾病相關遺傳突變影響的細胞系統,”文章作者之一,Broad研究院項目負責人之一Kasper Lage博士說,如果有更完整的人體蛋白物理相互作用圖譜,將能幫助我們探索細胞進程,更高分辨分析疾病的影響。
雖然繪制大規模蛋白互作網絡的重要性已經是共識了,但是大部分近期的實驗針對的都是少于30,000個直接相互作用,從最保守的估計來說,這只代表了四分之一的相互作用總數。
Lage研究組與丹麥,英國的科學家們合作,研發了一個計算機框架,能從超過43,000篇公布的論文中抓取數據,這包括了8個已有蛋白互作數據庫。研究人員利用這些數據創建了 InWeb_IM, InWeb_IM目前已經達到了625,500個相互作用(2015年論文投遞時相互作用數量為586,000)。
文章第一作者,Lage實驗室李泰伯(Taibo Li,音譯)說,“就像人類社會一樣,蛋白也喜歡在團隊中完成功能,通過蛋白網絡與其它蛋白相互作用。如果將這種蛋白相互作用比喻成人類社會網,比如通過Facebook就能了解與他人互動的模式,那么構建蛋白相互作用網絡就能了解基因簇群和分子途徑,促進我們對人體細胞的了解。”
基因組測序成本迅速下降,已遠遠快過了我們對各種基因突變的理解,在蛋白水平和疾病基因水平上探討相互作用網絡,可以幫助臨床醫師們了解遺傳數據的模式,理解癌癥或者自閉癥論文中的生澀概念。比如說,大約有30個基因參與了心肌病,但許多患者并沒有出現這些基因的突變,如果能看看這30個基因表達的蛋白之間的相互作用模式,那么就能發現基于“心肌病網絡”的新候選基因,從而對這種疾病產生新的理解。 InWeb_IM 就是這樣作為臨床解釋的一種重要資源,未來將會應用到更多的領域。
下一步,研究組還將利用 InWeb_IM 來解釋大規模的基因組數據,利用蛋白質組學分析組織特異性復雜生物系統等等, InWeb_IM 將維持每個季度的更新,大家可以在這里看到相關的數據: http://www.lagelab.org/resources/ 或 http://www.intomics.com/inbiomap