填補(bǔ)全基因組關(guān)聯(lián)研究空白的新算法
日期:2015-08-11 08:52:35
最近,來自芝加哥大學(xué)的科學(xué)家開發(fā)出一種新的計(jì)算方法,可使我們檢測(cè)引發(fā)復(fù)雜疾病和生物性狀的基因的能力提高。這種方法稱為PrediXcan,可估算全基因組的基因表達(dá)水平——比單基因突變更好的一個(gè)生物作用測(cè)度,并將其與全基因組關(guān)聯(lián)研究(GWAS)數(shù)據(jù)結(jié)合起來。與傳統(tǒng)方法相比,PrediXcan能夠更快、更準(zhǔn)確地鑒定靶基因。相關(guān)研究結(jié)果發(fā)表在八月十日的《自然遺傳學(xué)》(Nature Genetics)。
本研究是由芝加哥大學(xué)遺傳醫(yī)學(xué)研究助理Hae Kyung Im帶領(lǐng)的,她指出:“PrediXcan通過了解基因型、基因表達(dá)水平(來自大規(guī)模轉(zhuǎn)錄組研究)和疾病關(guān)聯(lián)(來自GWAS研究)之間的聯(lián)系,告訴我們哪些基因更容易影響疾病或性狀。這是解釋基因調(diào)控機(jī)制的第一種方法,并可以應(yīng)用于任何遺傳疾病或表型。”
全基因組關(guān)聯(lián)研究(GWASs)是一種重要的工具,可檢測(cè)復(fù)雜疾病相關(guān)的基因,如糖尿病和癌癥,或者身高和肥胖這樣的特征。GWASs通過識(shí)別單字母的DNA變異(更頻繁地出現(xiàn)在患有疾病或具有目標(biāo)性狀的個(gè)體中),來確定這些關(guān)聯(lián)。然而,還需要重要的后續(xù)工作,來了解這些變體的作用機(jī)制。大多數(shù)疾病相關(guān)的變異不能改變一個(gè)基因的功能,而是改變細(xì)胞中復(fù)制的基因的數(shù)量。這些研究無法確定,歸因于基因調(diào)控(一種遺傳變異,反而可能會(huì)改變真正致病基因的表達(dá)水平)這樣的因素的一種因果關(guān)系,通過全基因組關(guān)聯(lián)研究仍然也未能發(fā)現(xiàn)。延伸閱讀:全基因組關(guān)聯(lián)研究誤導(dǎo)心律失常風(fēng)險(xiǎn)基因 。
轉(zhuǎn)錄組研究,如美國(guó)國(guó)家衛(wèi)生研究院的Genotype-Tissue Expression (GTEx),旨在通過研究基因表達(dá)和調(diào)控機(jī)制及其與疾病的關(guān)系,來克服這一局限,而不僅僅是通過DNA序列。但轉(zhuǎn)錄組的研究也有很大的局限性,例如,不能確定反向因果關(guān)系——基因的表達(dá)水平是否被疾病所改變,或者疾病的產(chǎn)生是由于基因表達(dá)的改變。
為了開發(fā)一種方法,檢測(cè)基因和性狀之間的關(guān)系,并避免這些問題,Im和她的同事將轉(zhuǎn)錄組數(shù)據(jù)和GWAS數(shù)據(jù)整合到一個(gè)單一的計(jì)算框架中,他們稱之為PrediXcan。該方法使用計(jì)算算法,基于大規(guī)模轉(zhuǎn)錄組數(shù)據(jù)集(如GTEx),來了解“基因組序列如何影響基因表達(dá)”。然后,可以用其對(duì)任何全基因組序列或芯片數(shù)據(jù)集,進(jìn)行基因表達(dá)水平的估算。
已被測(cè)序、作為GWAS一部分的基因組,可以通過PrediXcan運(yùn)行,以生成一種基因表達(dá)水平譜,然后對(duì)其進(jìn)行分析,以確定基因表達(dá)水平與疾病狀態(tài)或目標(biāo)特征之間的相關(guān)性。
該方法不僅可以識(shí)別潛在的致病基因,還可以決定方向性——高或低水平的表達(dá)是否可能導(dǎo)致疾病或性狀。由于該計(jì)算方法是以序列數(shù)據(jù)為基礎(chǔ),而不是物理測(cè)量,因此,它可以將基因表達(dá)的遺傳決定組件(避免反向因果關(guān)系)和性狀本身的影響(避免反向因果關(guān)系)及其他因素(如環(huán)境)區(qū)分開來。用PrediXcan,驗(yàn)證研究只需要至多測(cè)試幾千個(gè)基因,而不是數(shù)以百萬計(jì)個(gè)潛在的單基因突變。此外,該方法可用于再分析現(xiàn)有的基因組數(shù)據(jù),以高通量的方式重點(diǎn)解決機(jī)制,從而填補(bǔ)GWAS研究的一大空白。
Im說:“這將我們了解的基因轉(zhuǎn)錄中的遺傳變異結(jié)果整合起來,來尋找基因,而不只是研究突變。在某種程度上,我們正在確定基因影響疾病或性狀的一種機(jī)制,這是基因表達(dá)水平的調(diào)控。”
雖然PrediXcan可以一種高通量的方式,確定基因和性狀之間的聯(lián)系,但是Im指出,因?yàn)樗腔诨蚪M序列數(shù)據(jù)產(chǎn)生估算,因此它對(duì)強(qiáng)烈的遺傳性狀是最準(zhǔn)確的。然而,幾乎所有的復(fù)雜性狀或疾病都有遺傳成分。該方法可被用來預(yù)測(cè)這些成分的影響,從而減少后續(xù)研究的復(fù)雜性。
Im現(xiàn)在正在努力提高PrediXcan的預(yù)測(cè)能力,并將其應(yīng)用于精神疾病。此外,她正努力擴(kuò)大其基因的表達(dá)水平,以預(yù)測(cè)疾病或性狀和蛋白水平、表觀遺傳學(xué)等測(cè)量(可基于基因組數(shù)據(jù)進(jìn)行估計(jì))之間的關(guān)系。
Im說:“GWAS研究一直都極為成功地用于發(fā)現(xiàn)疾病相關(guān)的遺傳關(guān)聯(lián),但它們無法解釋背后的機(jī)制。我們現(xiàn)在有一種計(jì)算方法,可以讓我們了解GWAS研究的結(jié)果。”