闡明DNA暗物質的新工具
日期:2016-04-06 09:28:54
基因組序列通過DNA的四種字母表存儲著生物體發展的全部信息。基因攜帶著形成蛋白質的指令,蛋白是我們身體的基石。然而,基因只占全基因組序列的很小一部分——約占人體全基因組序列的2%,其余一度被視為“垃圾”,主要是因為它的功能仍然是未知的——稱其為“暗物質”可能更為恰當,但是基因組的這部分正逐漸引起科學家的注意。
DNA的非編碼部分不是無用的,它包含稱為調節區或增強子的區域,這些區域決定著每個基因表達的時間和位置。這種調節保證了每個基因都只在恰當的細胞類型和組織中才具有活性。如果基因調控失敗,細胞表達錯誤的基因并且獲得了不合適的功能,就可能導致像癌癥類的疾病。
盡管基因調節區具有重要性,但是,科學家們在廣闊的基因組中去研究基因調節區受到了一定的限制。他們識別調節區主要依賴于間接的方式,這種方法有錯誤傾向,而且需要繁瑣的實驗來確認和量化增強子的活性。
最近,美國Gladstone研究所的科學家們,發明了一種閱讀和理解人類基因組的新方法。這種計算方法被稱為TargetFinder,可以預測非編碼DNA——不編碼蛋白質的DNA,在哪里與基因相互作用。這項技術可以幫助研究人員將所謂的基因組“暗物質”中的突變,與它們影響的基因聯系起來,并可能為遺傳疾病治療揭示新的靶標。
這項研究發表在最近的《Nature Genetics》雜志,研究人員觀察了稱為增強子(enhancers)的非編碼DNA片段。增強子就像一個基因的說明書,決定著何時何地打開一個基因。基因可以通過長片段的DNA——包含許多其他基因,與它們的增強子分離。
本文資深作者、Gladstone研究所的高級研究員Katherine Pollard指出:“大多數與疾病相關的基因突變,發生在增強子中,因此,它們成為一個非常重要的研究領域。現在,我們難以理解的是,增強子是如何找到它們起作用的、距離較遠的基因。”
科學家們最初認為,增強子主要影響與它們最近的基因。然而,這項新的研究表明,在一條DNA鏈上,增強子可以遠離受它們影響的基因數百萬個字母,從而跳過了中間的基因。當一個增強子遠離受其影響的基因時,這兩者通過形成一個三維環連接在一起,就像給基因組打上一個蝴蝶結。
使用機器學習技術,研究人員分析了現有的、來自六種不同細胞類型的數百個數據集,以在基因組中尋找可確定基因和增強子在何處相互作用的模式。他們發現,在連接增強子和基因的環上,存在一些模式。這種模式可在85%的時間里準確預測“基因和增強子是否會發生相互作用”。
本文第一作者、Gladstone生物統計學家Sean Whalen博士指出:“值得注意的是,我們可以根據相對簡單的數據,預測復雜的三維相互作用。之前沒有人研究三維環上儲存的信息,我們驚奇地發現,這些信息非常的重要。”
在實驗室做實驗以確定所有這些基因-增強子相互作用,可能要花費數百萬美元和多年的研究時間。這種新的計算方法,是識別基因組中基因-增強子關系的一種更便宜、耗時更少的方法。這項技術還對“DNA循環是如何形成的,以及它們在疾病中可能如何被打斷的”提供了深刻見解??茖W家們提供了來自TargetFinder的所有代碼和數據(免費在線)。
Pollard說:“我們預測增強子的基因靶標的能力,是如此準確,因此,我們能夠將增強子中的突變與它們靶定的基因聯系起來。了解這些聯系,是使用這些聯系來治療疾病的第一步。”
除了基因組“暗物質”,科學家們還發現了生命體中的其他暗物質,盤點如下。
蛋白質組的暗物質
科學家一直都在推測蛋白質暗物質的性質,即蛋白質中完全未知的領域,但去年澳大利亞聯邦科學與工業研究組織(CSIRO)開展的一項研究,定位了這些暗物質區域的界限,使得我們更進一步發現所有蛋白質的完整結構和功能。這項研究工作發表在《PNAS》雜志。
病毒暗物質
近年來,科學家們在微生物組研究中已經取得了較大的進展?,F在,賓夕法尼亞大學的研究人員又將目光轉向了病毒組研究。他們發表在mBio雜志上的研究顯示,健康人類皮膚上的絕大多數DNA病毒是前所未見的,屬于病毒“暗物質”。
微生物暗物質
據科學家估計,生活在人體內的細菌中有大約一半,因無法在實驗室中培養,而幾乎不為人所知,也因此科學家稱其為“微生物暗物質”。2014年12月,加州大學洛杉磯分校等處的科學家們取得的一項里程碑式結果,闡述了TM7在牙周炎等疾病進展中的作用。
2013年7月,美國科學家進行了微生物“暗物質”研究,他們用單細胞DNA測序技術對多種微生物的基因組進行測序后發現,微生物遠比我們所知道的要豐富多樣,研究同時揭示了不同物種間令人驚奇的關聯。
下一篇: 單細胞分析解釋印記相關疾病