Nuleic Acids Res:三維基因組數據的動態染色質可接近性模型
日期:2017-02-24 11:07:42
來自北京大學生命科學學院、生命科學聯合中心、統計科學中心李程研究組使用基于Hi-C數據的染色質區域間的相對空間距離,利用布朗運動描述轉錄因子和染色質修飾蛋白在不同染色質區域之間的動態轉移過程,并以此建立了染色質區域附近分子濃度變化和趨于穩定的馬爾可夫模型。并指出干細胞分化過程中的一個重要因素是時空特異地調控染色質的空間組織和結構,從而促進細胞階段和類型特異性的基因得以表達。這一研究成果公布在《Nucleic Acids Research》雜志上。
真核細胞的染色質在細胞核中折疊成復雜的三維結構,但這些結構的形成和功能還沒有被完全理解。近年來,以Hi-C為代表的染色質構象捕獲技術揭示了較精細的染色質三維結構單元,如A、B間隔(A/B Compartments)和拓撲結構域(Topologically Associated Domains , TADs),它們在不同細胞類型、物種內都有保守性,是定量化地理解染色質三維結構形成和功能的關鍵性進展。三維基因組與基因表達調控具有密切的關聯,例如,一個TAD內的基因往往被共同調控,但一個TAD內的的增強子由于被TAD邊界阻隔,不會調控另一個TAD內的基因。在疾病形成和干細胞分化過程中,表達調控、表觀遺傳的變化經常伴隨著三維基因組的結構變化。
在此項研究中,李程研究組使用基于Hi-C數據的染色質區域間的相對空間距離,利用布朗運動描述轉錄因子和染色質修飾蛋白在不同染色質區域之間的動態轉移過程,并以此建立了染色質區域附近分子濃度變化和趨于穩定的馬爾可夫模型。模型由此推導出的平衡態分布(Steady-State Distribution, SSD)表征了分子在染色質區域之間由于隨機運動達到的動態平衡的濃度,是領域內首次基于三維基因組信息的動態染色質可接近性的度量。SSD不同于直觀空間結構意義上的緊密程度,因為緊密或松散的染色質區域上都有可能出現高SSD值。
李程研究組進一步發現,相比傳統的測量染色質可接近性的實驗方法如DNase-seq和FAIRE-seq,SSD與表征染色質活躍程度的多個組蛋白修飾、以及基因表達有更強的相關性,證明了SSD作為動態可接近性度量的優勢。SSD模型說明染色質修飾蛋白和轉錄因子的分布遵循由染色質三維結構決定的動態平衡狀態,其濃度則進一步影響局部基因轉錄表達的水平。此研究還發現SSD可以幫助揭示干細胞分化過程中染色質結構變化的兩個階段。在胚胎干細胞經過神經元前體細胞階段、向神經元細胞分化的過程中,與染色質結構組織相關的基因所在區間的SSD(動態可接近性)首先升高,幫助這些基因的表達,進而促進更多神經元細胞特異基因所在區間的SSD的升高和相應基因的表達。這說明干細胞分化過程中的一個重要因素是時空特異地調控染色質的空間組織和結構,從而促進細胞階段和類型特異性的基因得以表達。
該研究得到北大-清華生命科學聯合中心、科技部國家重點研發計劃、國家自然科學基金重點項目的資助。李程研究員為該論文的通訊作者,生命科學中心13級博士生王軼楠為該論文第一作者,生科院14級本科生范操琦是論文第二作者,生命科學中心16級博士生鄭宇軒參與了部分工作。