Sci Rep:PRC2與lncRNA相互作用的序列特異性新發現
日期:2017-02-14 09:04:04
國際學術期刊《科學報告》(Scientific Reports)近期在線發表了中國科學院-馬普學會計算生物學伙伴研究所邵振研究組關于PRC2與長非編碼RNA(lncRNA)之間相互作用的序列特異性研究成果。
由多梳(PcG)家族蛋白組成的表觀調控復合物PRC2是控制動物組織發育的重要因子,但在高等動物中PRC2如何被特異性招募到染色質特定區域的分子機制還不清楚。隨著XIST與HOTAIR等PRC2結合lncRNA的發現,人們猜測此類lncRNA可能決定了PRC2染色質招募的特異性(Margueron et al. Nature 2011)。但是,直到現在PRC2與RNA結合是否具有序列特異性仍被廣泛爭論(Davidovich et al. Mol Cell 2015)。
邵振研究組首先開發了一個基于馬爾可夫鏈思想的序列組成分析流程,通過計算不同核苷酸間轉移在每條序列中出現的頻率來刻畫其組成,進而選擇被特定序列所顯著偏好或不偏好的核苷酸間轉移作為它們的序列組成特征,并通過將所有可能的轉移映射到一個完整四叉樹來研究所選序列特征在特征空間中的分布是否具有非平凡性。通過將該流程應用于人基因組中已知的數百個PRC2結合lncRNA,該研究系統分析了這些lncRNA的序列特征,發現其偏好的序列特征傾向在四叉樹上組成連續偏好路徑,并且這些連續路徑上的序列特征傾向于同時被人和小鼠基因組中的PRC2結合lncRNA所偏好。
受此啟發,該研究整合小鼠胚胎干細胞中兩組已發表的RIP-seq和CLIP-seq數據,定義了一組高可信度的小鼠PRC2結合lncRNA,發現這些lncRNA能夠被人基因組中已知PRC2結合lncRNA所具有的序列特征較好地預測。這些研究發現表明高等動物中PRC2與lncRNA結合具有序列特異性,并且其特異性具有較高的跨物種保守性。此外,該研究還通過發展一個局域打分模型,發現PRC2結合lncRNA的序列特征在lncRNA上的分布表現出明顯的非隨機性。進一步研究發現,每個lncRNA上PRC2與lncRNA結合所偏好序列特征最富集的小片段(定義為PRC2偏好片段),相對lncRNA其它部分具有顯著更高的進化保守性和RIP-seq信號強度(如圖),說明這些序列特征的局域富集具有明確的功能意義。
該項研究在研究員邵振指導下,由計算生物學研究所博士研究生涂世奇完成,并得到了中科院和上海市科委的經費支持,以及美國哈佛醫學院教授袁國丞的指導和協助。
下一篇: Nature子刊文章破解免疫細胞分化之謎