Nature子刊:?jiǎn)畏肿訙y(cè)序揭示鸚鵡模仿能力
日期:2012-07-04 08:00:23
研究團(tuán)隊(duì)通過(guò)單分子測(cè)序揭示了鸚鵡基因組的特殊區(qū)域,并采用第二代測(cè)序技術(shù)對(duì)單分子測(cè)序數(shù)據(jù)進(jìn)行了修正。文章發(fā)表在7月1日Nature Biotechnology雜志網(wǎng)站上。
如今單分子測(cè)序技術(shù)炙手可熱,這一新技術(shù)能生成超長(zhǎng)的測(cè)序讀段,“能更容易拼裝基因組的復(fù)雜部分,”文章的共同作者Duke大學(xué)神經(jīng)學(xué)生物學(xué)家Erich Jarvis說(shuō)。Jarvis感興趣的是調(diào)控鸚鵡模仿能力的基因序列,因?yàn)檫@些序列能為神經(jīng)學(xué)科學(xué)家提供人類語(yǔ)言能力相關(guān)調(diào)控基因的信息。
Jarvis及其同事最初采用第二代測(cè)序來(lái)裝配鸚鵡的基因組區(qū)域,第二代測(cè)序技術(shù)能一次讀取100到400bp,需要數(shù)天來(lái)裝配基因組構(gòu)架圖。然而,科學(xué)家測(cè)序后發(fā)現(xiàn)得到的讀長(zhǎng)不足以裝配出鳴聲學(xué)習(xí)基因的某些調(diào)控區(qū)域。盡管研究人員嘗試了修改算法,仍無(wú)法解決這一問(wèn)題。
去年羅氏454和Pacific Biosciences單分子測(cè)序技術(shù)的讀長(zhǎng)都達(dá)到了1000bp。而Pacbio的技術(shù)能一次生成2,250 到23,000bp的數(shù)據(jù),能在約一天內(nèi)裝配整個(gè)基因組。
Jarvis及其同事采用了PacBio RS儀器來(lái)解決他們基因組測(cè)序遇到的難題。通過(guò)Assemblathon競(jìng)爭(zhēng),科學(xué)家發(fā)現(xiàn)Pacbio儀器在讀取虎皮鸚鵡(Melopsittacus undulates)基因組時(shí),難以精確解碼某些復(fù)雜區(qū)域,儀器的錯(cuò)誤率較高。Jarvis說(shuō),這種錯(cuò)誤率幾乎使他們難以用這些超長(zhǎng)讀段進(jìn)行基因組裝配。
單分子測(cè)序儀器能生成超長(zhǎng)序列,極大的改善基因組和轉(zhuǎn)錄組的裝配。不過(guò),目前單分子測(cè)序讀取的錯(cuò)誤率較高,從而限制了其應(yīng)用(如細(xì)菌重測(cè)序應(yīng)用)。而第二代測(cè)序產(chǎn)生的讀段雖然短,但精確性更高。
研究人員引入了一種修正算法和裝配策略,應(yīng)用第二代測(cè)序產(chǎn)生的短高保真序列對(duì)單分子測(cè)序進(jìn)行了修正。他們成功將單分子測(cè)序(或稱為第三代測(cè)序)儀的錯(cuò)誤率從15%減少到了小于0.1%。由此,科學(xué)家終于裝配出了鸚鵡鳴聲學(xué)習(xí)行相關(guān)基因的調(diào)控區(qū)域(如FoxP2基因和egr1基因)。
這一研究成果能幫助神經(jīng)學(xué)科學(xué)家能更好的了解鳥(niǎo)類模仿和鳴唱的遺傳學(xué)機(jī)制。同時(shí)也能為科學(xué)家提供有關(guān)人類交流和語(yǔ)言學(xué)習(xí)能力的遺傳信息。
研究人員還對(duì)PacBio RS儀器生成的多種噬菌體、原核生物和真核生物的測(cè)序數(shù)據(jù)進(jìn)行了修正,驗(yàn)證了該方法的可靠性。Jarvis認(rèn)為科學(xué)家能夠通過(guò)使用混合性測(cè)序方法,解碼癌細(xì)胞發(fā)育相關(guān)的復(fù)雜基因和控制大腦功能的復(fù)雜基因序列。