基因組測序可靠嗎?
日期:2012-02-07 08:33:19
2003年科學家們對外公布完成了人類基因組的測序之后,就一直處于一種自我陶醉之中。然而一個根本性的問題卻遭到了忽視:我們如何能確定個體基因組的讀取是否正確?
十年前,人類首次全面開展了個體基因組的測序,在這項研究中揭示出了全球70億人的大量遺傳變異。然而至此后,對于個體精確測序的質疑就一直困擾著研究者們。
測序公司預測他們有能力將基因組測序成本從幾年前的2.5萬美金降至1000美金,并致力開發出“個體化”醫療,這在當前市場上正日漸顯示出重要的意義。測序成本的降低依賴于更新的技術,設想科學家們能夠繼續使用標準鳥槍法(shotgun approach),將基因組隨機處理成大小不同的片段,然后再將這些片段連接起來。尤其是,通過將 DNA處理成更小的片段,有利于快速廉價地讀取大量片段,從而達到降低成本的目的。然而其中一個問題是現在人們并不是很清楚如何評估最新裝配算法和基本鳥槍法的準確性,尤其是早期的基因組數據的準確性還不確定。
確定個體基因組測序準確性的特殊挑戰在于使人體的表型(或性狀)與他/她的基因型(或遺傳結構)相匹配。在首次完成人類基因組測序后不久曾有人預測將很快開發出個體化的醫療,然而由于此障礙的存在,直到現在這一目標也尚未實現。
在近期《PLOS One》雜志的一篇文章中,來自紐約大學庫朗研究所的研究人員對當前采用的一些個體基因組測序方法進行了評估。
紐約大學的研究人員根據一些基因學家和生物信息學家開發的一種稱為AMOS的開源軟件搜集的特征,檢測了這些程序的可行性。研究人員假設,如果一種方法能夠實現對個體全基因組的準確測序,那么該方法創建的組件就應該能夠“組合到一起”,并與其他的輔助數據,例如"mate pairs," "optical maps," 或“strobed sequences”相一致,共同組成基因組的廣泛信息。
文章的資深作者、計算機科學與數學系教授Bud Mishra說:“利用當前的大部分技術,在組裝基因組的過程中,當遇到基因組中多個位點重復出現相同的序列串,就會產生幾種類型的錯誤。隨機輸入讀值傾向于在此類位置采集,在它們之間顯示出了更高的差異性。”
“這些錯誤有可能產生嚴重的后果,尤其是技術被應用到分析腫瘤基因組時,其往往具有高度異質性,每個腫瘤細胞基因組中均存在于其他細胞不同的重排和突變,”Mishra說。