科學家成功將書本內容寫進DNA序列
日期:2012-08-20 08:36:51
據報道,哈佛大學的研究團隊將一本遺傳學課本的全部內容編碼進一小段DNA(脫氧核糖核酸)序列,確切來說,是將53400個單詞、11張圖片和一個Java程序共計527萬比特的數據存儲在了不到1皮克(10-12克)的DNA中。這項最新突破有可能徹底革新我們存儲數據的能力。
DNA是已知密度最高也最穩定的信息存儲介質。理論上而言,DNA的每個核苷酸可以編碼兩個比特,每克單鏈DNA的存儲容量可達455艾字節(1艾字節=10的18次方字節,1字節=8比特),大約相當于1000億張DVD光盤的容量,存儲密度幾乎是閃存等現有數字媒體的五六百倍。而且,存儲在DNA中的數據時隔幾千后年仍能夠被讀出。
此前曾有研究人員嘗試過將數據寫進活細胞的基因組內,但這種方法存在很多問題:首先,一旦細胞死亡,存儲的內容將會丟失;其次,細胞會分裂復制,在這一過程中可能會產生新的變異,從而更改存儲數據。此外,利用DNA長序列讀取和寫入數據存在一定難度,而且成本很高,這使得利用DNA進行大規模數據存儲不太現實。
為了解決這些問題,哈佛醫學院合成生物學家喬治·丘吉爾帶領的研究團隊不使用細胞,而是用噴墨打印機將化學合成的DNA短片段嵌入到一個微小的玻璃芯片表面。他們將一本由丘吉爾參與編寫的遺傳學課本轉換成“0”和“1”的比特形式,并用DNA的4個堿基中的A或C來編碼 “0”,G或T來編碼“1”,從而將課本內容寫入了DNA中。這個DNA芯片采用了類似于計算機硬盤分區的方式,將課本內容分散為數據塊來存儲。
讀取這些數據則需要一個DNA測序儀和一臺計算機。由于每個DNA片段中都包含著一個數字“條形碼”,記錄了其在原始文件中的位置,因此所有的片段可被重新組裝,并轉換成數字格式。電腦還能幫助糾錯:每個數據塊都被復制了數千次,通過與其他副本相比較,任何一個小錯誤都可以被識別并修復。
研究人員將課本內容存入DNA,然后又重新轉化為數字形式讀出,結果顯示,這個存儲系統的底層讀取錯誤率為每百萬比特只有兩個錯誤,可與DVD比肩,遠遠優于磁性硬盤驅動器。不過,由于數據編碼是與DNA合成同步完成的,因此這種方式不支持可擦寫數據存儲,但適用于長期歸檔存儲。
研究人員表示,因受操作成本、速度(此次花了大約幾天時間)和測序儀大小的制約,將DNA作為一種通用的數據存儲介質目前還不切實際,但這一領域正在快速發展,未來5年到10年內有望開發出比傳統數字存儲設備更快、更小、更便宜的DNA存儲技術。