正文 從數字圖書到DNA圖書(2 / 3)

DNA圖書編撰的原理是,把需要編撰的內容先轉化為數字信息(電子文件),然後把數字信息按DNA的堿基順序編碼並合成,讀取時再用DNA測序儀按編碼規則將DNA圖書轉換解讀為數字文件,就能在電腦上閱讀和使用了。

根據這個原理,研究人員編撰了DNA圖書《再生》後,再利用DNA測序儀來閱讀這本書,內容可以成功地讀出,這證明DNA能夠被用來長期儲存數字信息,也即可以用DNA來生產圖書。這種新圖書所儲存的信息量是DNA原來儲存的生物遺傳信息量的1000多倍。也就是說,DNA圖書不僅比傳統的紙質圖書儲存的信息要多得多,也比DNA本身儲存的遺傳信息要多很多。

DNA圖書的具體製作是,首先將《再生》這本書的文字內容和圖片轉化為HTML格式的文件,然後將這些文件編譯為由0和1組成的大小為5.27兆比特的二進製序列。然後再用DNA的一個核苷酸(一個堿基)對應一個比特,把這個5.27兆比特的二進製序列按照順序分配到多個96比特長的核苷酸片段中。

研究人員用的是短DNA序列而不是長DNA序列來編碼數據,因為這可以降低寫入和讀取數據的困難和成本。在DNA上編碼數據也相似於把數據儲存到硬盤上,隻不過在硬盤中數據是被寫入被稱作扇區的小硬盤塊中。

用於編碼和儲存信息的DNA不過是一滴DNA液滴,當《再生》的全部信息(數據)和其他信息被編碼到DNA之中後,DNA液滴被放置到微陣列芯片上儲存。這些芯片在4攝氏度下保存3個月,然後溶解它們並測序,以便降低儲存信息時的錯誤。每個核苷酸片段的每個拷貝被測序高達3000次,利用這種方式可以把這個5.27兆比特內容的書籍中的錯誤降低到隻有12個。也即是說,存儲在DNA中的內容能被準確無誤地讀取出來。

《再生》這本DNA圖書的優勢在於,它能長期存儲信息,它的內容至少在1000年時間內也能夠被讀出。而且,由於DNA能儲存更多信息,理論上計算,1克DNA即能儲存上千億個千兆字節,相當於1000億張DVD光盤的內存。全世界一年的數碼信息總量約為1.8ZB信息,可以被存儲在約4克的DNA中(ZB是信息量單位,等於10的21次方,常見的GB是10的9次方)。紙質和磁盤存儲信息是平麵的,但DNA能折疊變化,即可以立體存儲信息,存儲密度非常高。當然,DNA圖書也容易保存,因為DNA在室溫下就非常穩定。

但是,《再生》這種DNA圖書也有明顯的缺點。一是製作時存儲數據過程比較緩慢。二是合成和測序DNA的技術非常昂貴,即把文字和圖片等信息按計算機的二進製原理與DNA的4個堿基對應編碼時,比較昂貴。相應地,對DNA圖書的讀取也比較緩慢,這也可能限製它成為一種普通的圖書讓人們在生活中簡單而方便地閱讀。當然,這種DNA圖書還有一個缺點,隻能讀出信息和數據,不能改寫數據。

改進的DNA圖書——《莎士比亞詩集》

在《再生》問世後一年,另一本DNA圖書《莎士比亞詩集》也誕生了。這本DNA圖書是由歐洲生物信息研究所(EBI)的尼克·戈爾德曼等人編撰而成。該書編入了莎士比亞所有的154首十四行詩、一篇沃森和克裏克DNA雙螺旋論文的副本(沃森和克裏克因此而獲1962年的諾貝爾生理學或醫學獎)、一張戈爾德曼等人所在研究機構EBI大樓的彩色照片,一段這次試驗使用的軟件算法,還有一段26秒來自馬丁·路德·金著名演講《我有一個夢想》的剪輯音頻,信息總量約739千字節。

顯然,這本DNA《莎士比亞詩集》的內容更豐富,而且包含了一個音頻文件,也更符合數字圖書的標準。與《再生》相比,DNA《莎士比亞詩集》的編撰更優化、更完善、操作性更強,也更實用。