戈爾德曼等人的編碼比丘奇等人的編碼更進了一步,他們把數字內容的二進製碼(0,1)改成三進製碼(0,1,2);然後用這種三進製碼來對應DNA的4個堿基(A、T、C、G),從而將三進製碼編寫成一個DNA序列。一般情況下,每500個堿基的序列可能會出現一個錯誤。為了防止出錯和漏掉內容,研究人員以每25個堿基向後錯位的方式把這個DNA序列切割成若幹個含100個堿基的等長片段,這就能使整個序列的所有內容都獲得4個副本,例如,1、2、3、4;2、3、4、1;3、4、1、2;4、1、2、3。
當數字內容編寫進DNA後,再用專門設備合成為DNA《莎士比亞詩集》。在讀取或閱讀DNA《莎士比亞詩集》時,先把合成的DNA《莎士比亞詩集》放入標準化學試劑,然後用DNA測序儀根據索引標識,將各個DNA片段依順序粘貼成原來的DNA序列,再轉譯到數字文件的二進製碼,從而形成電子文件,就可閱讀了。
合成的DNA《莎士比亞詩集》隻有砂粒般大小,靜靜地躺在試管的底部,連戈爾德曼還是經同事指點才發現了這本DNA《莎士比亞詩集》。在閱讀時,研究人員用DNA測序儀把DNA《莎士比亞詩集》中的信息還原為數字文件,結果它與原始數字文件的內容百分之百重合。這種從DNA程序到數字程序百分之百的重合靠的是巧妙的設計。
在閱讀DNA《莎士比亞詩集》時,研究人員發現有兩個25個堿基對的序列不見了。缺了它們,這本DNA《莎士比亞詩集》的內容要麼不全,要麼會出現偏差,甚至難以讀出。不過,由於在設計時就考慮到這一點,拷貝了4個副本,利用這4個副本完全還原了漏掉的數字文件的內容。而且,戈爾德曼等人也發現了堿基對丟失的原因,在未來隻要修改一下程序,就不會發生類似丟失內容的問題。
DNA《莎士比亞詩集》的誕生也獲得了丘奇等人的好評,他認為,戈爾德曼等人的研究讓“我們終於有了一個真實的領域”。而且,類似DNA《莎士比亞詩集》的圖書非常穩定,更容易保存,隻需放在冷、暗、幹燥處,沒有恒溫恒濕的苛刻要求。同時,DNA《莎士比亞詩集》的編撰使用的設備和方法都是生物學研究的常規工具,這可以讓DNA圖書的存儲有效避開因設備技術更新換代而產生的許多麻煩,儲存和閱讀也更方便。
不過,與丘奇等人製作的DNA《再生》圖書一樣,DNA《莎士比亞詩集》同樣有費時費力和成本高昂的弱點。數碼信息編入DNA目前隻能由專門的DNA合成設備來做,而從DNA中讀取信息並還原為數碼文件,也很費時。戈爾德曼等人用了整整兩個星期才完成DNA《莎士比亞詩集》中5個文件739千字節的還原。
另外,戈爾德曼等人製作DNA《莎士比亞詩集》的存儲費是,每一兆(MB,10的6次方)字節的錢是12400美元,並且在閱讀時還要測序解讀,需要再花220美元。這是常規磁盤儲存費用的100多萬倍。
同時,DNA《莎士比亞詩集》與DNA《再生》一樣,編撰後就不能修改。這與數字文件的常規存儲(硬盤和U盤)的便捷差了十萬八千裏。現在,人們隻需花幾十元或上百元人民幣買一個16GB儲存量的U盤,插入電腦,就能反複使用,包括下載文件、寫文章、聽音樂、看錄像、做計算等。
由於不能重複使用、昂貴和讀取時間長,DNA圖書目前顯然還不可能像數字圖書一樣被人們廣泛使用,因此,其市場化也需要時日。不過,當有一天,研究人員通過新的技術攻克了DNA圖書這些弱點之後,DNA圖書也將走進人們的生活。那時,DNA圖書將成為比數字圖書更先進更實用的圖書。
【責任編輯】張田勘