現代的程序語言都是由英文字母編寫,堿基序列更像漢字中的偏旁部首,腺嘌呤、鳥嘌呤、胞嘧啶、腺嘧啶、胸腺嘧啶五種不同堿基按一定規則反複排列,就形成了一個個功能不同的基因。
不同的基因不僅是遺傳編碼,還是包含細胞製造對應蛋白質的原始模具,按照這個模具就可以找到一個個不同功能的氨基酸,將氨基酸拚接成肽鏈,肽鏈拚接到一起就組成了功能不同,種類繁多的蛋白質,這些不同功能的蛋白質就是組成地球生物的最主要材料。
基因就是按照一定規則編碼的堿基序列組合,基因的長度可以有很大的變化,最小的由幾十個堿基對組成,最大的可以包含超過二百萬堿基對。
人類基因的平均長度約為兩萬七千個堿基對,短的幾百,長的過百萬。
細菌的基因相對的都比較短,平均隻有一千個堿基對,當然也會有少數很長的基因。
基因中的堿基序列通常分為兩大部分,編碼區和非編碼區。
編碼區的長度從幾十個堿基對到幾千個堿基對不等,主要作用就是定義組成蛋白質的氨基酸序列,就是蛋白質生產的模板。
非編碼區包含的就是基因中編碼區以外的部分,包括多種功能調控元件,如啟動子、增強子、沉默子、終止子、內含子等等,這些元件在基因表達的調控中起著關鍵作用。
高級生物的基因序列很長,主要原因就是多細胞生物體組織結構複雜,非編碼區需要編寫複雜的功能組件,設定基因表達的各種條件,在需要的時刻啟動編碼中的蛋白質製造。
細菌隻有一個細胞,組織結構簡單,主要依靠強大的繁殖能力和龐大的群體適應性生存,因此基因非編碼區都比較簡單。
人類這樣的高級動物漫長的進化曆史中,很多過去有用的基因功能因為不適應當時的環境都沉默了,但是遺傳物質中仍然傳承著過去的那些堿基序列,兩萬五千多基因中,當前能識別出來的隻有兩萬左右,三億多堿基對中有大量都是無效的堿基。
曾凡的目標是改造出一種特殊的菌群,可以在血液中生存,進入心髒後自動駐留,靠群體功能檢測心髒的缺陷或者畸形部位,進入心肌細胞內部,自動釋放相應催化酶,催化缺陷部位的心肌細胞定向增殖發育,增生部位的細胞自動收縮或者啟動凋亡程序,達到治療的目的。
這種細菌自身的結構不需要太複雜,體積也不需要太大,但是遺傳物質中要包含這些心肌細胞催化酶的基因,還要有能檢測心髒缺陷的基因,這些基因都要有複雜的非編碼功能區,曾凡想要實現的檢測和治療的目的要靠這些精確調控完成。
單一的訂製細菌很難完成這麼複雜的任務,曾凡采用的同樣是分布式方案,整個菌群分工協作來完成任務,即便個別細菌損失或者失敗,也不影響任務整體進度。
按照一個軟件需求來定義功能,曾凡有了這段時間治療上百例先天心髒病的經驗,實現這部分功能的編碼並不難,真正難的是把堿基對按照他設定的順序重新排列。
在電腦輸入代碼耗費的隻是時間,他敲鍵盤的速度和準確率應該已經達到了人類最高水平,可是在納米尺度靠感應能力重排基因堿基序列,這個難度對於第一次幹這活的人來說,那是相當大的考驗。
基因雙螺旋的直徑隻有兩納米,一個完整的螺旋周期的包含十對堿基,在雙螺旋上麵的高度才不到四納米,平均每對堿基隻有不足零點四納米的高度。
以曾凡當前的感應能力,這些堿基對就是他感應的極限了,和普通人肉眼識別切碎的頭發差不多。
感應能力的優點就是不需要動手,隻要能識別出來,就能靠意識進行操控,可以同時操控成百上千堿基對按照自己的意圖重組排列。
曾凡設計出近百個不同功能的基因,堿基對數量一百五十多萬,就算有這樣快捷的方法,把堿基對完全排列出來,也需要四五個個小時的時間。