由於研究對象和研究目的的不同,目的基因可以來自原核細胞,也可以來自真核細胞。原核細胞基因組相對簡單,較易獲得目的基因;而真核細胞基因組龐大複雜,獲得目的基因相對較困難。獲得目的基因的方法很多,主要有人工化學合成法、逆轉錄製備cDNA、構建基因組文庫或構建cDNA文庫、PCR擴增基因等。本章主要講述通過構建基因組文庫或構建cDNA文庫克隆目的基因。
6.1基因組DNA文庫的構建
基因文庫(gene library 或gene bank)是指某一生物體全部或部分基因的集合。人們可以通過基因文庫的構建貯存和擴增特定生物基因組的全部或部分片段,同時又能夠在需要時從基因文庫中調出其中的任何DNA片段或目的基因。
基因文庫可分為基因組文庫和cDNA文庫。基因組文庫是指將某生物體的全部基因組DNA用限製性內切酶或機械力量切割成一定長度範圍的DNA片段,再與合適的載體在體外重組並轉化相應的宿主細胞獲得的所有陽性菌落。而cDNA文庫是將生物某一組織細胞中的總mRNA分離出來作為模板,在體外用反轉錄酶合成互補雙鏈的cDNA,然後連接到合適的載體上,轉入宿主細胞後形成的所有克隆。cDNA文庫反映了特定組織(或器官)在某種特定環境條件下基因的表達譜,對研究基因的表達、調控及基因間互作是非常有用的。而基因組文庫包含了基因的全部信息,如編碼區及非編碼區、內含子和外顯子、啟動子及其所包含的調控序列等。
構建基因文庫所使用的載體主要有λ噬菌體、黏粒、質粒和酵母人工染色體。根據構建基因組文庫所用的載體不同,可將基因組文庫分為質粒文庫、噬菌體文庫、黏粒文庫、人工染色體文庫等。利用λ噬菌體為載體構建的文庫形成的是在細菌培養平板上的一係列噬菌斑,每個噬菌斑含有特定DNA插入序列。利用黏粒和質粒為載體時,形成的是許多菌落,每個菌落包含一種插入有特定DNA序列的黏粒或質粒。酵母人工染色體是為構建高等真核生物基因文庫而設計的。
6.1.1基因組文庫的完備性
基因文庫完備性是指從基因文庫中篩選出含有某一目的基因的重組克隆的概率。從理論上講,如果生物體的染色體DNA片段被全部克隆,並且所有用於構建基因文庫的DNA片段均含有完整的基因,那麼這個基因文庫的完備性為100%。但在實際操作過程中,上述兩個前提條件往往不可能同時滿足,因此任何一個基因文庫的完備性隻能最大限度地趨近於100%,但不可能達到100%。盡可能高的完備性是基因文庫構建質量的一個重要指標,它與基因文庫中重組克隆數、重組子中DNA插入片段的長度以及生物單倍體基因組的大小等參數的關係可用Clarke‐Carbon 公式描述:
N=ln(1-P)/ln(1-f)
式中:N ——代表一個基因組文庫所應該包含的重組克降個數;
P ——表示所期望的目的基因在文庫中出現的概率;
f ——表示重組克隆平均插入片段的長度和基因組DNA總長的比值。
由上述公式可以看出,某一基因文庫所含有的重組克隆越多,其完備性就越高,當完備性一定時,載體的裝載量或允許克隆的DNA片段越大,所需的重組克隆越少。以大腸杆菌為例,其基因組大小約為4.6Mb,若P=99%,平均插入片段大小為20kb時,f=20kb/4600kb,則N=1057,即期望從一個平均插入片段為20kb 的大腸杆菌基因組文庫中篩選到任意一個感興趣的基因的概率達到99%,該基因組文庫至少應包含1057個重組克隆。人類基因組核苷酸總長度為3×109bp,如果以同樣要求來構建一個基因組文庫,則需要克隆數N =6.9×105。