3.親緣關係

分析植物藥物的生物活性成分的穩定性受自身生物學條件限製,而不同的產地、不同的氣候季節及不同的營養元素來源對生物的生理及遺傳物質結構有潛在的或已表現出的影響。

另一方麵,不同的種類可含有相同的藥理成分,探索這類生理依賴性產物的生物學背景是回答問題的關鍵步驟之一。因此,在藥用植物種類與功能區別鑒定的進一步研究中,深入生物遺傳學、生理學本質的生物大分子檢測分析及基於此而進行的生物信息學研究的介入將會產生極有意義的影響。不同的藥用植物品種之間的差異,可以最終理解為核酸序列的差異、核酸序列表達的差異、蛋白質序列的差異及蛋白質結構的差異。親緣關係分析是研究核酸序列與蛋白質序列的係統發育問題。

分子生物學的發展,使親緣關係分析能集中在更反映生物學本質的核酸序列與蛋白質序列水平上,分析這些分子的演化。在具體分析時,經常會選擇某段在核內的核酸序列、質體內的核酸序列、線粒體內的核酸序列,進行多個生物種類的相關序列的同源性分析,查明這些種類的親緣關係及變化程度,根據此類數據構建進化樹。生物種屬和功能之間的差異,並不一定是單個基因間的差異,而可能的差異在於基因組如何安排編碼區和非編碼區。完整的基因組序列的比較研究是解決問題的重要途徑。在16個全基因組中的70個核蛋白的數據顯示,不同的進化關係會有這些基因的不同排序方式;家鼠的染色體數目與絕大部分已知基因都與人類相同,但這些基因在各染色體上的分布在兩物種間就截然不同,如分布在家鼠第1號染色體的基因分布在人第1、2、5、6、8、13和18號染色體上,分布在家鼠第2號染色體的基因分布在人第2、7、9、10、11、15和20號染色體上,等等;種屬與功能差異的重要特征除了編碼區和非編碼區的排序外,還有編碼區和非編碼區序列重複數目的不同,如有文獻報道脊椎動物的HOX基因(一組重要的發育基因)比非脊椎動物多三倍,人、細菌、線蟲和擬南芥的重複序列在基因組中的比例分別為45%、11%、7%和3%。同樣,在藥用植物品種與功能研究中,比較基因組學的成果將會帶來幫助。

另外,在占全基因組很大份額的基因間的區域的DNA,即所謂的“垃圾”DNA,是目前基因組學研究中的一大難點,一旦此難題有所突破,可能是帶出藥用植物品種與功能研究的新方向。單核苷酸多態性(single nucleotide polymorphisms,SNP)是DNA差異的最普遍形式。SNP主要指由基因組核苷酸水平上的變異引起的DNA序列多態性,包括單堿基的轉換、顛換、插入和缺失。人類SNP位點研究比較成熟,而藥用植物的SNP庫目前較小。私營公司與國立機構都在開發基因組SNP,SNP的檢測技術已相當成熟,從凝膠電泳分析到DNA芯片、TaqMAN方法等,不斷有新的快捷、便宜的方法出現,使檢出的SNP越來越多。SNP作為一種新的遺傳學研究工具,尋找藥用植物與活性物質有關的及對環境因子敏感的DNA變異位點,將對整個藥用植物種質資源研究及應用帶來較大的影響。

4.蛋白質結構預測

藥用植物的各項生理活動及多種分類性狀都直接或間接與蛋白質相關,蛋白質行使功能與其當時所處的結構狀況有密切聯係,因此,如何獲得蛋白質的結構是蛋白質研究的重要課題。據分析,目前及往後相當長的一段時間內,測定蛋白質結構的實驗手段仍主要依靠X射線晶體衍射與核磁共振方法。兩種方法需要培養蛋白質晶體或隻能測相對分子質量小於2萬的蛋白質結構,並且測定周期較長,遠跟不上核酸序列的測定速度;而蛋白質結構預測是幾乎伴隨第一個蛋白質晶體結構的測定與解析同步發展起來的,目前成為生物信息學及基因組學研究一個非常活躍的領域。由於二級結構是理解三維結構的基礎之一,大量的蛋白質結構預測論文涉及這項內容。

眾學者提出的二級結構預測方法大致可分為以下幾類:立體化學方法、殘基統計法、模式識別法和同源比對綜合法。蛋白質三維結構預測指依靠氨基酸序列來確定蛋白質的空間結構,這是蛋白質結構預測的最終目標。而二級結構的預測準確率最高也不過80%,無疑三維結構受的限製就更大。蛋白質三維結構預測大致分作四類:由一級結構直接預測、二級結構組裝、同源預測、結構類識別。雖然二級結構、三級結構的預測目前都遇到不同程度的困難,但這些方法在迅速發展的實驗技術、日益完善的理論推動下,一步一步地改進,在不少領域中,這些預測結果已符合人們的要求。現代實驗技術廣泛應用於測定藥用植物有關成分,測定蛋白質結構的技術設備不斷更新換代,測定蛋白質所投入的資金也不斷增加,但在未真正有達到要求的儀器方法出現以前,蛋白質結構預測仍值得介入藥用植物研究中去。

5.生物芯片技術

藥用植物的深入研究將不可避免地要利用生物芯片,因為生物芯片帶來的生物信息蘊藏著生物學結構與功能的內在聯係。它出現不到十年,就已引起來源極為廣泛的人們的注意力聚焦於其飛速的發展進程上,相信不久後檢測植物藥用價值及鑒定品種的不少反應可在芯片上完成。植物基因的定量是植物性狀的物質基礎,同時也是植物對不同環境的反應之一。應用生物芯片檢測植物基因的定量表達可同樣用於藥用植物不同環境因子下其種質的差異分析。cDNA微陣列芯片研究擬南芥菜(Arabidopsis thaliana)有關基因的定量表達時,先要檢測的cDNA用PCR擴增、點樣到芯片上製成cDNA芯片,再用總mRNA反轉錄產生擬南芥菜cDNA,再雜交於芯片上,洗滌、掃描;結果顯示,擬南芥菜用病原真菌Alternaria brassicicola、水楊酸、茉莉酮酸甲酯(methyl jasmonate)或乙烯的處理後,在2375個選定的基因中,有705個基因與對照組存在基因表達差異。生物芯片也可應用於遺傳育種時,通過探針與目標DNA序列雜交而鑒定出優良品種。為篩選出燕麥(Avena sativa)與玉米(Zea mays)的特定雜交品種,用玉米DNA中的特異序列作為探針,可以在一群混雜的雜交後代中有選擇地挑出含目標玉米DNA序列的後代。在有確定的目標核酸序列時,藥用植物優良品種的篩選也可將大部分工作用生物芯片來實現。