遺傳力缺口處的碎片:需要時間去推敲的計算法則(1 / 2)

在身高的遺傳分析方麵,科研工作者已經能夠通過一項分數來解釋60%的遺傳力了,這項分數是由GWAS數據加總得來的。想想看,隻要用一個數字!29sup>隨著“元分析”(metaanalysis)(一種將多個樣本的結果整合起來的統計學手段)可用的樣本越來越多,也越來越大,這個數據也必然會上升。30sup>圖3.3基於單個研究的樣本量顯示了一些預測(大量研究使這個斜率稍微平坦了一點,但總體趨勢是相同的)。31sup>

若想將完整的加性遺傳力估計歸約為可以通過個體基因分型SNP芯片確定的單一分數,目前麵臨著重重障礙。而障礙之一就是,我們測得的SNP標記並不能完整地反映基因組中真正關鍵的SNP。32sup>遺傳力會因時間和地點而異的假設帶來了第二個障礙。在研究環境和人群相差巨大的情況下,如果僅僅去尋找共有的遺傳效應,那麼得到的結果可能不過是某個特定樣本中某個性狀的遺傳力的一部分罷了。

圖3.3 樣本量與某多基因分數能夠解釋的遺傳力比例的關係

資料來源:Daetwyler et al.(2008)

注:該分數衡量的是一個連續性狀,基於SNP計算得到的遺傳力為12%。由樣本量的PGS條件解釋的遺傳比例隨著遺傳力而上升(h2snp)。圖中Y軸(縱軸)代表著這個案例中的表型變異比例,最大值為12%;X軸(橫軸)描述了需要12%的預測值所需的樣本量,範圍是0~3000000。

暫時把這些問題放在一邊,概而言之:並沒有遺傳力缺失這一回事。它隱匿於人類種群中常見的各個個體中,我們隻是需要大量樣本來提高實驗的信噪比(signal-to-noi ratio)。這些大樣本如今可以通過網絡獲得。私營基因組公司23andme如今已經為超過100萬人進行過基因組測序(盡管這些對象有高度的自我選擇意識,但代表性不是很強)。加利福尼亞的Kair Permae也為超過50萬名受試者進行過基因測序。33sup> The UK Biobank提供了50萬名受試者的基因型信息,他們的受試者是通過合理的采樣方式抽取的,以保證各民族樣本的代表性,雖然也麵臨著參與率低下的隱憂。

當我們對於這些單一多基因評分的預測能力開始達到兩位數時,就有必要對人為選擇[或稱“私人優生”(personal eugenics)]進行嚴肅的討論了。尤其是當越來越多的父母選擇試管嬰兒的生育方式時,這樣的討論就顯得更為必要(關於政策的影響,我們將於第八章進行討論)。同時,在我們能夠直接測量給定基因型的效應,而不僅揣測相關性的情況下,這些分數已經對解釋許多問題提供了幫助,比如,基因是如何與社會環境相互作用的(第七章的主題),以及我們會如何將自己分成不同的“遺傳種姓”(geic caste),或者避免這一情況的發生。

在身高的遺傳分析方麵,科研工作者已經能夠通過一項分數來解釋60%的遺傳力了,這項分數是由GWAS數據加總得來的。想想看,隻要用一個數字!29sup>隨著“元分析”(metaanalysis)(一種將多個樣本的結果整合起來的統計學手段)可用的樣本越來越多,也越來越大,這個數據也必然會上升。30sup>圖3.3基於單個研究的樣本量顯示了一些預測(大量研究使這個斜率稍微平坦了一點,但總體趨勢是相同的)。31sup>

若想將完整的加性遺傳力估計歸約為可以通過個體基因分型SNP芯片確定的單一分數,目前麵臨著重重障礙。而障礙之一就是,我們測得的SNP標記並不能完整地反映基因組中真正關鍵的SNP。32sup>遺傳力會因時間和地點而異的假設帶來了第二個障礙。在研究環境和人群相差巨大的情況下,如果僅僅去尋找共有的遺傳效應,那麼得到的結果可能不過是某個特定樣本中某個性狀的遺傳力的一部分罷了。

圖3.3 樣本量與某多基因分數能夠解釋的遺傳力比例的關係

資料來源:Daetwyler et al.(2008)

注:該分數衡量的是一個連續性狀,基於SNP計算得到的遺傳力為12%。由樣本量的PGS條件解釋的遺傳比例隨著遺傳力而上升(h2snp)。圖中Y軸(縱軸)代表著這個案例中的表型變異比例,最大值為12%;X軸(橫軸)描述了需要12%的預測值所需的樣本量,範圍是0~3000000。