為了保證多元回歸擬合的線性規律滿足應用的精確度要求,需要利用統計檢驗的方法對回歸方程進行檢驗,一般涉及相關性r檢驗、回歸參數總體顯著性F檢驗、回歸係數t檢驗。
1.線性相關性與擬合優度
實際值y與x1,x2,…,xk個變量之間是否具有線性關係,稱為相關性。多元回歸擬合=b0+b1x1+b2x2+…+bkxk的線性相關程度,用統計量擬合優度r2定量表示為:r2=∑ni=1(i-)2∑ni=1(yi-)2=1-∑ni=1(i-yi)2∑ni=1(yi-)2(4-32)式中,i=1,…,n是檢測樣本的數量;∑ni=1(yi-)2為總離差平方和,表示y的實際值與其均值的離散程度;∑ni=1(i-)2為回歸平方和,反映y的擬合值與其均值的離散程度;∑ni=1(i-yi)2=∑2i為殘差平方和,反映y的實際值與擬合值的距離。
擬合優度0≤r2≤1,r2越接近1相關程度越高,當r2=1時,擬合直線經過所有實際點,是最理想回歸擬合狀況;當r2=0時,擬合直線與實際點相關程度最低。擬合優度越高,回歸方程的預測準確性越高,越有利於對監測對象變化趨勢進行判斷和實施預警。
2.回歸參數總體顯著性F檢驗
檢驗k個檢測變量(x1,x2,…,xk)對y的總體影響程度,用統計量F檢驗。檢驗樣本有n個,統計量為:f=∑(i-yi)2/k∑(i-)2/(n-k-1)~F(k,n-k-1)(4-33)給定顯著性水平α,一般取α=0.05,當f≥Fα成立時,說明多元線性回歸模型在顯著性水平α下,參數總體影響顯著。
3.回歸係數顯著性t檢驗
t檢驗是對每一個檢測變量xj(j=1,2,…,k)與因變量y的線性相關程度的檢驗,對xj的樣本統計量為:tj=b^j-bjS2∑ni=1(xij-i)2~tn-k-1(4-34)式中,樣本數i=1…n,s2=∑ni=12in-k-1=∑ni=1(yi-i)2n-k-1。給定顯著性水平α,如果tj≥tα/2,說明變量xj顯著影響y。否則,變量xj對y的線性關係貢獻很小。一般在α=0.05時,tn-k-1>2就認為影響顯著,當tn-k-12時,不用查表即可判定為參數xj顯著性影響y。
對於k個檢測變量,重複上麵的t檢驗,直到全部t檢驗完畢。t檢驗後,留下顯著性影響的變量,對顯著性影響弱的變量,需根據食品安全趨勢預警的具體要求重新進行篩選,或在滿足方程總體顯著性檢驗的基礎上,刪除該類不顯著變量。另外,t檢驗適合於小樣本(n<30),大樣本可改用Z檢驗。
三、食物中毒致病的風險監測與發展趨勢預測
設因變量y為食物中毒風險,自變量為監測物化學農藥A含量x1、農藥B含量x2,建立線性回歸方程:=b0+b1x1+b2x2,係數通過最小二乘法計算。為了判斷y與x1、x2的線性相關程度,選擇n個檢測樣本,定量計算擬合優度r2。當0.7<r2≤1時,擬合線性程度最好,所建立的多元線性回歸方程具有趨勢預警的可行性。
樣本序號x1x2yii(yi-)2(i-)212…n∑=r2=