食品安全問題的變量與時間並非單一關係時,簡單的時間序列趨勢預測方法就不適用了。另外一種常用的趨勢預測方法,是利用已有的數據積累來進行曲線擬合,回歸分析即是如此。回歸的特點是根據已經積累的若幹監測數據,通過匹配數據間相關關係,或分析因素變量之間的函數特性,采用擬合方式尋找接近真實狀況的最佳擬合趨勢線。
回歸預測更有利的特點,是對未來發展趨勢預測到有不利變化時,可以根據擬合曲線變化的趨勢斜率估算達到最壞狀態的時間,從而為提前判斷警兆發出警情預報提供最佳的時機。例如,對於食品中危害物呈陽性率的異常預警、危害物超標率異常預警、危害物檢出率異常預警,都是屬於對一段時間檢測結果的數據總體的考察,回歸趨勢預測側重於對危害物的發展趨勢進行預警。當趨勢表現危害物呈上升趨勢時,說明異常趨勢出現,而趨勢的斜率可方便地估算出達到限度要求的可能時間。由於回歸擬合趨勢線僅依靠曆史統計數據,所以對數據的相關性有一定的要求,需要進行相關性檢驗。對於相關性較高的數據,不僅可以擬合出精確度較高的趨勢演變規律,而且,根據趨勢發展態勢所進行的預測,可信度也較高。
回歸方法適用於有大量觀測統計數據又無確定關係形式的食品安全預警係統,涉及相關分析、方差分析及其統計檢驗等基礎知識。
一、回歸預測方法
回歸方法有多種分類,一般可分為線性回歸和非線性回歸,食品安全趨勢預警一般選用簡單的線性回歸,即因變量y與多種影響因素(x1,x2,…,xk)有線性關係。
多元線性回歸的影響因素不能過多,否則就會增大計算和測定的工作量,並且由於對因變量作用差異大,那些影響作用很小的自變量存在會降低預報精度,影響回歸方程的穩定。因此要挑選對因變量影響顯著的因素作為自變量,以形成最優回歸方程。自變量的初步篩選可以選用下麵的方法。
(1)比較篩選法將考慮到的全部影響因素作為自變量,按照它們的各種可能組合計算相應的回歸方程,然後挑選出殘差標準差最小、自變量均顯著的最優回歸方程。
(2)向後剔除法首先建立一個包括所有自變量的多元線性回歸方程,然後進行方差分析、變量偏回歸平方和顯著性檢驗,根據檢驗剔除偏回歸平方和最小的不顯著自變量,反複多次剔除後,直到隻包含顯著自變量為止。
(3)向前引入法首先根據簡單相關關係,引入與因變量相關程度最大的一個自變量建立回歸方程,進行偏回歸平方和檢驗顯著性,如顯著則保留,繼續在剩餘自變量中引入,重複進行顯著性檢驗,直到沒有顯著性自變量可引入為止。
(4)逐步回歸法按自變量對因變量的作用程度從大到小逐個引入回歸方程,每引入一個變量同時檢驗方程中各個自變量的顯著性,合格保留、不顯著剔除,反複進行直到再沒有顯著的自變量可以引入為止。
二、多元線性回歸預測基本原理
(一)回歸模型一般來說,多元線性回歸方程為:=b0+b1x1+…+bjxj+…+bkxk(4-31)式中,為因變量;(x1,x2,…,xk)為自變量;bj為回歸係數,通過最小二乘法方法求得,表示假設其他自變量不變情況下,某一自變量變化引起因變量變化的比率。
(二)回歸方程的檢驗