正文 數據信息預處理方法在企業財務風險評價指標體係中的應用(2 / 2)

由於企業的財務數據帶有明顯的行業和時期背景特征,如果將不同行業、不同時期的財務數據放在一起比較不具有統計上的可行性,也有失偏頗。因此本文選取了2013年被ST的16家上市公司,同時遵循同行業、同時間的原則,選取了另外16家非ST上市公司作為匹配樣本;選取了2014年被ST的20家上市公司和20家非ST公司作為配對樣本;選取了2015年被ST的16家上市公司和16家非ST公司作為配對樣本,數據來源於新浪財經和同花順。

三.數據預處理

首先對初始選擇的28項財務指標進行相關性分析,發現各指標間存在著較強的相關性,為了降低財務指標之間的共線性程度,對於指標之間存在正相關或負相關性非常高的指標,應當適當予以剔除。

接下來對這些財務指標進行兩個獨立樣本的差異性檢驗,使得經過初步篩選的財務指標在均值上存在較為顯著的差異,能通過這些指標的差異性來對財務風險危機公司和非財務風險危機公司進行有效的分類,對於不存在顯著性差異的財務指標應適當將其從研究變量中予以剔除。通過對這些指標進行K-S檢驗,發現大多數的財務指標不服從正態分布,因此運用非參數檢驗法,通過計算Maan-Whitney U統計量和Wilcoxon W統計量,比較兩類公司各指標間的差異性。發現兩類公司的財務指標值並不具有顯著的差異性,主要體現在應收賬款周轉率、存貨周轉率、股東權益周轉率、主營收入現金含量、銷售現金比率這幾項指標上,應適當予以剔除。

為了對初始財務指標進行降維處理,壓縮成數量盡可能少,而又包含盡可能多信息的指標體係,將聚類分析和統計分析相結合,從而篩選並建立最優的財務風險評價指標體係。

在聚類分析結果中的冰柱圖上進行處理,首先,將初始的財務指標聚為20類(也可以從其他個數開始),則X19主營業務收入增長率和X21營業利潤增長率聚為一類,隻需選擇一個即可,我們選擇X21營業利潤增長率,因為其受到的影響因素更多。接下來X26現金流動負債比率和X27現金債務總額比聚為一類,我們選擇X26現金流動負債比。X8總資產報酬率、X9淨資產收益率、X10淨資產收益率、X17流動資產周轉率、X22淨資產增長率和X23總資產增長率聚為一類,我們選擇代表性較強的X8總資產報酬率。最後X3資產負債率和X5股東權益比率聚為一類,我們選擇X5股東權益比率。

對這20項指標進行差異性非參數檢驗,得出兩類公司在應收賬款周轉率、股東權益周轉率、主營收入現金含量和銷售現金比率這些指標上的差異性並不顯著。再對這20項指標進行共線性診斷,發現所選擇的20項財務指標之間依然存在著較強的多重共線性,因此需要繼續進行剔除。

將聚類分析和統計分析的結果相結合,剔除差異性並不顯著的X13應收賬款周轉率、X18股東權益周轉率、X24主營收入現金含量和X28銷售現金比率,並剔除多重共線性非常嚴重的X7淨利潤率,剩餘15項財務指標,再次進行差異性非參數檢驗和多重共線性檢驗。此時,兩類公司在經過篩選的15項財務指標上存在著顯著的差異,並且各指標間不存在嚴重的多重共線性。

四.基於神經網絡的財務風險分析

結果顯示,該模型的綜合判斷正確率達到96.2%,正確率非常高。

表3中列出了通過其他數據預處理方法,接入神經網絡分析後模型的判斷正確率。通過比較分析可以看出,初始建立的評價指標體係,模型的判斷正確率已經較高,達到90.4%。而通過去除差異性不顯著的指標處理,以及去除多重共線性嚴重的指標處理,並沒有提高模型的判斷正確率。通過去除相關性較強的指標,模型的判斷正確率略有提高,達到91.3%。結果顯示,本文提出的數據預處理方法能夠較為顯著的提高神經網絡模型的判斷正確率。

表3. 不同方法處理後的指標體係神經網絡分析結果對比

五.總結

在綜合考慮重要性、靈敏性、真實性、可度量性、獨立性、可獲得性和一致性等原則的基礎上,選取了52家2013年到2015年被ST的上市公司以及作為對照的另外52家非ST上市公司作為樣本,通過分析其財務數據建立了初始評價指標體係。為了消除指標間的關聯性需要進行降維處理,運用聚類分析的方法將相似的指標聚為一類,在篩選指標的過程中結合差異性檢驗、相關分析與多重共線性檢驗,最終篩選出具有代表性的評價指標。通過接入神經網絡模型進行預測分析,結果顯示,本文提出的數據預處理方法顯著地提高了模型的判斷正確率。