正文 利用CRISP—DM模型規範企業兩化融合過程中的數據開發利用(1 / 2)

利用CRISP—DM模型規範企業兩化融合過程中的數據開發利用

研發設計

作者:華苗苗

摘要:文章闡述了企業在兩化融合發展進程中數據開發利用的需求,給出了以實際操作層、信息係統層和數據分析層為組成部分的數據開發利用體係框架,並結合CRISP-DM模型提出了企業進行數據開發利用的實施過程,最後提出具體實施過程中的關鍵點。

關鍵詞:兩化融合;CRISP-DM模型;數據開發利用 文獻標識碼:A

中圖分類號:F427 文章編號:1009-2374(2015)21-0029-02 DOI:10.13535/j.cnki.11-4406/n.2015.21.015

信息化和工業化融合(以下簡稱“兩化融合”)是當今國家乃至世界發展的大趨勢,對於企業而言,兩化融合是將信息化作為手段,夯實工業化基礎,推進企業數據、技術、業務流程、組織結構的互動創新和持續優化,從而打造信息化環境下新型能力的過程。近年來,隨著企業單項應用的增加及集成度的提升,計算機對數據的處理能力顯著提高,隨之而來的數據量與日俱增。市場競爭的加劇、企業規模的增大、數據複雜度的提升都要求企業實現數據的開發利用,為領導決策提供相應的依據。為進一步規範企業數據的開發利用,《信息化與工業化融合管理體係要求》中也著重提出了“有效地開發利用數據”的要求。故本文提出在兩化融合過程中,企業利用CRISP-DM(cross-industry standard process for data mining)模型規範數據開發利用的過程。

1 數據開發利用體係框架

數據開發利用體係框架,可分為三個部分:

1.1 實際操作層

涵蓋研發、製造、銷售等環節,是企業數據的最初來源和最終落腳點,各部門負責采集其中的數據,將其作為信息係統的輸入,並利用決策的結果對實際業務進行調整。

1.2 信息係統層

涵蓋企業ERP、OA、PLM等已有信息係統,對其進行集成應用,實現數據、接口的標準化和規範化,確保為數據分析層提供有效的數據。

1.3 數據分析層

涵蓋了數據倉庫、數據挖掘和決策支持/商業智能三部分,用於將信息係統中的數據提取出來,並根據需要進行轉換和存儲,然後按照特定目的進行挖掘、統計和分析,從而產生供管理者參考的決策,可包括:研發方向調整、銷售市場細分、職能部門優化等,最終將決策反饋至實際操作層,並對信息係統作相應變更。

2 利用CRISP-DM模型實現企業數據開發利用

CRISP-DM由歐盟機構於1999年聯合起草,為全工業界提供數據挖掘利用的全生命周期管理標準。CRISP-DM模型定義了六個過程,按照此模型,企業可按如下步驟實施數據開發利用:

2.1 商業理解

從企業戰略出發,確定可持續競爭優勢和需要打造的信息化環境下新型能力,再細化到需要實現的兩化融合目標,從待實現的目標中提出需解決的數據開發利用問題,進行數據開發利用策劃,需涵蓋開發目標、涉及部門、數據來源、開發過程等。

2.2 數據理解

根據數據開發利用策劃,從各部門、各流程、各崗位、各係統中收集相關數據,並對數據質量加以鑒別,以確保數據的準確性、全麵性、有效性,此外,還需初步探索數據自身的特征及數據間的相互聯係,形成對潛在信息的假設。

2.3 數據準備

根據與數據開發利用目標的相關性、數據質量及開發利用技術,進行建模前的數據準備。首先進行數據表製作,將數據統一格式後進行記錄,然後為適應建模工具進行數據清理,這一過程一般需反複實施多次,直至篩選出最終數據集。