行政區域服務網絡輿情監測與預警係統的構建研究
改革與戰略
作者:朱璟
[摘 要] 文章以構建行政區域(廣西)服務網絡輿情監測與預警係統為落腳點,深入研究當前網絡輿情監測與預警係統的工作模式和工作流程,針對其數據采集和數據處理過程無法科學地做到針對性、實效性、全麵性的欠缺,認為引入以行政區域作為信息采集與管理操作單元,可以克服該係統在分層、同步、異步處理機製上的不足,並提出構建科學、實用的網絡輿情監測與預警係統的對策與建議。
[關鍵詞] 網絡輿情;監測與預警;對策
[作者簡介] 朱璟,廣西財經學院工程師,研究方向:圖書情報、網絡安全、係統安全、軟件開發,廣西 南寧,530001
[中圖分類號] G206 [文獻標識碼] A [文章編號] 1007-7723(2015)05-0034-0005
一、構建網絡輿情監測與預警係統的必要性
互聯網的產生是以蒸汽機的發明為標誌的第一次工業革命以來的又一重大發明。互聯網帶給人類的不僅是一場技術革命,更是一場社會變革,它將引領人類進入一個全新的時代。傳統的管理模式、商業模式、思維方式都受到了影響,使創新與變革已成為這個時代的代名詞。中央電視台大型紀錄片《互聯網時代》在肯定互聯網給人類生活帶來便利的同時,沒有忘記警醒人們學會“控製”,因此互聯網在帶給我們生活上便利的同時,也帶來了一些不良的影響。網絡輿情是以網絡作為傳播介質,圍繞著突發的或偶發的社會事件的發生、發展與變化全過程,民眾對與之相關的社會管理者、企業、個人及其他各類組織在政治、社會、道德等方麵所表達出來信念、態度、意見和情緒等,並以字符串、音頻、視頻信息、表情符號等方式在互聯網空間的表達與傳播。網絡輿情是社會輿情在網絡空間的映射,社會輿情及網絡輿情是政府應對突發事件應急管理能力的試金石。互聯網不僅是社會各階層表達利益、宣泄情緒、思想碰撞和聚集民意的重要平台,還是突發事件的重要策源地和發酵池,因此,各級政府已經認識到加強網絡輿情管理、控製、引導變得更加迫切、重要且複雜,構建並實行與時俱進的網絡輿情監測與預警係統更是各級政府部門的共識。
因此,本研究符合大數據時代的數據處理流程,具有的極高的現實操作、指導意義,對當下數據爆發,網絡應用廣泛的變革時代具有一定的戰略意義。
二、當前網絡輿情監測與預警的現狀與不足
現有網絡輿情監測與預警研究已相當普遍,在CNKI通過以“網絡輿情”和“互聯網輿情”為關鍵字進行檢索發現,2007年297篇、2008年580篇,到2014年有8578篇,可見,關注度在呈逐年遞增;研究的機構主要集中在國內大學、研究所;研究的主要方向是突發事件如何通過網絡逐步演化成為較強影響力、傾向性的網絡輿情,以及如何通過現代技術手段(信息采集技術、信息預處理技術、中文分詞技術、文本聚分類技術、話題檢測算法、話題追究回溯算法、報警設計等)對信息進行采集、識別、分析、追蹤與引導等方麵對輿情價值進行深度挖掘等。通過研究發現:這些研究的數據收集均是采用地毯式搜索收集或采用主題垂直搜索進行數據搜索收集。地毯式搜索收集主要是把所有信息不加分類,不進行特征比較而是直接進入數據采集,這種方式采集的優點是:數據量大、采集麵廣;缺點是:數據無針對性、無特征無範圍,因此很難設定一個很好的多任務、多層次的數據采集分工機製。主題垂直搜索是從某一個關鍵詞(主題詞)入手去查找含有該關鍵詞(主題詞)的數據,這種采集方式更有針對性、數據特征相似、采集數據可用性和采集效率比較高,較為流行,如搜索引擎“百度”、“google”等均采用這種方式,但是其有顯著的不足:
1.特征不明顯的數據采集丟失嚴重
由於采用的是性質特征(如征地糾紛、砍人、法輪功、東突等關鍵字)作為權重較高,並以此為重點采集目標進行搜索收集,那麼有些特征不明顯或者當前特征沒有定義的數據就有可能被丟失。
2.采集的範圍相對比較窄
由於有些新事物、新術語往往因為係統關鍵主題詞不含有此類信息,所以出現采集不足,造成數據的缺失。
3.數據采集觀念落後
既然針對的是公眾輿情信息,那麼理應更客觀全麵的搜集輿情信息,無論是中性、不良、好的數據信息均應成為數據采集內容,而此方法顯然做得不夠,數據采集的全麵性有待提高。之前服務器性能不足、存儲設備落後、網絡帶寬窄等客觀原因,形成了數據采集與處理上的瓶頸。而今,服務器處理速度、硬盤讀寫速度、網絡速度已突飛猛進,要實現全數據采集應該不是什麼難事。如廣西有5282萬人,假如每人每天在網上發達自已的意見1000個字,那麼1000個漢字的硬盤空間就是2KB,廣西5282萬人一天占用的硬盤空間合計約100GB,這點數據量對以大數據著稱的今天,應該不是難事。
4.輿情事件行政區域管轄範圍不固定
區域行政管理機構更多的是關注本行政區域的所有網絡輿情,如廣西網絡輿情監測與預警的管理機構,更關心、更專注於廣西行政區域範圍內的事情,而不是其他省份的;那麼各省的地、市、縣行政區域的網絡輿情監測與預警的管理機構也更關心自己行政管轄範圍的事,同時,信息的質地要求上,不管是負麵的,還是正麵的,或是中性的,都是有用的、有現實意義的。
三、網絡輿情監測與預警係統構建的對策與建議
(一)引入以行政區域作為信息采集與管理操作單元
本研究改變了傳統主題構建方式,以行政區域作為信息采集與管理操作單元,以各地市、縣名稱作為基點來構建獨立的網絡輿情監測與預警係統,以各地市、縣、鎮、鄉名稱為唯一關鍵字進行數據搜索與采集,實現各地市、縣獨立管理與運作的網絡輿情收集、監測、預警等。同時,對采集的數據按照信息預處理技術、中文分詞技術、文本聚分類技術、話題檢測算法、話題追究回溯算法、報警設計等進行相應的技術處理,按照行政區域管理範圍進行按區域權限進行分類彙總,並加入一些針對網絡輿情行政處理辦公功能,實現統一謀劃、分步和多層次實施,上下一盤棋的工作協調機製,讓各行政區域管理員及時了解、把控、引導本行政區域的網絡輿情。以行政區域數據庫作為數據收集的主關鍵詞是多層次、多批次、無遺漏進行同步或分步采集機製的核心方案,也是行政區域的網絡輿情監測與預警係統的工作要點。