三就是準確性。係統能對采集到的信息經係統進行分析處理,對信息進行自動分類、消重、提取關鍵詞等處理,為用戶提供準確、無冗餘、無雜質、易檢索的信息服務。
說到他開發的微博輿情係統具體技術指標,秦風更是異常地興奮:“我弄得的這套數據采集係統可是創舉啊!它的智能數據采集,可以7*24全天候,對新浪、騰訊、網易、搜狐等主流微博,發布的輿情信息自動進行采集、跟蹤、監測。”
“另外呢,這個係統還能夠將境內主要微博(新浪、騰訊、網易、搜狐)及境外微博(Twitter)作為數據源,對指定重點微博進行專項監測與分析。”
“這一點對你非常有用處。你隻要報出對你造謠陷害的微博用戶名稱,我就能用這個係統很快就對他進行特殊監測並做出適時分析,保證讓他無處遁形。”
秦風接著說道:“第三呢,這個係統采集的內容包括微博信息和微博用戶信息。微博信息包括:全文、時間、圖片、鏈接等;微博用戶信息包括:博主名、粉絲數、關注數、發帖數簡介。”
“還有就是個人賬號采集:微博ID、內容、來源、博主名、博主ID、微博鏈接(URL)、博主身份、微博發布時間、微博創建時間、圖片(微博主圖片URL)、博文類型(轉發或原創)、評論數、轉發數、發博文設備。包括博主的姓名、博主個人資料、認證身份。”
“他所發微博的ID、內容、來源、博主名、博主ID、微博鏈接(URL)、博主身份、微博發布時間、微博創建時間、圖片(微博主圖片URL)、博文類型(轉發或原創)、評論數、轉發數、發博文設備。數據實時采集可以5分鍾更新一次。所監控的數據采集的全麵性可達到100%。”
項莊早就已經不耐煩秦風對自己這套係統,誇誇其談式的自吹自擂了。
他不客氣地打斷了秦風的喋喋不休,氣憤地說道:“你也別說那麼多廢話了,行不行我們還是看看它的具體療效吧!”
秦風有一點點掃興。
但他看到項莊火燒眉毛般的著急樣子,即刻也恢複理智狀態。
“好,那我們就進入正題吧!”
秦風向項莊詳細地詢問了,微博造假事件的來龍去脈,以及一些具體情節。
然後,將這些信息逐一輸入到他的微博輿情分析係統裏。
秦風忍不住又說道:“這個係統能夠對微博照片造假進行事件分析、博主地域分析、博文傳播路徑分析、事件溯源分析、博主分析、社區關係分析、博主群體分析、熱點分析、回溯曆史信息。”
不一會兒,秦風那台“怪物”電腦的屏幕上就顯示出以下信息:
1、“某省府辦公廳副主任裸體PCH照片事件”分析:通過對該事件相關的博文進行分析,該事件變化呈中度溫和上升趨勢。經分析,事件重要博主係一網名為“司級幹部”所發起、事件相關熱詞“裸體”、“PCH”、“辦公廳副主任”等。
2、博主地域分析:當天事件相關發博博主的地域分布於中國廣東省廣州市。
3、博文傳播路徑分析:最早發布者為“司級幹部”,其ID為133.486.697…,助推該信息的微博人群主要分布於廣東省廣州市。
然後,項莊看到電腦屏幕上又出現了一堆數據分析。
網絡輿情監控係統監測數據顯示:截止5月11日4時,“某省辦公廳副主任PCH事件”相關網頁結果2,800,條,新聞結果9篇,論壇帖子142篇(其中貼吧103篇),新浪微博相關廣播1827條,騰訊微博相關廣播333條。
新浪微指數:新浪微指數顯示“某省辦公廳副主任PCH案”的熱議度,5月11日23時同時達到峰值。
百度指數:百度指數顯示,“某省辦公廳副主任PCH案”的用戶關注度5月11日22時即達到峰值699。
騰訊廣播趨勢圖:5月11日23時,“某省辦公廳副主任PCH案”的相關廣播達到峰值109。由此,可以判斷此事件關注度向趨高發展。
看到這裏,秦風對項莊說道:“現在這些數據還在瞬息萬變,出現任何一種情況的可能性都有。”
看著項莊不大相信的神情,秦風說到:“難道你就這麼快忘了去年廣州越秀區武裝部那個什麼頭在飛機上打空姐事件啦?”