正文 第27章 網絡論壇輿論領袖篩選方法初探(2)(1 / 2)

5.運用PageRank思想的篩選方法

PageRank(網頁排名)是一種由搜索引擎根據網頁之間相互的超鏈接計算的網頁排名技術,以Google公司創辦人拉裏·佩奇(Larry Page)之姓來命名。Google把從A頁麵到B頁麵的鏈接解釋為A頁麵給B頁麵的投票,一個頁麵的得票數由所有鏈向它的頁麵的重要性來決定。也就是說,在實際計算PageRank值時,除了考慮網頁得票數(即鏈接的純數量)之外,還要分析為其投票的網頁的重要性,一個網頁本身的PageRank值越高,則它對其鏈出網頁的推薦能力就越強。同時一個網頁的鏈出網頁越少,那麼它對其中一個鏈出網頁的推薦程度就越高。也就是說,PageRank還會根據頁麵鏈出總數平分一個頁麵的PR值。目前已有學者將PageRank思想運用到識別網絡輿論領袖的研究中。

X.Song等人(2007)運用Influence Rank(影響力級別)算法來識別博客圈中的輿論領袖,這種影響力級別算法根據兩個方麵來分類博客:博客在網絡中的重要程度;博客提供的信息的新穎度。在測量博客在網絡中的重要性時,他們運用了PageRank的核心思想,在評定A博客的影響力時考慮了被A博客吸引的那些博客本身的影響力水平。Zhongwu Zhai等人(2008)在識別BBS中的輿論領袖時,首先提出了兩種將用戶聚類到不同興趣領域的算法:基於版塊的算法(FieldPR_Board)和基於文章鏈的算法(FieldPR_ChainClus ter),然後將Global-PR算法應用到每個領域。GlobalPR不僅考慮了每個用戶的回複數,而且也考慮用戶跟隨者自身的顯著度,實際上GlobalPR就是一個加權的PageRank。其中,基於版塊的算法認為在某種程度上,BBS每一個版塊就是一個興趣領域;而基於文章鏈的算法認為一個用戶回複文章鏈是由於他對文章鏈中的文章感興趣,因此可以將文章鏈作為興趣領域的基本單位。

運用PageRank思想的識別方法很好地利用了互聯網現存的海量信息來挖掘輿論領袖,相比自我報告法等傳統方法更具有科學性。這種方法最大的特點是在識別輿論領袖時,不僅考慮了輿論領袖在社會網絡中被關注的程度,而且也考慮了跟隨者本身在這個網絡中的重要性。另一方麵,這種識別方法還強調了輿論領袖的跟隨者在社會網絡中關注的人的數量,因為每個人的精力是有限的,一個人關注的人過多,那麼分配給其中之一的關注度也必然大打折扣。然而,這種方法也存在著一定的缺陷,最大的問題就是忽視了文章或帖子的內容。以BBS為例,擁有高回複數的ID並不一定就具有高影響力,不應將用戶間的回複關係簡單地理解為支持關係。

三、識別網絡論壇輿論領袖的基本原則

近年來,隨著互聯網在中國的日益普及,網絡論壇越來越成為中國社會各階層意見表達、情感宣泄和思想碰撞的重要渠道,植根於中國特殊國情下的中文網絡論壇在人們的社會生活中發揮著越來越重要的作用。而在網絡論壇影響力的發揮過程中,一個重要群體“論壇輿論領袖”扮演著至關重要的角色。正是由於論壇輿論領袖日益凸顯的社會影響力,不同學科背景的研究者出於各自的目的,努力尋找著識別網絡輿論領袖的最佳方法。然而,究竟什麼才是最佳方法?該部分筆者將以天涯社區天涯雜談版塊為例,結合網絡論壇的互動特點,在已有篩選方法的基礎上,探討識別論壇輿論領袖的基本原則。