正文 數據新聞記者的數據素養(1 / 2)

數據新聞記者的數據素養

前沿報告:數據新聞素養

作者:沈浩 談和 文蕾

如果新聞記者不具備良好的數據新聞素養,一是會造成重要信息的遺漏,二是會得出錯誤的結論而誤導受眾。

數據新聞強調從數據資料的挖掘中發現具有新聞價值的事實。如果新聞記者不具備良好的數據新聞素養,一是會造成重要信息的遺漏,二是會得出錯誤的結論而誤導受眾。因此,具備良好的數據新聞素養,是數據新聞記者應該具備的首要能力。數據新聞記者不需要對具體行業有較深的數據積累,但必須有效地發現數據和尋找數據,一旦選題確定,要能運用各種途徑和方法獲取所需數據,同時也要在機構內部建立一個長期積累的數據庫。筆者將數據新聞記者應具備的素養總結為以下三點。

有效地獲取數據

精確新聞學的創始人菲利普·梅耶在《數據新聞手冊》裏寫道:“在信息量不足的時代,記者主要的精力在於尋找和獲取信息,然而處於信息豐富的今天,信息處理的過程就顯得尤其重要。”數據新聞的出現,某種程度上順應了全球開放數據發展的進程,同時也是在一個社會化媒體高度發展,數據高度飽和的時代下,新聞業自身發展的一個變革。數據並不稀缺,真正稀缺的是對數據裏蘊含的資訊和事實的解讀。

國外媒體之所以能做出很多有社會意義的數據新聞,一定程度上跟國外數據開放的政策和完善的數據開放管理機製有關。國內在這方麵還處於起步階段,很多政府數據並沒有開放,開放的數據也沒有統一的管理和發布平台。不過我們很欣慰地看到國家統計局網站改版和在數據開放方麵的一些探索。我們一方麵寄希望於國內開放數據領域的發展,另一方麵也要不斷加強記者自身獲取數據的能力。除了來自官方的、第三方機構的開放數據,另外還有幾種常見的獲取數據的途徑:調查、眾包和引用。

1.調查是新聞記者在沒有現成數據來源時采用的一種數據收集手段,主要以問卷或是街頭訪問的方式進行。這種方式最大的問題就是沒有經過科學的抽樣,樣本並不具備推及總體的代表性。我們經常能在新聞裏見到“經過記者的調查,60%的民眾……”這樣的結論,但是並沒有說明數據是如何收集、如何得出的。通過街頭攔截或是網上問卷調查得來的數據結果,嚴格意義上講都不具備總體代表性,因此不能簡單粗暴地認為是總體的意見和看法。

2.眾包是隨著互聯網技術的發展而產生的一種新生產組織形式。其目的就是將一項需要耗費大量人力和成本的工作,通過互聯網的控製分發給網絡上的“誌願者大軍”,通過他們貢獻的業餘時間和業餘精力來完成一項巨大的工程。通過眾包的方式來完成的最典型案例就是以維基百科為代表的網絡百科工程。

當然,新聞記者也可以通過這種方式來完成一些僅僅依靠新聞機構本身很難去完成的任務,比如全國各地水質、空置房、閑置土地、物價等空間和時間跨度大的調查項目。英國《衛報》就通過這種方式,讓讀者幫助他們完成45萬份記錄有國會議員開銷的文件。眾包項目在一定程度上能夠幫助新聞機構完成大數據量的數據收集和整理,但數據質量的高低和項目效果的好壞,取決於項目管理和控製。

3.還有一種在新聞裏常見的數據獲取方式——引用。為了證明新聞報道裏的觀點,我們經常會引用第三方報告、論文、年鑒等資料裏的數據。當我們在引用這類數據的時候,最經常犯的錯誤是被找到數據的喜悅衝昏頭腦,以至於忘了去質疑和證實數據的有效性。於是我們經常看到“×××數據顯示,過去3年,北京電視機開機率從70%下降到30%”,“中國內地用戶月均上網費用是美國的4倍、韓國的20多倍”等一些不實的報道。求證和質疑是數據新聞素養最基本的要求,如果無法證明數據的準確性,最好的處理辦法是不用;如果一定要用的話,要注明數據的來源和出處,最好是能給出鏈接或者文件名稱,方便受眾去質疑和求證。

由於不能有效地獲取數據,而造成一些虛假不實報道產生,會大大降低新聞媒體的公信力。為此,2011年國家新聞出版總署發布《關於嚴防虛假新聞報道的若幹規定》,其中有兩條應該作為數據新聞記者獲取數據時的標準:刊播涉及民意調查的報道,要使用權威規範的數據來源,謹慎使用網絡調查、民間調查、市場隨機訪問等調查數據,報道中要說明調查的委托者、執行者、調查目的、調查總體、抽樣方法、樣本數量等,客觀反映調查結果。

科學地分析和解讀數據

哥倫比亞大學新聞學院數據新聞研究中心的Jonathon Stray教授認為,數據不會自己說話,需要被解讀,在數據解讀的每一個過程中都有可能出錯,最後導致一個錯誤的結論或新聞故事。分析數據的第一步是理解數據,為了理解數據,我們必須對新聞選題的背景有所了解,對選題裏涉及的概念有清晰的認知。比如不了解收視率的背景,可能會覺得10%的收視率是一個很低的數值,但實際上它是一個很不錯的收視表現。數據本身並沒有意義,隻有當它置於一定的情景之中,才被賦予特殊的含義。