第二章
大數據:一個新的政府治理命題
大數據時代來臨
站在今天的角度觀察,人類社會的信息化進程其實可以劃分為三個時代,即計算機時代、互聯網時代和大數據時代。
到20世紀90年代中期,發達國家已經基本度過了計算機時代。計算機的普及,解決了信息的機器可讀化和數據的可計算化問題。目前,發達國家和部分發展中國家也基本走完了互聯網時代的路程。互聯網的建立解決了信息傳遞和信息服務問題。在計算機和互聯網的基礎上,而今我們正步入一個全新的曆史階段—大數據時代。
劍橋大學教授維克托·邁爾–舍恩伯格在其《大數據時代:生活、工作與思維的大變革》中寫道:“大數據開啟了一次重大的時代轉型。就像望遠鏡讓我們感受宇宙、顯微鏡讓我們能夠觀測微生物一樣,大數據正在改變我們的生活以及理解世界的方式,成為新發明和新服務的源泉,而更多的改變正蓄勢待發……未來數據將會像土地、石油和資本一樣,成為經濟運行中的根本性資源。”
2013年被國外媒體稱為“大數據元年”。大數據如浪潮一般席卷全世界,不僅在信息技術行業備受矚目,更成為變革科研、商業、政府運作方式乃至人類思維方式的一個熱點。
我們可以用三個詞勾勒出大數據時代的全景—大數據、大知識、大價值。
大數據
1969年,美國阿波羅登月艙使用的自動控製計算機內存容量隻有 63KB(千字節);而如今,一部普通的蘋果手機運行內存就有1GB(吉字節),是前者的6.45萬倍,這還不包括16~64GB不等的存儲內存。阿波羅登月艙隻有一個,而僅在2013年第一季度,就銷售了大約3 800萬部蘋果手機。人們用手機社交、購物、閱讀,產生的數據量是驚人的。
隨著計算機技術全麵融入組織運作和社會生活,數據正在以一種超乎想象的速度爆發式地增長。據統計,人類存儲信息量增長速度是世界經濟增長速度的5倍,而計算機數據處理能力增長速度則是世界經濟增長速度的10倍。根據聯合國的研究報告,全球的大數據存量從2005年的150EB(艾字節)增長到2010年的1 200EB,並預計將以40%的年增長率繼續增長,2020年將達到2007年的44倍,平均每20個月翻一番。1 EB等於260B(字節),相當於13億中國人人手一本500頁的書加起來的信息量,5EB則相當於3.7萬個美國國會圖書館的信息量。
數據大爆炸的來源有很多,它既來自新興的物聯網和移動互聯網,也來自傳統互聯網以及廣大經濟社會活動領域。例如,每個人的日常生活都在被數據化,我們瀏覽網頁、登錄社交網絡、使用移動通信工具、進行在線交易等,留下了各式各樣的數字足跡;在遍布全球的工業設備、汽車、電子量表和集裝箱上,有數不清的數據感應器,它們實時測量並傳遞地點、移動、振動、溫度和濕度等信息,甚至能檢測出空氣和水中的化學變化;政府部門在統計監測、審批備案和行政執法過程中,也積累了大量的工商登記、稅收繳納、社保繳費、交通違章等公共數據……
大數據采集、存儲、分析、可視化技術和方法的普及,使得對數量巨大、來源分散、格式眾多的大數據進行分析成為可能。因此,大數據首先是一種技術進步,這種進步繼而推動了人類認識世界和改造世界能力的進步,帶來了大知識,創造了大價值。
一天能產生多少數據?
MBAonline網站發布的一張題為“互聯網的一天”的信息圖顯示:
. 每天有2 940億封電子郵件發出,如果這些是紙質信件,在美國需要花費兩年的時間處理。
. 每天有200萬篇博客文章在網上發布,這些文章相當於美國《時代周刊》刊發770年的總量。
. 每天有2.5億張照片上傳至社交網站臉譜網,如果把它們都打印出來,摞在一起有80個埃菲爾鐵塔那麼高。
. 每天有86.4萬小時的視頻被上傳至視頻網站Youtube,不間斷播放則需98年。
. 每天有1.87億個小時的音樂會在流媒體音樂網站Pandora上播放,如果一台計算機從公元元年就開始播放這些音樂會,到現在還沒完沒了地接著放。
. 累積起來,互聯網一天之內產生的信息總量可以裝滿1.68億張數字多功能光盤。
大知識
大數據能為人類帶來大知識,即通過對海量數據進行分析,以一種前所未有的方式獲得深刻洞見。例如,2009年甲型H1N1流感爆發時,與習慣性滯後的官方數據相比,穀歌成為一個更有效、更及時的指示標。他們通過分析5 000萬條美國人最頻繁檢索的詞條,例如“哪些是治療咳嗽和發熱的藥物”,建立了4.5億個數學模型,並與美國疾控中心在2003~2008年季節性流感傳播時期的數據進行比較,提前兩周預測出流感的爆發時間和傳播路徑。這種工作方式不需要分發口腔試紙和聯係醫院,它是建立在大數據的基礎之上的。基於這樣的技術理念和數據儲備,下一次流感來襲時,世界將擁有一種更好的預測工具預防流感的傳播。
人們通過大數據獲得的知識更快速、更準確、更便捷,而這些在傳統的數據利用思維和技術的基礎上是難以完成的。例如,個人收入對於銀行放貸、社會保障等機構而言是一項關鍵數據。然而,收入又是一個比較敏感的話題,要調查個人收入,不僅過程煩瑣、成本較高,而且還存在瞞報的可能。著名征信機構益百利有一項服務,即通過分析信用卡曆史記錄和美國國稅局的匿名稅收數據,對個人的收入狀況進行較為精準的預測,其預測結果售價不足1美元,而通過傳統的辦法證明一個人的收入狀況要花費10美元左右。
大數據使得組織決策將越來越依賴於數據和分析,而非經驗和直覺。邁克爾·劉易斯於2003年出版的《點球成金》中講述了棒球統計學的一個真實案例。該書的主角比利·比恩是一家棒球隊的總經理,他在一位統計學家的幫助下,盡可能地將球員能力數據化,並以此作為衡量球員能力的唯一標準,而非基於主觀經驗的判斷。通過這套計算機程序和數學模型,比利以有限的預算尋找那些被價值低估的球員,實現了最高的“投入產出比”,創下了美國職業棒球大聯盟百年曆史上的連勝20場的空前紀錄。與那位統計學家相比,專業棒球星探們在挑選球員方麵的精準程度相形見絀。
大價值
我們的日常生活會因為無處不在的大數據應用更加智能便捷。搜索引擎可以為關聯網站排序;智能輸入法能為用戶創建個性化詞典;豆瓣網為我們推薦想要看的電影和圖書;微信自動推送好友信息,幫助我們建立朋友圈;電子郵箱自動過濾含有某些關鍵詞的垃圾郵件;相親網站通過計算用戶的性格、教育背景、職業等匹配程度,提高男女配對成功的概率。
從商業、科技領域到醫療、政府、教育、經濟、人文、社會領域,大數據越來越顯示出非凡的發展潛力和廣泛的應用前景。2011年5月,麥肯錫全球研究所發布了一份專門的研究報告《大數據:下一個創新、競爭和生產率的前沿》,該報告分析指出:大數據可以在任何一個行業內創造更多價值。比如,零售業可以利用大數據增加60%的運營利潤;如果醫療業全麵使用大數據,僅在美國,每年能多創造3 000億美元的價值,同時減少8%的醫療支出;如果運用到公共領域,歐洲政府每年可以減少1 000億歐元的開支,同時可以有效避免偷稅漏稅行為;服務業如果抓住大數據機會,利用個人行為信息刺激消費,可以帶來6 000億美元的營業額。
大數據的創新運用和實時分析還被認為能夠推動失業、饑餓和疾病爆發等社會問題的解決,對於發展中國家的發展而言尤其具有特殊意義。近些年全球糧食、能源和金融危機告訴人們,盡管當今世界信息技術非常發達,但決策者得到有用信息並及時采取行動以保護弱勢群體的速度卻總是慢於危機的出現。為了改變這種狀況,2009年,聯合國啟動“全球脈動”計劃,旨在為各國提供實時數據分析,以便更準確地了解人類福利狀況,降低全球性危機對人類生活的影響。與傳統的統計僅能有效跟蹤中長期發展趨勢相比,“全球脈動”計劃旨在發現新的數字化指標,實時了解情況,並及時為決策者提供反饋。聯合國秘書長潘基文說:“我們事實上是在一個實時信息的海洋中遊泳,手機和數據服務的爆炸式增長意味著世界各地的人在為全球知識庫做出海量的信息貢獻。他們還通過交流、購買、出售和其他日常活動以免費的方式提供信息。私營部門正在研究這些新數據以便實時了解顧客。聯合國也必須為自己的服務對象(全世界那些失去工作、生病、難以養活自己和家人的人)做同樣的事情。”
全球知名谘詢公司高德納報告稱,2012年全球各大企業用於大數據業務的投資額達43億美元,預計2013年將增至340億美元。國際數據公司報告稱,中國大數據建設相關的軟硬件服務2011年市場規模約7 760萬美元,2016年將超過6億美元,未來5年的複合增長率達51.4%,市場規模增長近7倍。
《大數據:正在到來的數據革命》的作者塗子沛深刻地指出,大數據之大,不僅在於其容量之大,而是通過數據的交換、整合和分析,發現新知識,創造新價值,帶來大知識、大科技、大利潤和大發展。
是的,我們已經走到振奮人心的曆史關口。讓我們抓住這場曆史機遇,以引領者的姿態迎接大數據時代的到來。
大數據浪潮中的政府
大數據時代才剛剛開始,然而可以斷言的是,我們的生活方式、工作方式、組織方式與社會形態都將因它發生深刻的改變。正如《哈佛商業評論》所稱,大數據本質上是“一場管理革命”。它不僅是一場技術變革,更意味著一場社會變革,而這種社會變革又伴隨並呼喚著公共管理與公共服務領域的變革。
大數據政府的5大應用
在西班牙首都馬德裏,整合警察、消防、醫療係統,使救援時間大幅度縮短,巡邏隊、消防車、救護車能夠在8分鍾內到達81%的突發事件現場;在新加坡,智能交通綜合信息管理平台在預測交通流速和流量方麵有高達85%的準確率,能通過有效的引導和幹預,顯著提升高峰時段的車輛通行效率;在蘇州市,覆蓋城鄉的信息化防控網絡,在警力與人口配比不足萬分之十的情況下,使打擊處理案件數、刑拘轉捕率、技術支撐率均為全省最高,實現了“以十抵萬”的辦案效率(這些案例將在本書第六章予以詳細介紹)。
在公共管理領域,國內外一些先行者已經在運用大數據,通過多渠道的數據采集和快速綜合的數據處理,增強治理社會的能力,實現政府公共服務的技術創新、管理創新和服務模式創新。大數據在公共管理領域的應用不僅使傳統難題迎刃而解,更成為新時期應對新挑戰、解決新問題的必然選擇。
利用大數據治國,美國政府早已先行一步。奧巴馬認為,數據在未來將是領地權、領海權、領空權之外的另一種國家核心資產。美國白宮科技政策辦公室在2012年3月發布《大數據研究和發展計劃》,同時組建大數據高級指導小組,以協調政府在大數據領域的兩億多美元投資,這標誌著美國把大數據提高到國家戰略層麵,形成全體動員的格局。
根據麥肯錫的報告,大數據技術可為歐盟23個最大的政府公共部門管理活動的成本提供15%~20%的下降空間,在未來10年,每年創造1 500億~3 000億歐元的價值,並將公共部門的預計效率提高0.5個百分點。
對各個國家地區大數據實踐的研究表明,大數據的應用可以從5個方麵提高公共管理水平。
一是實現信息透明和共享,使外部利益相關者(比如公民和企業)和內部利益相關者(比如政府雇員和政府機構)都能提高自身的工作效率,產生積極的經濟社會綜合效益。在上海,自2006年起,中國人民銀行上海總部公開金融信息後,催生了一批金融信息谘詢服務公司,其中有上海聯和金融信息服務有限公司等5家上市公司,拉動了十幾萬人的就業。在北京,交通管理部門公開提供違章信息,也催生了一批提供專業交通信息服務的互聯網公司,它們向用戶提供免費服務,並獲得了可觀的廣告收入。
二是通過評估公共部門的績效,增強內部競爭,激勵工作表現,提高公共建設效率,提升行政服務質量,降低政府的管理成本。例如,荷蘭政府推出了一項名為數字三角洲的工程,通過協調環境部、稅務部門和國家研究所三方的財力、人力和物力,研究如何利用大數據預測,改變防洪策略以及整個荷蘭水資源係統的管理工作。對比傳統的水資源建設項目,這種合作組合預計可以節省高達15%的荷蘭年度水資源管理預算。
三是通過人口細分和定製政策,增強公共服務的針對性,提高工作效率和公眾滿意度,減少開支。在傳統公共管理中,公共部門傾向於為所有公民提供相同的服務。實際上,公眾往往具有非常多元化的個性化需求。德國聯邦勞工局對大量的失業人員的失業情況、幹預手段和重新就業等曆史數據進行分析,使得其能夠區別不同類別的失業群體采取有針對性的手段進行失業幹預,大大提高了公共服務提供的效率。該做法使得該局能夠在每年減少100億歐元相關支出的情況下,減少失業人員平均再就業所需時間,大大改善了失業人員的求職體驗。
四是用政務智能替代或輔助人工決策,在紛繁複雜的數據中自動識別出不一致、錯誤和虛假的信息,減少出錯成本和福利管理中的詐騙,縮小稅收缺口。美國郵政署的計算機係統能夠自動掃描郵件的相關數據(存放位置、派送路線、重量和體積等信息),通過與數據庫中近4 000億條數據的比較,甄別出“郵資欺詐”的郵件。掃描一封郵件隻需要50~100毫秒。一旦檢測出了異常,比如郵資不足或者郵票重複使用等情況,係統就會對信件實施實時攔截,再由分揀人員對其進行特殊處理。有趣的是,該項目竟然由此形成了威懾效應。自2006年開始實施此計劃起,郵資欺詐行為大幅減少。