第一章
大數據的一天
工作的白天
早上7點,你在浪漫悅耳的G大調鋼琴曲中醒來,又是一個嶄新的早晨。床頭那個貓頭鷹造型的鬧鍾傳出的旋律讓起床變成一件輕鬆開心的事情。
這個鬧鍾是妻子從大數據家居展賣會上淘回來的小玩意。每天,鬧鍾的鈴聲都會根據你的心情自動切換。很多年前,人們也許難以想象,像心情這樣難以捉摸的東西如何不用自己表達就能被外界所捕捉。然而,這個貓頭鷹卻能通過分析前一天你與朋友的網上聊天內容,或是對你最近發布的微博狀態進行情緒計算,猜測出你這段時間的喜怒哀樂和音樂偏好。昨天一位朋友在朋友圈裏上傳了一段貝多芬鋼琴曲,優雅動聽,你回複了一個“讚”,所以今天早上聽到這段經典的G大調便不足為奇了。
你哼著音樂起床。房間感知到了你起床的信號,窗簾徐徐拉開,金色的陽光灑進臥室。咖啡的香味從廚房飄來,廚房電器剛剛自動做好了一頓美味的早餐。
你一邊吃著早餐,一邊看著電視新聞。電視節目都是個性化定製、智能推送的,現在正在報道的是流感爆發。主播對著動態地圖指出了當前受流感影響的地區,分析了流感的傳播路徑、未來發展趨勢,就像播報天氣一樣。在地圖上,公共衛生機構抗擊流感的部署一目了然。讓人放心的是,因為控製及時,這次流感並沒有帶來大範圍的不良影響。
另一則新聞是關於台風襲擊的情況以及救災工作的進展。通過綜合數據平台,氣象、民政、交警和醫院等幾十個部門形成了聯動機製,大大縮短了救援時間。一些漁民被台風困在了海上,減災辦通過數據定位,幫助他們找到了最近的避難港口。“幸虧我們現在有這些技術手段,不然多耽擱一分鍾,受災地區民眾的危險便多增加一分。”你不由得發出這樣的感慨。
電視提醒你,該出發上班了。於是你整理好公文包,吻了一下熟睡中的妻子和孩子的額頭,走出了家門。
你按下手機上的一個按鈕,新買的汽車從車庫徐徐駛出,開到了你的眼前。這是一輛自動駕駛的汽車,是你升職後給自己的獎賞。剛買這輛車時,你的父親還有些擔心,怕不夠安全。後來才發現,這種擔心完全沒有必要。與人類駕駛相比,這輛自動駕駛的汽車不僅可以探測到360度範圍內的一切事物,包括它們的距離、速度和溫度,而且知道如何避開其他司機的視覺盲點,預知各個方向車輛的情況。你開玩笑地跟父親說:“這輛汽車比開過很多年車的老司機還要可靠,因為它不會疲勞、酒駕抑或是賭氣發火。”
汽車駛出小區的大門,經過一個路口時,它忽然停了下來,原來它探測到20米外有一個滾動的皮球。接著便衝出一個小孩,絲毫沒有意識到可能麵臨的危險。待確認小孩離開車道後,汽車又平穩地啟動了。
很多年前,你還是孩子時,父親買了家裏的第一輛小汽車。那時經常出現交通擁堵和剮蹭事故,為了上班不遲到,至少需要提前一個小時出發。現在,這輛自動駕駛的汽車在還沒有上路時就已根據從家到公司這段路程上所有的道路狀況、紅綠燈時間和曆史數據,提前規劃好了一條最省時的路線。它貼心地提醒你,今天的車程預計為22分鍾。它甚至還能與其他自動駕駛的汽車“打招呼”,與交通信號燈“交談”,使你不會把時間浪費在堵車和等紅綠燈上。
8點半,你準時到達了非凡公司。這是一家信用評級公司,你作為公司引進的首位數據科學家,已任職5年。
5年前,非凡公司的主要業務是幫助銀行完善信用評級係統。過去,大多數銀行對申請人進行信用評級的標準比較單一,無法對申請人做出全麵評估。為了解決傳統評級方式的缺陷,作為部門骨幹的你與同事們通宵達旦地研究,希望建立一個全麵的大數據信用評級模型。你們從各渠道搜集關於申請者的信息,例如,社交網站上的數據,用於對那些很少或者根本沒有信用記錄的人進行評估,還有在信用卡網站上停留的時間可以推測一個人的性格和還款誠意。你們對這些海量信息進行分析,得出了超過7萬個可對申請人行為做出測量的指標,而整個信用評級過程在5秒內就能完成。