自從餘額寶誕生以來,就不斷有業內人士提醒投資者,餘額寶僅是一款貨幣基金,和其他貨幣基金一樣隻是基金產品的一種,並不等同於活期儲蓄,理論上依然存在虧損的可能,但不得不承認,餘額寶依然受到了廣泛的青睞。然而這種青睞並不單純來自產品的收益,更是基於大數據的全新的客戶體驗。餘額寶引起的轟動效應,其實隻是會使用大數據分析的互聯網企業在金融行業衝擊傳統銀行業。未來,大數據還將繼續發揮威力,在更多領域打造奇跡。
幫人懷孕的手機軟件
中國國際數碼互動娛樂展覽會,即ChinaJoy,是繼美國E3展、日本東京電玩展之後的又一同類型互動娛樂大展,尤以網絡遊戲為主。每年舉辦一屆,眾多遊戲廠家參展,吸引大量遊戲愛好者前往。2011年的ChinaJoy上,爆出了當時在互聯網上非常流行的一句話“拍一下怎麼了,又不會懷孕”。那麼,你能不能相信,有一款手機軟件,是可以幫人懷孕的?
現在,大家使用的基本都是智能手機,智能手機一般都具備高度的擴展性。用戶可以在智能手機上安裝各種功能的軟件,這些軟件可以幫我們完成很多事情,除了基礎的通信和社交外,還可以實現導航、支付以及與其他硬件的結合等功能。而有一款叫作“Glow”的軟件,居然可以幫人懷孕。
這不是愚人節的玩笑,而是一個很嚴肅的話題。這個軟件自然也不是一個娛樂軟件,而是一個真正嚴肅對待這個問題的軟件。Glow是由PayPal聯合創始人馬克斯·萊文奇恩推出的。在美國,因為治療不孕不育的手術屬於非必需手術,是不受醫療保險保障的。因此,如果美國人要做相關的手術,就要自己承擔巨額的手術費和後續治療費用。馬克斯·萊文奇恩想要人們通過Glow這樣一款免費的手機軟件來幫助自己自然懷孕,而無需借助醫療途徑。這款手機軟件的目的,就是要幫助美國女性在不接受人工受孕或醫學治療的情況下自然懷孕。至於Glow的工作原理,當然是通過大數據分析來預測女性的最佳受孕時段,將懷孕的概率最大化。
這些數據都是通過用戶對指定問題的回答來采集的。每一個使用Glow的女性,在首次使用時都需要回答幾個問題以便讓Glow了解用戶的基本狀況。這些問題並不是精確的科學題目,而隻是對用戶的受孕情況做個大致的了解。
打開Glow後,需要先注冊,也可以通過社交賬號登錄。然後進入了歡迎界麵,會看到3個問題。比如第一個問題是“你是第一次要孩子嗎”,然後可以選擇具體是第幾次。第二個問題是“你們已經試了多久了”,然後可以選擇以周、月或年為單位的不同時段。第三個問題是讓用戶提供3組數據來衡量經期的循環情況。
回答完三個問題後,便是軟件的使用教程,看完教程後這才進入正式的使用界麵。首先Glow會提示你加入自己的“對象”,也就是男方。Glow的基本原理是“用戶激勵製度”,其使用邏輯是按照天排序的,每天都為用戶安排了幾個任務,隻有完成這幾個任務,才能查看明天的任務。這些任務的分配都是基於應用開始時用戶回答的那3組問題的答案而定的。
這些所謂的任務可謂是五花八門。比如,收拾一下你的衣服、晚上跟朋友出去玩遊戲、再等一天去驗孕、寫下5件在你有孩子之前想要做的事、去徹底放鬆10分鍾,等等。整體來說,這些任務都偏重於心理方麵的調整。當然,身體和心理本身就是互相影響的,通過心理調整,人們可以放下心理負擔,輕鬆麵對懷孕這件事,這樣也會間接促進懷孕概率的提高。每完成一個任務,在To-Do列表上打鉤就可以了。這些任務隻是起到了調整作用,最關鍵的一組數據來自每日懷孕的概率。
懷孕的概率是因人而異的,它的算法也是基於應用開始時用戶提交的3組答案。Glow的預測功能,也都是基於這些任務的調整和懷孕概率的預估,來幫助用戶找到最佳受孕時機。在每個月,Glow都依據用戶的具體情況區分了“經期”“受孕期”以及“普通時期”3種,讓用戶對受孕時間段有一個精確的掌握。此外,Glow還設置了一個數據導出功能,可以把應用上存儲的數據導出為PDF文檔並發送至用戶的郵箱。這份PDF既可以用來進行自我診斷,也可以當作醫生問診的重要材料。
還有一個叫作Ovuline的軟件也有同樣功效。這款軟件基於數據分析,目標是讓女性通過非傳統的方式提高受孕的概率,如基礎體溫製圖法。Ovuline允許與女性受孕相關的各種數據的手動輸入,如基礎體溫、子宮頸液分析、排卵測試結果、生理症狀、情緒狀況,以及睡眠、體重、營養攝入和日常活動等因素,還支持一些自我量化的電子設備,方便女性收集各類數據。
這款軟件從2012年6月份推出以來,與服務相關的數據量已經達到250萬份之多,這些數據對於正確預測是至關重要的。它利用了機器學習方法和大量數據,建立了專門的算法來更精確地預測最佳懷孕時間。
當然,更重要的問題是這方法到底管不管用。Ovuline軟件開發人說,公司已經收到上千封用戶感謝郵件,她們在使用這項服務後都成功懷孕了。有時候一天可以收到10~15封郵件。一個與成功受孕率相關的有趣數據是,懷孕的用戶平均在成為Ovuline會員60天內受孕,而美國的平均速度是4~6個月。
現在,各種功能的軟件都在手機、平板電腦等移動設備上出現,它們能夠利用大數據實現很多以前完全無法想象的功能,這些軟件的大數據分析應用讓我們不得不讚歎大數據的應用麵之廣和功能之神奇。
十五、傳統企業的大數據
小錢包做大事情
相對商業領域來說,數據分析在體育領域還是一個比較新潮的詞彙。利用尖端的科技,我們通過強大的計算機去分析大量數據,預測賽事策略的贏率、運動員的潛力甚至是買賣一支隊伍。整個過程裏,大數據都能幫上很大的忙:既能幫忙選擇合適的球員,更能在這個過程中節省不少資金。
這些都是有事實作為證據的。比如,著名的體育統計學家比爾·詹姆斯、奧克蘭運動家球隊的總經理比利·賓以及和他相關的圖書電影都是和通過分析數據觀察運動員或者運動隊實際表現有關的。
大數據時代,我們聽說不少有關數據的神話。這些神話都說明,數據至上的思考方式將帶來很高的回報,這裏有個例子也是如此。邁克爾·劉易斯在2003年出版了《點球成金》(Moneyball)一書,這本書記錄了低預算的奧克蘭運動家隊是如何利用經過分析的數據和晦澀難解的棒球統計學來解決囊中羞澀的問題的。他們不是使用數據分析找到更多的錢,而是通過數據分析讓錢花在該花的地方。數據分析的目標是在盡可能利用最少資源的情況下讓自己的球隊表現更出色,讓球隊經理以更低的成本交易到重要的球員,而開除掉那些薪水高而回報低的球員。通過體育管理和研究人員提供的冰冷數據製定戰略,而不是相信直覺或者早就過時的比賽計劃。
在布拉德·皮特主演的電影版《點球成金》去年被搬上銀幕以前很久,深度的數據分析就已經成為棒球領域中的標準。不僅在棒球領域是這樣,英國足球聯賽等其他體育項目中也是如此。大數據的思維方式正在被人們接受,各行各業的人們都在利用大數據分析開展工作。
一些交友網站也經常會仔細查看其網站上列出的個人特征、回應和交流信息,用來改進其算法,從而為想要約會的男女提供更好的配對。在整個美國範圍內,以紐約市為首的警察部門也正在使用計算機化的地圖以及對曆史性逮捕模式、發薪日、體育項目、降雨天氣和假日等變量進行分析,從而試圖對最可能發生罪案的“熱點”地區作出預測,並預先在這些地區部署警力。
聯合國則推出了名為“全球脈動”的新項目,希望利用大數據來促進全球經濟發展。聯合國將進行所謂的“情緒分析”,使用自然語言解密軟件來對社交網站和文本消息中的信息作出分析,用來幫助預測某個給定地區的失業率、支出削減或是疾病爆發等現象,其目標在於利用數字化的早期預警信號來提前指導援助項目,以阻止某個地區重新陷入貧困等困境。
不僅如此,大數據似乎對文化也產生了影響。一個資深數據分析師說,很長一段時間,他的朋友們對他的工作都是一無所知的,而且也完全沒有興趣。而現在,他們似乎對“數據分析”變得好奇起來,會問他這項工作到底是幹什麼的。這名分析師們認為,《點球成金》是促成這一變化的原因之一,但實際原因遠非如此簡單。不過,很顯然的是,文化已經發生了改變,現在人們的想法是,數字和統計學是有趣的,是一種很酷的東西。
大數據還影響了一些我們想不到的領域,比如社交網絡的運作方式的研究。在20世紀60年代,哈佛大學的斯坦利·米爾格拉姆利用包裹作為研究媒介,進行了一項與社交網絡相關的著名實驗。他將包裹寄給美國中西部地區的誌願者,指導他們如何將包裹帶給波士頓的陌生人,但不能直接交付;參與實驗者如果想要通過郵寄方式來交付包裹,那麼一般因為擔心安全,郵寄的目標對象都會是他們認識的人。最後結果表明,一個包裹換手的平均次數相當之低,僅為6次左右。這是對所謂“小世界現象”的經典闡釋,據此形成了“六度分隔”這麼一個流行詞。而到了現在,社交網絡研究的內容涉及如何采集龐大的數字化數據集合,用來闡釋網絡上的集體化行為。這種研究的結果表明,你認識但不經常聯係的人——在社會學中被稱為“弱關係”——是職務空缺小道消息的最佳來源,原因是與關係親密的朋友相比,這些人在略有不同的社交世界中穿行,因此能看到你和你最好的朋友們所無法看到的機會。
從點球成金的商業運營一直到社交網絡的學術研究,大數據每時每刻都在發揮著巨大作用。利用好大數據,不僅能幫助人們做出正確的決策,更能節省不少開銷。
防疲勞駕駛的嚐試
交通事故目前已經成為“世界第一害”,而中國是世界上交通事故死亡人數最多的國家之一。數據顯示,2009年,中國汽車保有量約占世界汽車保有量的3%,但交通事故死亡人數占世界的16%。2009年,全國共發生道路交通事故造成67759人死亡、27.5萬人受傷,直接財產損失9.1億元;2010年和2011年,交通事故造成死亡人數分別是65225和62387人,已經連續十餘年居世界第一。
同樣被這個問題折磨的,還有日本。2013年1月到9月,日本因為交通事故死亡的人數達到3074人。盡管數字在逐年減少,但一次出現多名死者的悲慘事故仍無法杜絕。比如,2012年4月在京都府龜岡市發生的造成10名小學生死傷的乘用車事故,以及在關越高速公路造成7人死亡的高速觀光巴士事故仍然令日本人記憶猶新。這兩起事故的罪魁禍首均為疲勞駕駛。
為了防止此類悲慘事故再次發生,一些日本企業開始行動,準備通過大數據來防治疲勞駕駛。它們嚐試通過收集並分析行駛信息及圖像數據,將危險行駛的征兆製成圖形來使用。大數據在逐步提供提高行車安全的新方法。
2013年11月,它們開始運行以運輸公司為對象的新型車輛運行管理係統。該係統利用了安裝在卡車上,用來記錄速度、發動機轉速、位置信息等行駛信息的數字行車記錄儀,和在行駛時錄下車內外圖像的汽車黑匣子所收集的數據。
以前,這些數據和影像需要在卡車返回營業所之後轉移到個人電腦上。然後,由運行管理人員確認當天的數據,並用於駕駛員考勤管理及指導燃效改善。但因為隻能在車輛行駛之後確認數據,所以無法防患於未然。利用大數據,則可以實時察覺並躲避危機。運輸公司的新服務能以無線方式將各種行駛數據即時發送給數據中心。這些數據存儲在雲上,運輸公司可經由互聯網確認車輛運行情況。然後,這些海量的曆史行駛數據將被分析,並用於對疲勞駕駛的征兆進行建模。
數據分析將把不自然的速度變化與車身晃動、連續駕駛時間、是否處在容易打瞌睡的高速公路上等多種信息結合起來,建立反映打瞌睡征兆的行駛模式。如果在行駛過程中出現了與該圖形接近的情況,係統就會判定駕駛員在打瞌睡,並自動以語音向駕駛員發出警告,同時還可向運行管理人員自動發送郵件。
在這裏要發揮重要作用的是圖像數據。新服務不僅可以通過拍攝車外的景象掌握是否在安全行駛,在車內也可捕捉駕駛員的行為和表情並加以數據化。這些都對提高行駛數據的分析精確性大有幫助。盡管如此,如果車輛行駛中的所有圖像數據全部都發送,則數據量過於龐大,會給通信基礎設施及分析作業帶來負擔,所以現在這項研究的主要內容是如何高效地選出有效圖像並將其保存在數據庫裏。
不僅是疲勞駕駛的防止,自動製動器等多種安全係統的開發也在快速推進之中。如果將這些尖端技術與從多種事故模式獲得的大數據相結合,就能進一步提高精度和性能。很多業內人士認為,2030年以後有望實用化的自動駕駛將集這些技術之大成。作為提高汽車安全性的新王牌,大數據的作用恐怕會進一步增大。
大數據改變籃球比賽
謝東是個籃球迷,每天下午,他在結束一天的辛勤工作後,就會打開電腦,然後觀看NBA的比賽或者經典比賽視頻。NBA,美國第一大職業籃球賽事,也是世界級的運動賽事之一。不僅在美國有很多觀眾,全球範圍內更擁有眾多的球迷,在中國則有近3億的NBA球迷。
謝東聽說過大數據這個神奇的東西,但總覺得大數據離他很遙遠。他沒想到的是,NBA居然可以通過大數據分析來獲勝。NBA通過擴大大數據算法、機器學習技術的應用和新視覺呈現方法的設計,來把數據轉化為有價值的信息,最後“幫助優秀的團隊獲得勝利”。
在籃球比賽中,投籃地點和拿下前場籃板的概率存在著非常微妙的關係:球員每遠離籃板一英尺,拿下前場籃板的概率就會降低1%。但這個概率不是一直降低,到三分線時,概率又突然變大;此外,那些沒有投中的球裏,有90%可以在距離籃板11英尺的範圍內拿下。
這不是誰胡編濫造出來的數據,也不是哪個老教練的經驗之談,而是美國南加州大學的兩位和NBA毫無關係的教授的論文結論。正是這篇論文,讓他們在2012年麻省理工斯隆體育分析大會上獲得了最佳研究論文獎。而這一切,都要歸功於我們在2013年已經耳熟能詳的一個詞——大數據。
許多NBA的粉絲都知道,早在2010—2011賽季,諸如小牛、凱爾特人、馬刺和火箭等球隊的場館都被聯盟裝上了內置芯片的攝像頭。這些攝像頭分布在場館的6個角落,會以每秒25次的頻率對球員和裁判還有球進行動作追蹤,並進行數據反饋。等到2012—2013賽季,使用這些攝像頭的球隊已經達到了15支。
上麵提到的兩位教授之一對這些攝像頭追蹤到的數據進行了記錄並建模分析,從而得出了上麵提到的結論。數據化似乎已經成為運動場上不可逆轉的趨勢。在此之前,NBA已經決定掏錢為每支球隊裝上這套係統,同時將這些信息選擇性地通過NBA TV和NBA.Com傳達給觀眾們。球隊成員們則開始苦惱,因為他們不知道這些數據能用來做什麼。兩位教授的研究似乎正好解決了這個問題。在獲獎後,聯盟和一些球隊便對他們非常關注。於是兩位教授成立了一個公司,要把這件事從理論研究拓展到真正的商業行為上來。
現在,他們做的事就是把這些運動追蹤攝像頭捕捉到的數據收集起來,通過機器學習和分析,向球隊提供包括比賽、練習甚至觀眾觀看等方麵的建議。但是,他們最有價值、也最困難的地方,在於識別、分析之後的視覺呈現。
他們會有一個軟件係統,可以對不同的數據進行分析,並通過匹配的可視化工具,讓球員或者教練可以看到最直觀的結果,從而對球員陣容和位置等戰術進行調整。拿籃板球來舉例,這個係統可以統計球運動的位置和落點,並把籃板球最多的區域用最深的顏色標注出來,從而告訴球員應該怎麼在搶籃板時站位;此外,它甚至還可以顯示球員不同擋拆組合的成功概率,為教練的安排提供依據。所有這些技術都來自他們團隊多年的研究,而這個平台已經成了他們的專利。
通過NBA的經驗,我們可以發現,大數據已經滲透到各行各業,隻要你有足夠的想象力,大數據能幫你做任何事情。