別被“大數據”忽悠了
專欄
作者:包冉
自打NetFlix的《紙牌屋》火了以後,“大數據”這個ICT專業詞彙,一時間成為全球影視行業的時髦字眼兒。其實,各種分析文章翻來覆去,不過那幾條:利用複雜而先進的算法,進行海量數據挖掘,獲取用戶偏好和興趣關聯,從而確定導演、演員;還有一票技術係統方案提供商,很快修訂了營銷PPT,提供出“一攬子的大數據和雲內容解決方案”。
事實上,透過離散的數據、分析關聯的規律、挖掘潛在的商機——類似數據應用早已有之,譬如20年前的那個經典營銷案例,“啤酒與尿布擺放在一起,能夠有效提升銷量”。
大數據,不是數據挖掘的升級和演進,而是透過全新的數據處理模式,將數據變成信息資產。一言以蔽之,大數據追求數據本身的價值,這需要如下幾個前提——
前提一:數據本身有直接的交易價值。以NetFlix為例,其核心商業模式是用戶訂閱,而非廣告;也就是說,NetFlix擁有的是按月付錢的“客戶”,而非免費登陸瀏覽的“用戶”。最樸素和最複雜的商業模型,都會將掏錢的客戶和不掏錢的用戶區別對待,前者的價值優勢不言而喻。
問題是,在中國,從視頻網站到電視頻道,大家擁有的數據具備這種價值嗎?電影票房,貌似具備這種直接交易的價值,但可惜還有第二個前提。
前提二:數據需要依附於統一賬戶的體係支撐。數據是死的,產生數據的人是活的,統一賬戶就是嫁接二者的橋梁。隻有將用戶或客戶納入統一賬戶的管理體係,才能有效追蹤用戶的信息、行為和信用。Google的Gmail、Facebook的ID、騰訊的QQ和微信號、電信運營商的手機號,都是統一賬戶及衍生開發的典範。
在開放平台時代,統一賬戶的威力已覆蓋至整個互聯網。據JanRain調研數據顯示,至2013年第一季度,美國網民在第三方網站進行身份驗證時,80%都選擇Facebook ID或Google的Gmail。顯然,“無主”的數據是沒有意義的。問題是,你的數據都能找到“主人”嗎?
前提三:數據需要在公共雲平台上彙聚,才能產生聚變和裂變的效果。NetFlix,擁有全美三分之一互聯網流量、全球40個國家和地區的3600萬訂戶;但其實沒多少屬於自己的服務器,因為他們95%的計算和存儲,都來自對亞馬遜AWS雲服務的租用。同樣,他們也沒買企業級的軟件係統,幾乎完全基於開源軟件體係,建構了自己的Netflix OSS(開源軟件平台)。
那麼,NetFlix的核心價值在哪裏?在一幫頂級工程師利用開源軟件和公共雲平台,開發出的複雜而高效的算法,從而實現高效率的流量調度、客戶經營和商業判斷。在這裏,公共雲平台和開源軟件的意義,是互聯網時代生產大分工的必然趨勢;也隻有在這一開放環境中,才能誕生匹配全球規模大數據的識別與加工能力;隻有這些能力,才能產生數據價值的聚變和裂變。
問題是,中國的“雲”貌似不少,可有真正意義上的、開放的公共雲平台嗎?本土的應用開發,又能否在現行政策與法規限製下,順暢地與Amazon、Google等全球雲平台相對接呢?
所以,不要被“大數據”的光環忽悠,老老實實做好基礎的“數據挖掘”工作,利用互聯網開放平台將用戶逐步納入統一賬戶的管理體係,利用日益發達的第三方支付係統推動“用戶”向“客戶”轉變——這對於普遍缺乏數據運營基因的中國影視業來說,足夠實用、也足夠挑戰了。