綜藝報(2013年11期)-正文別被“大數據”忽悠了

別被“大數據”忽悠了

專欄

作者：包冉

自打NetFlix的《紙牌屋》火了以後，“大數據”這個ICT專業詞彙，一時間成為全球影視行業的時髦字眼兒。其實，各種分析文章翻來覆去，不過那幾條：利用複雜而先進的算法，進行海量數據挖掘，獲取用戶偏好和興趣關聯，從而確定導演、演員；還有一票技術係統方案提供商，很快修訂了營銷PPT，提供出“一攬子的大數據和雲內容解決方案”。

事實上，透過離散的數據、分析關聯的規律、挖掘潛在的商機——類似數據應用早已有之，譬如20年前的那個經典營銷案例，“啤酒與尿布擺放在一起，能夠有效提升銷量”。

大數據，不是數據挖掘的升級和演進，而是透過全新的數據處理模式，將數據變成信息資產。一言以蔽之，大數據追求數據本身的價值，這需要如下幾個前提——

前提一：數據本身有直接的交易價值。以NetFlix為例，其核心商業模式是用戶訂閱，而非廣告；也就是說，NetFlix擁有的是按月付錢的“客戶”，而非免費登陸瀏覽的“用戶”。最樸素和最複雜的商業模型，都會將掏錢的客戶和不掏錢的用戶區別對待，前者的價值優勢不言而喻。

問題是，在中國，從視頻網站到電視頻道，大家擁有的數據具備這種價值嗎？電影票房，貌似具備這種直接交易的價值，但可惜還有第二個前提。

前提二：數據需要依附於統一賬戶的體係支撐。數據是死的，產生數據的人是活的，統一賬戶就是嫁接二者的橋梁。隻有將用戶或客戶納入統一賬戶的管理體係，才能有效追蹤用戶的信息、行為和信用。Google的Gmail、Facebook的ID、騰訊的QQ和微信號、電信運營商的手機號，都是統一賬戶及衍生開發的典範。

在開放平台時代，統一賬戶的威力已覆蓋至整個互聯網。據JanRain調研數據顯示，至2013年第一季度，美國網民在第三方網站進行身份驗證時，80%都選擇Facebook ID或Google的Gmail。顯然，“無主”的數據是沒有意義的。問題是，你的數據都能找到“主人”嗎？

前提三：數據需要在公共雲平台上彙聚，才能產生聚變和裂變的效果。NetFlix，擁有全美三分之一互聯網流量、全球40個國家和地區的3600萬訂戶；但其實沒多少屬於自己的服務器，因為他們95%的計算和存儲，都來自對亞馬遜AWS雲服務的租用。同樣，他們也沒買企業級的軟件係統，幾乎完全基於開源軟件體係，建構了自己的Netflix OSS（開源軟件平台）。

那麼，NetFlix的核心價值在哪裏？在一幫頂級工程師利用開源軟件和公共雲平台，開發出的複雜而高效的算法，從而實現高效率的流量調度、客戶經營和商業判斷。在這裏，公共雲平台和開源軟件的意義，是互聯網時代生產大分工的必然趨勢；也隻有在這一開放環境中，才能誕生匹配全球規模大數據的識別與加工能力；隻有這些能力，才能產生數據價值的聚變和裂變。

問題是，中國的“雲”貌似不少，可有真正意義上的、開放的公共雲平台嗎？本土的應用開發，又能否在現行政策與法規限製下，順暢地與Amazon、Google等全球雲平台相對接呢？

所以，不要被“大數據”的光環忽悠，老老實實做好基礎的“數據挖掘”工作，利用互聯網開放平台將用戶逐步納入統一賬戶的管理體係，利用日益發達的第三方支付係統推動“用戶”向“客戶”轉變——這對於普遍缺乏數據運營基因的中國影視業來說，足夠實用、也足夠挑戰了。