先來做一個小測驗。當閱讀開始前,先停下來思考這麼一個問題:哪部分是術語“大數據”中最為重要的?是大,還是數據?還是二者都一樣重要,或是都一樣不重要?花一分鍾的時間去思考這個問題。假如已經有了自己的答案,那就開始閱讀接下來的內容。
既然答案已經有了,那就來看看哪個是正確的?顯然,正確的答案應該是最後一個,事實上在大數據中,“大”和“數據”都不重要。其中最重要的是企業該如何去駕馭這些大數據。對大數據進行分析,以及在此基礎上采取的業務改進才是最為關鍵的。
事實上,大數據本身是沒有任何價值可言的。即便是一個人比另一個人擁有更多的數據,這也不代表什麼。任何一個數據集,它們或大或小,本身都沒有價值可言。如果不懂得如何去使用收集來的數據,那這些數據不會比地下室裏的垃圾更有用。要是不投入環境或者是付諸使用的話,數據的意義就不在了。任何大量或是少量的大數據該如何體現自己的威力呢?要怎麼去分析這些數據呢,又該如何去洞察或是采取什麼樣的行動呢?這些數據又要如何來改進業務呢?
很多人在閱讀了眾多炒作大數據的文章之後就相信之所以大數據要比其他數據有優勢,就在於它的容量大、速度快和多樣性,這種說法並不準確。在很多大數據當中,相比以往數據會存在更多毫無價值或是價值很小的數據。一旦大數據被精簡到實際需要的容量時,它們所呈現出來的就不是大數據了。事實上這也不重要,無論是它被精簡還是保持原本龐大的模樣,這些關係都不大,最重要的是處理它的方式。所以說使用數據要比起它的容量更為重要。
大數據龐大的規模並非人們所關注的,包括它們能帶來巨大的內在價值也非關注的事實。最大的價值還在於分析的方式,以及采用什麼樣的方式來改進自己的業務。
在人們閱讀一本書的時候,關鍵點的第一個是大數據的大數據量,並且要承認大數據也是數據中的一種。隻不過這並非企業興奮的理由所在。這些數據使用時的新穎且強大的分析方式才是企業注意力集中的地方。作為社交網絡應用的Facebook和微博,都構建了關聯普遍用戶的行為數據。人們在網絡上瀏覽網頁、購買商品、遊戲休閑原本是不關聯的。當智能手機推廣普及之後,網絡的行為越來越碎片化了。假設沒有一定的關聯,就很難去分析和利用這些數據。社交網絡提供給用戶統一的借口,讓無論是玩遊戲還是買商品的客戶可以輕鬆地把碎片化的信息發到網絡上。就像是一個用戶行為數據連接器的角色一樣,微博把所謂網絡上用戶的行為,完整地關聯起來,畫出一幅生動的網絡生活圖景,把用戶的偏好、性格、態度等特征真實地反映出來,而這當中就是最為充分的商業機會。
彼此關聯的數據價值要遠大於孤立的數據。可是在當下數據孤島是很常見的。個人計算機中的文件一般都會以某種類目來存放,內容和內容之間沒太強的聯係。企業之間也是如此,很多部門之間都壁壘林立,似乎每個人都願意去保護自己的數據,從而形成“數據割據”的局麵。隻要是處在數據孤島中,大數據所潛在的價值是很難被挖掘出來的。