開放政府數據,激活社會創新
觀察
作者:老鬼孫定
自2009年提出Data.gov以來,為推進“大數據國家戰略”,美國政府舉措不斷,體係日漸完備。
2012年美國政府首先開放了388529項原始數據和地理數據,涵蓋了農業、氣象、金融、就業、人口統計、教育、醫療、交通、能源等大約50個門類。數據彙集了從家庭、企業能耗趨勢分析到全球實時地震通知等,甚至還可以查詢從好奇號火星車發回來的火星天氣數據。
2013年,美國政府宣布“大數據的研究和發展計劃”,旨在提高美國從大型複雜數據中提取知識和觀點的能力。美國大學開始培養數據科學家。此舉使美國成為全球首個將大數據上升到國家戰略層麵的國家,也是數據科學家人才儲備啟動最早的國家。
今年3月,美國宣布將美國國家海洋大氣局、美國國家航空航天局、美國地質調查局以及其他聯邦機構的氣象數據上線開放,希望通過這項計劃能吸引更多的社會機構和研究團體參與到氣候研究中來,進而降低極端天氣事件給美國帶來的損失。
今年6月,美國食品藥品監督管理局宣布開放醫療和健康大數據,先期已開放了“300萬份藥物不良反應報告”的數據。這些是2004~2013年間提交給FDA的藥物不良反應和醫療過失記錄。分析人士稱,“此舉將使美國新藥研製時間縮短3至5年,美國臨床健康開支每年減少165億美元,為美國醫藥產業每年創造1000億美元的價值。”
數據科學最重要的基礎在於定義了數據自然(data nature)。數據自然是所有存入信息係統的數據總集合,包括數字、字符、音視頻以及計算機程序等。在數據自然的視角下,人、社會、大自然及其曆史,都將轉變成數據自然,人類同時生活在大自然和數據自然之中。人類將通過探索數據自然來更加深入地了解大自然,了解社會和人類行為。
數據科學認為,與大自然一樣,數據自然也有未知、複雜、多樣等屬性。要在數據自然中獲得收益,需要采用係統性的數據科學方法。有一種說法是數據和石油一樣,是資源。沒有探礦、采油、煉油技術和工程師,石油點燈都嫌煙大。與此類似,沒有數據科學和數據科學家,數據的用處有限。
在大數據時代,用數據科學的方法,透過探索數據自然,為人類提供了更為本質、更為深刻、更為迅速認知把握自然、社會的全新途徑。我們的生產生活方式將因大數據時代數據科學所帶來的新知識、新觀點和新方法而產生深刻變化。
美國“大數據國家戰略”正是基於數據科學最新成就的、麵向未來的戰略舉措。
當今社會,政府是最大的數據擁有者。美國政府開放數據,相當於為公眾提供免費共享的數據自然,允許社會在其上創新,發展數據科學,開發數據應用,創造新的商業模式。這與卓別林電影《淘金記》中的場景頗為類似。當年美國開放西部,鼓勵民間發展淘金科技,獲得商業利益。
美國大數據國家戰略的意圖十分清晰:通過政府開放數據,激活社會創新,不斷突破大數據的核心技術,開發軍事、科研、商業等領域的實際應用,獲得軍事、商業優勢,鞏固並強化美國的全麵戰略優勢。
馬雲說,我們正在進入一個變革非常快速的時代,世界正從信息產業時代走向數據產業時代。在這樣的時代,落實“發展信息經濟,建設網絡強國”的國策,有必要重新審視我們的戰略規劃,有必要盡快做出中國大數據戰略的頂層設計。
數據和石油一樣,是資源。