機器人是怎麼工作的呢?喂牛的時候,機器會向奶牛的食槽裏投放食物,吸引奶牛前來就餐。在奶牛高高興興地吃著東西的時候,擠奶機會通過激光掃描找到奶頭的位置,並將擠奶裝置自動吸附到奶牛的乳頭上開始擠奶。擠完奶後,擠奶裝置會自行清洗和重置,等待下一頭牛到來。其他場景都與之類似。
要讓一個傳統農場正常運作是一件非常複雜而且瑣碎的事。牛需要喂、需要睡覺、需要擠奶,需要觀察它們的胃口好壞、體重變化,有時還需要治病。當好一個農場主不是一件容易的事情,他們需要麵對的變數之多遠遠超出我們的想象。
大數據改變了這一切。而且,還不隻是改變了這一切。這套設備會收集很多數據,包括奶牛的身份、體重、產奶量,以及擠奶所需的時間、需要喂多少飼料,甚至牛反芻需要多長時間,等等。
機器還會從牛產的奶中收集數據。每一個乳頭裏擠出的奶都需要查驗顏色、脂肪和蛋白質含量、溫度、傳導率及體細胞讀數。一旦某一頭牛被查出有什麼問題,農場主的手機就會收到通知。
像這樣的農場在西方發達國家越來越多,傳統農業正在接受移動互聯、智能技術和大數據浪潮的洗禮。對傳統農業生產者,這將產生不小的衝擊,但也會帶來巨大的機遇。
未來,農作物從播種到收獲的全過程一係列數據都將被各種設備記錄下來,並用於分析。例如,通過地上的傳感器和智能灌溉係統,農場主們能夠最大化農作物的產量。灌溉係統能夠精確了解哪種植物在什麼時候需要什麼養料,需要的量是多少。這就保證了不會供給過多或是補充太少,在施肥上節省了很多花銷,同時增加了農作物的產出。為了了解更多的土地狀況,增加土地產出,傳感器可以安裝在地麵上,通過算法告知農場主們什麼時候在什麼地方種植哪種農作物。算法也能夠告知農場主最佳的耕作時間和收獲時間,以此獲得最大的產出。大數據將完全改變傳統農業的麵貌。未來的農民,接觸更多的是各種現代儀器和設備,而不是鋤頭和農藥瓶一類。
大數據將能夠幫助增加作物產量,提高收獲的效率,降低各種損失與風險,還能夠預測天氣、預警瘟疫、預估農產品價格走向,等等。幾乎在生產、加工、銷售的每一個環節,都會有大數據分析形影相隨。
未來的農業,係統監測到了壓力,就會盡可能地采取措施減輕牲畜們的緊張感。特製項圈能夠幫助擁有大片土地的農場主們實時了解牛群的狀況。它幫助農場主們追蹤牛群,通過智能手機定位牛群的位置。傳感器也能告知農場主們牛群的精神狀況,是否需要采取措施。
大數據徹底改變了傳統的農業產業化。對於農場主而言,投資大數據的成本很高,但是運用大數據技術所獲得的潛在收益是巨大的。
附錄:大數據發展簡史
1887—1890年
為了解決人口普查這個複雜的統計難題,美國統計學家赫爾曼·霍爾瑞斯發明了一台機器來讀取卡片上的洞數。該設備讓美國用一年時間就完成了原本耗時8年的人口普查活動,由此在全球範圍內開啟了數據處理的新紀元。
1935—1937年
美國總統富蘭克林·羅斯福利用社會保障法開展了美國政府最雄心勃勃的一項數據收集項目,IBM最終贏得競標,即需要整理美國的2600萬名員工和300萬雇主的記錄。
1936年
蓋洛普領導的美國輿論研究所在總統大選的民意調查中擊敗對手,把民意調查推進到科學化的曆史新階段。
1943年
一家英國工廠為了破譯二戰期間的納粹密碼,讓工程師開發了一係列開創性的能進行大規模數據處理的機器,並使用了第一台可編程的電子計算機進行運算。該計算機被命名為“巨人”。為了找出攔截信息中的潛在模式,它以每秒鍾5000字符的速度讀取紙卡——將原本需要耗費數周時間才能完成的工作量壓縮到了幾個小時。該工廠破譯德國部隊前方陣地的信息以後,幫助盟軍成功登陸了諾曼底。
1955年
IBM的兩名雇員辭職創辦了全世界第一家獨立的專業軟件公司:ComputerUsageCompany;國會議員摩斯提出《信息自由法》草案,倡導製度化的信息公開;IBM推出了第一款商用硬盤存儲器,每兆字節存儲量的單價約為6000美元。
1961年
美國國家安全局,一個剛成立9年就擁有超過12000位密碼學家的情報機構,在間諜飽和的冷戰年代,麵對超量信息,開始采用計算機自動收集處理信號情報,並努力將倉庫內積壓的模擬磁盤信息進行數字化處理。僅1961年7月份,該機構就收到了17000卷磁帶。
1965—1966年
美國政府一項秘密研究計劃將所有政府記錄進行格式轉換——包括7.42億條稅單和1.75億套指紋——轉換為磁式計算機磁帶存放在唯一的國家數據中心,盡管該計劃後來因為遭受公眾抗議而被取消了。該計劃激發了1974年的隱私法案,這一法案限製聯邦機構分享個人信息的行為。
1989年
英國計算機科學家蒂姆·伯納斯·李在20世紀60年代提出通過開創一個叫作萬維網的超文本係統在全球範圍內利用互聯網實現共享信息。
1996年8月
“我們正在開發一台超級計算機,它每秒鍾內的計算量將要比人工手算耗時3萬年的計算量還要大。”——美國總統比爾·克林頓。
1997年
美國宇航局研究員邁克爾·考克斯和大衛·埃爾斯沃斯首次使用“大數據”這一術語來描述20世紀90年代的挑戰:超級計算機生成大量的信息。在考克斯和埃爾斯沃斯案例中,模擬飛機周圍的氣流。是不能被處理和可視化的。其數據集通常之大,超出了主存儲器、本地磁盤,甚至遠程磁盤的承載能力。他們稱之為“大數據問題” 。
2002年
在“9·11”襲擊後,美國政府為阻止恐怖主義已經涉足大規模數據挖掘。前國家安全顧問約翰·波因德克斯特領導國防部整合現有政府的數據集,組建一個用於篩選通信、犯罪、教育、金融、醫療和旅行等記錄來識別可疑人的大數據庫。一年後國會因擔憂公民自由權而停止了這一項目。
2004年
“9·11”委員會呼籲反恐機構應統一組建“一個基於網絡的信息共享係統”,以便能快速處理應接不暇的數據。到2010年,美國國家安全局的30000名員工將攔截和存儲17億年電子郵件、電話和其他通訊信息。與此同時,零售商積累關於客戶購物和個人習慣的大量數據,沃爾瑪自吹已擁有一個容量為460T字節的緩存器——比當時互聯網上的數據量還要多一倍。
2007——2008年
隨著社交網絡的激增,技術博客和專業人士為“大數據”?概念注入新的生機。“當前世界範圍內已有的一些其他工具將被大量數據和應用算法所取代。”《連線》的克裏斯·安德森認為當時處於一個“理論終結時代”。一些政府機構和美國的頂尖計算機科學家聲稱,“應該深入參與大數據計算的開發和部署工作,因為它將直接有利於許多任務的實現”。
2009年1月
印度政府建立印度唯一的身份識別管理局,對12億人的指紋、照片和虹膜進行掃描,並為每人分配12位的數字ID號碼,將數據彙集到世界最大的生物識別數據庫中。官員們說它將會起到提高政府的服務效率和減少腐敗行為的作用,但批評者擔心政府會針對個別人進行剖麵分析並與分享這些人的私密生活細節。
2009年5月
奧巴馬政府推出data.gov網站作為政府開放數據計劃的部分舉措。該網站的超過4.45萬量數據集被用於保證一些網站和智能手機應用程序來跟蹤從航班到產品召回再到特定區域內失業率的信息,這一行動激發了從肯尼亞到英國範圍內的政府相繼推出類似舉措。
2009年7月
應對全球金融危機,聯合國秘書長潘基文承諾創建警報係統,抓住“實時數據帶給貧窮國家經濟危機的影響”。聯合國全球脈衝項目已研究了如何利用手機和社交網站的數據源來分析預測從螺旋價格到疾病爆發之類的問題。
2010年8月
“自人類文明開創之期到2003年,全球範圍內的信息量總計5艾字節。而當前,每隔兩天都會積累這麼多新信息。”——穀歌CEO埃裏克·施密特。
2010年
每兆字節存儲量的單價下降到1美分左右,聯邦政府的年度信息技術預算為784億美元,是全世界最大的信息技術消費者,其擁有2094所數據中心、約10000多個信息管理係統、2000個域名和24000個網站;聯邦政府舉辦了第一次開放政府數據的國際會議,英國、澳大利亞、巴西等十幾個國家的100多名代表參加了會議。為應對大數據的挑戰,聯邦政府正式提出了“大數據戰略”。
2011年2月
掃描兩億年的頁麵信息,或4兆兆字節磁盤存儲,隻需幾秒即可完成;IBM的沃森計算機係統在智力競賽節目《危險邊緣》中打敗了兩名人類挑戰者,後來紐約時報配音這一刻為一個“大數據計算的勝利”。
2012年3月
美國政府報告要求每個聯邦機構都要有一個“大數據”策略,作為回應,奧巴馬政府宣布了一項耗資2億美元的大數據研究與發展項目。國家衛生研究院將一套人類基因組項目的數據集存放在亞馬遜的計算機雲內,同時國防部也承諾要開發出可“從經驗中進行學習”的“自主式”防禦係統。中央情報局局長戴維·彼得雷烏斯將軍在發帖討論“阿拉伯之春”機構通過雲計算收集和分析全球社會媒體信息之事時,不禁驚歎我們已經被自卸卡車倒進了“數字塵土”中。
2012年7月
美國國務卿希拉裏·克林頓宣布成立一個名為“數據2X”的公私合營企業用來收集統計世界各地的婦女和女童在經濟、政治和社會地位方麵的信息。“數據不隻是測量過程——它能給予我們啟發,”她解釋說,“一旦人們開始對某個問題實施測量時,就更傾向於采取行動來解決它們,因為沒有人願意排到名單的最底端去。”