大數據時代,福爾摩斯如何破案
特別視點
作者:楊先碧
小說裏的神探,不管是福爾摩斯還是柯南,都有一個共同的特點,那就是有一個具備強大分析能力的大腦,能夠觀察到細小的證據,並把這些證據關聯起來,從而分析出犯罪事實。
但在現實中,神探不容易出現,罪犯卻天天在行動。
幸運的是,在大數據時代,普通警察都有可能變成神探,甚至能預測犯罪。如果福爾摩斯穿越到現代,他將不必在現場頻繁擺弄他的放大鏡,也許他隻要坐在電腦前,看看電腦屏幕,一個個奇案就可告破!
犯罪分子無處遁形
在互聯網時代,警察破案除了用到傳統的檔案、走訪資料、電話記錄等信息外,還會用到互聯網上出現的信息。所有的這些信息彙集成海量的數據,這些數據如今有了一個更加時髦的身份,那就是“大數據”。當然,大數據不僅僅是換了“馬甲”的資訊,它與傳統的資訊還是有區別的。大數據指的是資料量規模巨大的資訊,往往是在一個較大地域範圍內所出現的所有或某類資訊,它們無法在短時間內利用傳統的方法被人們所利用。
在信息時代,一個犯罪分子要想銷聲匿跡,除非把自己完全絕緣起來,這樣無論警察掌握的大數據有多大,都難以查找到犯罪分子的個人電子信息了。但是,在如今這個信息技術已經滲透到生活方方麵麵的時代,犯罪分子要想不留下任何電子信息,已經是幾乎不可能的事情了。就算犯罪分子不上網、不使用手機、不看電視等,總之不和任何信息設備發生關聯,也可能逃不脫大數據的追蹤。因為犯罪分子不可能長期遠離道路、商店、碼頭、車站等公共場所,一旦出現,就可能被公共的或他人的電子設備拍攝到。
近來,利用大數據成功偵破的有名案例是波士頓連續爆炸案。2013年4月15日,美國波士頓在舉辦馬拉鬆比賽的過程中發生連續炸彈爆炸案,結果導致3人死亡、183人受傷。在案件發生後,警方保留了案發現場附近的所有監控錄像以供比對、查找,波士頓警察局的官員稱“仔細查看了所有錄像的每一幀畫麵”。然後,警察走訪了事發地點附近12個街區的居民,收集可能存在的各種私人錄像、照片,無論它們來自攝像機還是手機。警方還大量收集網上信息,包括像Twitter、Facebook、 Youtube等社交媒體上出現的相關照片、錄像等,而且在這些流量巨大的網站上向公眾提出了收集相關信息的請求。
結果,警方從馬拉鬆賽事沿途錄像中尋覓到嫌疑人的蹤跡,並從錄像中截取出嫌疑人照片,其中包括嫌疑人正麵的清晰影像,並結合其他信息,宣布犯罪嫌疑人為兄弟倆,分別是26歲的塔米爾南·沙尼耶夫和19歲的喬卡·沙尼耶夫。4月19日淩晨,嫌疑人與警方發生槍戰,塔米爾南在槍戰中受重傷,送到醫院後不治身亡,喬卡趁亂逃脫。當日晚間,警方利用公共場所的紅外線攝像機搜集到的數據,準確定位了喬卡的位置,並且迅速包圍。在與警方對峙數小時後,喬卡投降,追捕行動結束。
困惑“現代福爾摩斯”的是如何存儲這些大數據
目前,獲取大數據的渠道主要有兩個:一個是電話公司,一個是互聯網公司。美國國家安全局就長期從電話運營商處獲取通話數據庫,其中包含大量通話數據記錄,例如通話時間與通話時長、相關電話號碼以及移動設備的本地數據等。這套數據庫建立於2001年“9·11”恐怖襲擊事件後不久,而且得到了多家運營商的支持。2006年,《今日美國》雜誌發表文章稱,這套通話數據庫是“世界上規模最大的數據庫”。該數據庫處理著數以十億計的電話記錄數據,有超級計算機和數據分析師專門處理這些數據。