用大數據識別對抗抑鬱症
視野
作者:元垚
如果你收到這樣一條私信:親,係統發現您可能患有抑鬱症,建議您到醫療機構就診。你大概會立刻惱火,感覺屏幕上有雙眼睛不斷地窺視著自己。
哈工大“社會網絡與數據挖掘”聯合實驗室與國內社交媒體數據挖掘公司“宏博知微”正在開發這樣一個模型——基於社交媒體的數據,對用戶的抑鬱症傾向進行識別。實驗室在新浪微博近億用戶中識別出幾百名重度抑鬱症患者,隨後由醫學機構對此人群進行人工診斷,判定出200名抑鬱症患者,模型的診斷準確度達到83%。
“有些表現出抑鬱症傾向的用戶除了喜歡用小號來表達痛苦情緒,還有群落聚集趨勢,他們會同時關注很多同類人群,有的甚至會習慣每天到已經自殺的用戶微博上評論‘今天你還好嗎’”?實驗室負責人、哈工大博士於霄介紹。這個項目最早的靈感就來自微博網友“走飯”、“sienna 賽娜”的自殺事件。於霄認為,“這些人的微博非常觸目驚心,負麵情緒隱含在每一條中,如果通過數據識別這一群體,讓其親友能早點幹預,也許可以避免悲劇發生。”
根據醫療機構的數據,我國目前有超過 2600 萬人患抑鬱症,地市級以上醫院對抑鬱症的識別率不到 20%,僅有 9% 的抑鬱症患者在自殺前曾到精神科或心理谘詢機構就診。大數據的手段或許能成為抑鬱情緒臨床識別之外的新興識別方法。
通過模型,他們發現存在抑鬱傾向的微博用戶與普通用戶發博時間有明顯差異,這部分人群發博高峰在 23 點,夜間活躍度比普通用戶平均約高出 30%。他們的微博關鍵詞為:死、抑鬱症、生命、痛苦、自殺。
實驗室把這些數據提供給北京、上海的一些精神病醫院,雖然得到一些專家的認可,但是僅憑社交信息下診斷,在醫學手段上還不夠嚴謹。中山三院精神科副主任醫師陶炯就認為:“利用大數據來識別抑鬱症患者,一定程度上反映了用戶的情緒,可以作為對這個群體初篩的一種方式。但是每個人都會有情緒發泄的時候,如何甄別這些是否‘假陽性’,要確診還需要醫生麵談。”
因此,這個模型的商業價值並不在於“診斷”本身,而是進一步與能為這部分人群提供幫助的專業機構共同研究抑鬱傾向用戶情緒幹擾方案。對於普通用戶,看到自己的性格特征、人際交往等通過數據挖掘整理被羅列出來,必然會引起反感甚至侵犯隱私的控訴。但是對於那些與醫療機構有過接觸的患者來說,醫生把社交媒體的數據當作治療方案的依據之一,是可以接受的。
同時社交網絡也可以為抑鬱症患者推送正麵的信息,美國Allied Health World的一項調查數據顯示,接近25%的用戶能找到與自己“同病相憐”的人,希望從他們那裏獲得鼓勵。如果模型能發現並滿足這類需求,對於抑鬱症的治療也是有正麵意義的。
醫療保健行業,從安裝在智能手機上的個人健康應用,到診所和醫院裏醫生使用的電子健康記錄儀,都已經由科技主導,那麼用科技手段幹預抑鬱情緒的識別及治療也是值得探索的領域。