2013突破性科學技術之“小手機大數據”
從廉價手機上收集來的信息經過分析之后可以幫助科學家了解人們的日常行為和旅途,甚至可以弄清楚疾病的傳播。
坐在哈佛公眾健康學院的辦公室里的流行病學家卡洛琳·巴克伊,指著電腦屏幕上的肯尼亞地圖中的一個電話信號塔,說道:在對抗瘧疾的過程中,從手機信號塔收集到的數據對于流行病的控制起到了關鍵作用。
她和同事在研究數據的過程中發現人們在Kericho這個地方的信號塔附近發送短信和撥打電話的次數是其他區域的16倍,而且非洲維多利亞湖東北側的一個地方發送短信和撥打電話的次數也是其他地區的3倍,而這些地區都被相關國家的衛生部門認定為是瘧疾傳播熱點。就在這些區域內,蚊子瘋狂地傳播者瘧疾。通過對信號塔的數據分析,他們繪制了瘧疾傳播路徑圖,意味很明顯,“患虐記者所經之處必然會引發更多人患上瘧疾。”
卡洛琳目前正在構建一個全新的預測模型,其中就包括了這一路徑圖。找到病源并非難事,更難的是如何借助信號塔和移動通訊公司的數據,分析出帶病患者何時到來何時離開,去了何處。卡洛琳說:“雖然也有人從事人員出入境、患者醫療登記工作,但是在非洲,這樣的數據有跟沒有沒什么區別。所以為了解決流行病傳播的問題,我們想到了之前從來沒有人用過的辦法。”
即數據挖掘,從移動通訊企業那里獲取機主的使用記錄,并配合政府部門發布疾病預防公告。“我們不可能顧及到所有的瘧疾病人,但是卻可以根據瘧疾的傳播路徑來告誡、提示人們。”
卡洛琳和丈夫南森·伊高合寫的一篇針對肯尼亞1500萬手機用戶的調查論文于去年在《科學》雜志上發表。一個是流行病專家,一個是手機數據專家,兩人共同在非洲進行了18個月的調查,通過手機數據對民族分裂、疾病傳播等多個項目進行了研究,他們的研究結果不僅見解獨到,而且可以切實地幫助人們擁有健康的生活。
伊高說:“這就是流行病學的未來。想要滅絕瘧疾,就得利用這種方法。”
嶄新的一頁
全球一共有60億部手機,這些手機每天都會產生無數的數據,包括位置、商業活動信息、搜索記錄和社交記錄等信息。其中,有50億部手機分布在發展中國家,而且絕大部分手機是價格便宜、功能簡單的“破”手機,只能打電話、發短信。但是手機的功能并不會影響其“大數據”功能,通過信號塔的跟蹤,可以大致地描繪一個人的生活軌跡,這不僅對流行病傳播的研究有益,還可以用來研究就業趨勢、社會壓力、貧窮狀況、交通等。
對于許多貧困的國家來說,通過廉價手機所收集到的數據比詳細、實時但極少的信息更有用。麻省理工學院人類動力學研究室主任Alex Pentland說:“在發展中國家,不可能開展有效的普查,也得不到詳細的交通信息,政府甚至都沒有數據收集設備。但是,有一個東西確實隨處可見的,那就是手機。在過去幾年,手機迅速普及,就連發展中國家也幾乎人手一部。”數據分析的軟件和方法都已經普及,為數據挖掘掃清了道路。
高效利用手機數據的案例是2010年的海地地震。2010年1月,海地發生地震,造成至少20萬人死亡,研究人員根據從海地第一大通訊運營商那里獲得數據,分析了地震前42天和地震后158天的數據,發現在地震發生后三周內有63萬人逃離首都太子港,而且在拿到數據之后的12小時就計算出了有多少人跑到了霍亂爆發區。因為運營商的數據比較詳細,幾乎可以做到實時監控。更關鍵的是,研究人員還利用這些數據開發出了災害預測模型,發現當海底人遇到災難時,更偏向去自己曾經去過的地方避難。
初現規模
去年,著名移動運營商Orange發布了非洲象牙海岸5個月內的手機通話記錄,包含25億條信息,這對于數據專家來說,是一座金礦。全球有接近100個研究機構拿著這些數據在做研究,手機數據挖掘初具規模。與此同時,利用數據做生意和隱私保護問題也開始出現。然而為了讓數據挖掘工具發揮最大的功效,光有通話記錄是不夠的,還需要更詳細的數據,比如說小規模的調查問卷。
卡洛琳希望通過挖掘手機數據來完全消滅瘧疾,“這就是流行病學的未來,如果我們想滅絕瘧疾,就得利用這種方法。”