2016年:互聯網交出控制權 深度學習顛覆一切
據連線雜志網站報道,在澳大利亞的西海岸,生物學家阿曼達·霍奇森(Amanda Hodgson)控制無人機飛向印度洋上的高空。這位儒艮專家使用無人機幫助他們觀察瀕臨滅絕的研究對象。不過霍奇森和她的團隊并沒有能力來篩查所有拍得的照片。在45000張照片中尋找儒艮的身影,對于未經過訓練的眼睛來說太難了。她的解決之道是把這工作交給深度神經網絡來完成。
神經網絡是種機器學習模型,大眾所熟知的“人臉識別”便是其應用之一。此外,手機的智能語音助理之所以能理解你說的話,谷歌搜索引擎之所以能呈現準確的搜索結果,也都有它在背后的功勞。通過對人類大腦神經網絡進行模仿,這些掃描數學模型通過對大量數據的分析來習得專項功能。前文所述霍奇森博士便使用這種技術在數千張航拍照片中尋找儒艮的蹤跡。霍奇森的神經網絡基于TensorFlow打造,這是谷歌研發的第二代人工智能學習系統。
由于儒艮習慣在水面以下捕食,所以檢測這些動物的任務需要格外的精確度。“它們的身跡很容易跟水面眩光相混淆。”她說。現在她的神經網絡可以識別散布海面80%的儒艮。
該項目尚處在早期階段,但它卻展示了深度學習在剛過去的一年里廣泛的影響。深度學習在2016年風光無限。這個古老的技術被賦予新的活力,幫助谷歌在世界矚目的圍棋大戰中擊敗人類。這在幾個月前還是幾乎不可能的事。AlphaGo(“圍棋”的英文名字即叫“Go”)僅僅是最突出的例子。一年過去,深度學習不再只是科技極客的小眾玩寵,轉而走向了風光臺面。谷歌、Facebook、微軟和亞馬遜籍著它從里到外煥然一新。反過來這些互聯網巨頭的推波助瀾——通過開放源代碼和提供云服務——也加速了深度學習的流行。
新翻譯
去年,神經網絡在Google Photo等應用上將圖像識別技術提升到新臺階,Google Now和微軟小娜也因它的加持實現了更優異的語音識別效果。今年,輪到了翻譯界被改造。機器翻譯實現了大躍進。九月份,谷歌推出“神經機器翻譯”服務。這種翻譯完全通過神經網絡運行,將翻譯誤差率降低了55%~85%。
谷歌通過大量現有翻譯的集合數據來對神經網絡進行訓練。培訓材料既包括舊版翻譯軟件差強人意的翻譯,也包括由人類語言專家提供的信雅達式翻譯,后者無疑對提高素材質量有加分。深度學習擁有克服缺陷的神奇魔法:盡管培訓材料質量參差不齊,但神經網絡最終能夠實現遠超低水平的翻譯水準。
雖然谷歌的首席工程師麥克·舒斯特(Mike Schuster)坦誠他們的造物還遠非完美,但它仍然不失是一個突破性成就。由于該服務完全基于深度學習運行,未來改進工作也將輕松許多。開發人員可以集中精力從整體上對系統做出改進,而不是像過去那樣再為小部件糾結。
谷歌之外,微軟也在朝同一方向努力。本月,微軟也發布了自己翻譯應用的新版本。號稱能夠在九種語言之間實現即時翻譯。微軟副總裁沈向洋(Harry Shum)表示微軟翻譯的系統同樣完全運行在神經網絡上。這意味著微軟翻譯的水平也有迅速提升的可能。
新聊天
2016年,深度學習也在聊天機器人領域大顯身手。其中最引人注目的當數Google Allo。Allo于今年秋天推出,通過對用戶文本和照片的分析,能夠提供即時的智能回復。其功能的實現基于谷歌此前一項名為“智能回復”(Smart Reply)的技術,該技術與電子郵件技術在很大程度上有相似之處。
Allo不僅僅是一個聊天app,它還能在你毫無察覺中提升你的谷歌搜索體驗。程序幫助搜索引擎理解你的需求,從而使搜索返回的結果更合乎你的需求。根據谷歌搜索產品經理大衛·奧爾(David Orr)的說法,如果沒有深度學習,程序就無法實現回答。“使用神經網絡是我們找到的唯一方法。”他說。“我們必須使用我們所掌握的最先進科技。”
盡管有其強項,但進行真正的對話仍然讓神經網絡力不能及。造出這種完全以假亂真的“聊天機器人”還有很長的路要走。當下,谷歌、Facebook和其他地方的研究員正在積極探索深度學習技術,以期有朝一日能實現宏偉目標。可以確定的是這些技術探索將會帶來和“語音識別”、“圖像識別”和“機器翻譯”一樣偉大的進步。“聊天機器人”就是下一個技術前沿。
新數據中心
谷歌在深度學習的路上停都停不下來。今年夏天,在打造了名聲大噪的AlphaGo之后,Google DeepMind實驗室領導人杰米斯·哈薩比斯(Demis Hassabis)表示他們還開發了一個AI來管理谷歌全球計算機數據中心網絡。使用一種被稱為“深度強化學習”(Deep Reinforcement Learning)的技術,AI能夠智能管理服務器中冷卻風扇的開關和溫度控制。總之一個數據中心超過120項功能全由它掌控。
彭博社報道,這個AI的部署幫助谷歌節省了數億美元。2014年谷歌花6.5億美元收購DeepMind,現在已經完全撈回了成本。目前DeepMind正計劃在這些計算設施外安裝更多傳感器,收集更多數據來訓練AI到更高的水平。
新的云計算
當互聯網巨頭紛紛用新技術武裝自己時,他們也通過自家服務將之獻給大眾。2015年底,谷歌宣布將TensorFlow開源。僅僅一年內,這個一度專有的軟件造福了像阿曼達·霍奇森這樣的千萬大眾。與此同時,谷歌還與微軟、亞馬遜一道在云計算服務中提供自己的深度學習技術,讓任何個人或組織開發者使用它們來構建自己的程序。“人工智能服務”可能成為這三個網絡巨頭的最大業務。
在過去的十二個月中,技術的火熱讓領域內的人才變得炙手可熱。李飛飛(Fei-Fei Li)是AI研究領域技術領袖級人物,谷歌聘請她來管理其AI云計算組織。亞馬遜則聘請卡內基梅隆大學教授亞歷克斯·斯摩納(Alex Smolna)坐鎮其云計算帝國。科技巨頭竭盡全力招攬人才,彼此毫不相讓。所幸他們競爭產生的研究成果都會為公眾所用,這倒不是壞事。
隨著AI的演變,計算機科學家的角色也正在發生改變。傳統意義上能夠編寫代碼的人變的不那么重要,新趨勢需要的是更多能夠訓練神經網絡的人。后者所需的技能非同以往,與自己開發東西相比,它更像是誘導數據產生結果。谷歌這些大企業不僅積極招徠新式人才,并且也在將已有員工往這方向引導。未來AI將會使每個人生活中的技術變革一新。