“機器深度學習”的未來:讀懂人類的情感
“機器學習”的概念自上世紀50年代出來以來就備受科技界的關注,而近年來“深度學習”逐漸成為機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經網絡,模仿人腦的機制來識別圖像、聲音和文本等數據。
美國科技媒體《連線》雜志網絡版日前發文對“機器深度學習”技術的最新進展進行了總結。以下是文章的主要內容。
在Quoc Le的眼中,世界都是由一系列的數字組成的。“一張數碼照片實際上都是數字,”他說道,“如果將人們所說的話拆分成單獨的音素,那么它們同樣可以被編譯成數字。”如果按照Quoc Le的說法,就可以將這些數字輸入到機器之中,機器能夠讀懂照片和人們所說的話,比如Facebook能夠識別出你的臉,谷歌則能夠聽懂你所說的話。
不過Quoc Le想要走得更遠,他希望能夠研究出一種能將整個句子、整個段落以及各種類型的自然語言轉譯成數字或其它載體的技術,借助這項技術,計算機科學家就可以讓機器也能夠獲得人們看到和聽到的信息。同時,Quoc Le還在探索如何讓機器理解人們的觀點和情緒的方法。
盡管此類技術目前尚處于起步階段,未來還有很長的路要走,但相對于同行而言,Quoc Le要擁有更多供其調配的資源。Quoc Le是“谷歌大腦”(Google Brain)項目的一員,該項目主要從事“機器深度學習”領域的研究,這是人工智能的一種形式,主要用機器來模擬人腦進行數據處理。
現年32歲的Quoc Le一直在谷歌從事語音識別方面的工作,比如Android系統的語音識別功能以及為網絡圖片自動添加標簽等,這兩項工作都需要“深度學習”技術的支持。
除了谷歌之外,Facebook和微軟等互聯網巨頭也都在使用“深度學習”方面的技術,同時百度公司最近也曾在公開場合談及利用這項技術來為客戶提供更為精確的廣告推送服務。不過Quoc Le希望將該技術推向更為廣闊的領域,包括對自然語言理解、機器人以及網絡搜索等。
Quoc Le最近開發出了一項“深度學習”技術,能夠鑒別出網絡上不同的詞匯之間是如何關聯的,谷歌則在自己的“知識圖譜”中融入這項技術,從而幫助其對搜索結果進行知識系統化,讓每一個關鍵詞都能獲得完整的知識體系。
曾經的困擾
Quoc Le上世紀90年代首次接觸到人工智能,但是確實讓他感到煩惱不已,因為當時的機器學習系統非常依賴工程師的手工輸入,盡管機器在一定程度上也具備理解能力,但是卻需要比較繁瑣的操作才能完成。比如當時的機器在照片沒有添加標簽的情況下就無法對其進行識別。
“我們對大量無標簽的數據進行了學習研究,”Quoc Le說道,他曾與“谷歌大腦”項目的創始人之一吳恩達(Andrew Ng)在斯坦福大學共同研究人工智能,“如果未來我們能夠找到一種可行的算法來讓機器對無標簽的數據進行識別,那將有可能會改變整個計算行業,畢竟現在網絡的大部分數據(如Facebook、Twitter和谷歌)都是沒有標簽的。”
這也正是“深度學習”技術未來想要實現的目標。利用數萬臺電腦通過軟件模擬人腦中的神經元網絡,從而讓機器獲得與人類相似的學習能力,比如在某些情況下機器能夠在無需對數據添加標簽的情況下實現自動學習。
谷歌的貓臉識別其實就是“深度學習”技術的典型案例,只不過在經過了長達三年的研發之后,這個項目仍然沒能獲得大的進展。與此同時,大部分商業深度學習系統目前仍然比較依賴人工監控。“盡管貓臉識別技術的實用性很低,”吳恩達說道,“但是我認為這項技術代表是深度學習未來發展的一個方向。”
語言的挑戰
“深度學習”技術需要面臨的另一個挑戰是對自然語言的識別。人類的語言中包含大量的微妙信息,迄今為止科學界還未能找到識別這些微妙信息的方法。比如一個相同的詞匯,在不同的語境或語氣下都會有不同的意思,目前大部分人工智能系統都無法區分這些信息。“機器非常善于處理數據,但是卻無法應付語言符號,”Quoc Le介紹說,“因為語言是一種具備高度象征意義的東西。”
對語言進行識別的關鍵是找到將符號轉譯成數字的方式。“目前我們還沒有找到將語言概念轉變成機器能夠處理的數學結構的方法,”Quoc Le說道,“不過在與Word2Vec工具的幫助下,我們在這方面也取得了一定進展。希望未來我們的機器能夠自動識別發布在網絡上的海量信息。”
“人們未來是不可能隨時隨地監督機器的學習的,”與Quoc Le一起在斯坦福大學攻讀博士學位的理查德索切(Richard Socher)說道,“我們希望未來能夠將監督學習和非監督學習結合起來,這樣機器就能實現許多目前難以想象的事情。”
Quoc Le最近聯合谷歌的幾位同事發表了一篇關于在深度神經網絡研究中使用機器翻譯的文章,其中談到了對“回歸神經網絡”的利用,據了解這可能是目前語言識別領域最為先進的技術。
更強大的“谷歌大腦”
Quoc Le在文章中表示,他們所發現的新方法要優于其它機器翻譯算法,不過這也僅僅是“深度學習”的一個應用而已,未來“深度學習”技術還將會用于網絡上的問題答疑、自動說明以及情感分析等等。
為了充分利用這些先進的算法,谷歌將不得擴充自己的“機器神經網絡”規模,而不是局限在圖像和語音的識別領域。“深度學習”概念的奠基人、目前供職于谷歌的杰夫·韓丁(Geoff Hinton)曾在介紹“谷歌大腦”項目時表示:“就像是鴿子的大腦一樣,雖然它擁有良好的視力,但是任何人都不會與一只鴿子進行對話。”
實際上,即便是腦容量相當小的鴿子,其大腦的計算能力也能夠輕松超越目前世界上最為先進的“機器神經網絡”(包括“谷歌大腦”),而在韓丁加盟谷歌之后,更是宣稱未來要幫助谷歌打造全球最大的“機器神經網絡”來對“深度學習”進行更加全面的研究。