鋼鐵俠的AI助理賈維斯,我們還要多久才能擁有?
本文看點
在要在現實生活中擁有鋼鐵俠的AI助理賈維斯,自然語言處理(NLP)就是出發點。作為人工智能的子領域,NLP能夠縮減人與機器之間的交流差距。
機器翻譯作為NLP的第一步,經歷了從基于規則、基于語法、基于短語至基于神經網絡的變革,迎來了商業規模翻譯領域的質變飛躍。
NLP不僅應用于機器翻譯,還應用于垃圾郵件的辨別、智能虛擬助手、聊天機器人和情緒分析。而NLP的未來在于實現機器的深度學習,到那時,擁有賈維斯不再是夢。
原文來自Hackernoon,作者Ida Jessie Sagina
“賈維斯,你在嗎?”
“隨時待命,先生。”
托尼斯塔克隨后給出了一系列命令,穿上了他超酷的鋼鐵俠套裝。
賈維斯甚至警告斯塔克先生,要先完成TB量級計算才可以嘗試實際飛行,但托尼卻自以為是地回答道:“賈維斯,有時侯,你必須在走路前學會跑步”。
這看起來像是與私人助理的普通對話,對吧?
但賈維斯并不是人類,而是一個能夠流暢對話,并且全天候提供服務的智能AI助手。
如果你想要在現實生活中重建賈維斯,自然語言處理(下稱NLP)將是你要考慮的第一個技術。
NLP屬于AI的子領域,它使機器理解語音或文本形式的人類語言,進而減小了人與機器之間的交流差距。
如今市面上已經有了好幾個虛擬助手,例如Siri和Cortana,我們是否已經做好了推出賈維斯的準備?讓我們回顧一下NLP在過去幾十年中的使用,以及它未來的發展方向。
NLP的起源
艾倫圖靈于1950年發表的論文《計算機械與智能》中提出了一個革命性的問題:“機器可以思考嗎?”20世紀40年代就在機器翻譯中瞥見了NLP,如今流行的“圖靈測試”(也被稱為模仿游戲)為機器理解復雜的語言學創造了可能。
為了滿足圖靈的標準,機器必須先理解人類的自然語言,才能構建出類似人類的智能回應。
隨后,有許多人試圖通過圖靈測試。ELIZA、SHRDLU和PARRY都NLP領域的先驅。在NLP研究短暫停滯之后,由美國政府創建的自動語言處理咨詢委員會(ALPAC)停止了對NLP研究的資助,NLP在20世紀80年代才迎來了“統計革命”的新領域。
NLP自20世紀80年代以來的發展非常有趣,當時統計方法的應用增長顯著。
機器翻譯時代
機器翻譯可以說是教授機器人類自然語言的起源。Google翻譯如今的簡單易用可以追溯到20世紀30年代,當時機器翻譯開始申請專利。
1954年見證了機器翻譯的曙光,科學家進行的Georgetown-IBM實驗將60多個俄語句子自動翻譯成了英語。在80年代末期,統計型機器翻譯(SMT)搶走了規則型翻譯的風頭。
當時IBM的Candide Project項目人員研究了加拿大議會辯論報告中的法語和英語文本語料庫,放棄了語言學規則,選擇計算概率。
同時,日本研究團隊也開啟了基于語料庫的翻譯或基于示例的機器翻譯(EBMT)的研究,該團隊曾使用示例或語料庫翻譯新單詞。
直到1994年,Systran的機器翻譯可以在幾個CompuServe聊天論壇中獲齲1997年,AltaVista發布的BabelFish(最古老的在線翻譯之一,后來由Yahoo接管)可以在網頁瀏覽器上進行36組語言的翻譯。
2001年,研究人員開始提倡基于語法的機器翻譯(翻譯語法單位而非單詞)。2003年至2005年,研究建立了基于短語的機器翻譯,這也在2006年推動了Google翻譯。Bing和Yandex于2009年和2011年推出了自己的翻譯器。
Google為機器翻譯悄悄研究了十年循環神經網絡,之后Google翻譯運用了經龐大的數據集訓練的神經網絡,迎來了商業規模翻譯領域的質變飛躍。
Google翻譯的引擎,被稱為Google神經機器翻譯系統(GNMT),在2016年就可以輕松翻譯10,000組語言。
自NMT出現以來,人們一直在嘗試混合翻譯方法,利用短語或基于規則的機器翻譯來彌補NMT的不足。
這是垃圾郵件嗎?
被廣泛使用的電子郵件作為當前一種數字通信形式,常伴隨著垃圾郵件的問題。最初,人們使用IP黑名單和郵件標題檢查來識別垃圾郵件,但是這些方法在單獨部署時很容易被繞開。
因此,對電子郵件內容以及非文本元素進行分析的需求隨之提高,這意味著NLP進入了垃圾郵件領域。1998年,有人提出使用Bayesian方法來過濾垃圾郵件。2002年,同一戰線的保羅格雷厄姆提出了一項商業上可行的垃圾郵件處理計劃。
Bayesian方法是統計NLP的最早方法之一,與通常的基于文本的過濾器不同,它可以自動從可能為垃圾郵件的內容中學習新詞,并使用其不斷擴大的詞匯量更好地對郵件進行分類。
Bayesian過濾器通過仔細檢查郵件標題內容、詞組和短語,降低了誤報率,并提高了識別垃圾郵件的準確性,運用于許多現代電子郵件客戶端。
為了進一步減少垃圾郵件的數量,Google 在2015年宣布要在垃圾郵件過濾器中運用神經網絡,使垃圾郵件率降到0.1%。
嗨,Siri,今天天氣怎么樣?
NLP領域的重要運動有1962年IBM的Shoebox以及20世紀70年代的Harpy,它們代表數字語音識別的前身。直到20世紀80年代中期,Hidden Markov被認為是語音建模中的高效方法。
IBM開發的Watson在問答節目Jeopardy!中取得了勝利。2011年,智能虛擬助手勢頭強勁,蘋果在同年的iPhone 4S上推出 Siri。
2014年,Amazon在智能揚聲器Echo中引入了Alexa。Google Assistant(最初稱為Google Now)和Microsoft的Cortana也緊隨其后。
AI語音助手迅速入駐應用程序和設備(例如Google Home)。截止2019年1月,Amazon銷售了超過1億臺配備Alexa的設備。
聊天機器人的降臨
虛擬助手有了一個近親聊天機器人,由AI驅動,可以通過通訊App和在線聊天來進行近似人類的對話。
ELIZA(1966)、PARRY(1972)和試圖講笑話的Jabberwacky(1988)之類的聊天機器人,提出了人機對話的概念。隨著計算機語言和自然語言處理技術的進步,AI聊天機器人現在可以通過了解用戶意圖、提供相關輸入來與用戶進行順暢的對話。
因AI聊天機器人能夠提供全天候服務,解決客戶投訴等簡單問題,客戶服務得到了極大的提高。到2021年,由NLP支持的AI聊天機器人可以完成全球15%的客戶交互服務。
察覺言語背后的情緒
除了單純的文本分析之外,研究人員還在努力識別高度非結構化內容以及語境意義。波龐等人于2002年完成了早期關于辨別網絡上電影評論的消極還是積極的計算機語言技術(Naive Bayes、SVM和MaxEnt)的研究。
隨后,波龐和莉蓮李在2004年發表論文,探討了將“主觀性”(表達作者自己的觀點和特定詞語的相關性)帶入情感分類的根本影響。
這些文章,以及彼得T特尼的文章,在NLP領域掀起了一場革命,因為網絡上日益增長的語言交流(社交媒體、博客、新聞推送)都是為了理解人們的想法而開發的。
情感分析通常也被稱為觀點挖掘。路透社等信息巨頭都開發了自己的內部情感引擎,來衡量千家公司的新聞情緒,以改善交易決策。
直到2009年,Google根據他們的研究論文和專利,改進了搜索引擎。這些研究論文和專利探索了情緒分析,以總結基于情緒的評論。
2010年,Twitter的信息也被用于分析,以評估英國大選期間的公眾輿論。一家名為Linguamtics的公司檢查了超過13萬個Twitter帳戶。
盡管人們對分析和結果持懷疑態度,但它足以使科技界興奮不已,導致他們也想對2012年的美國總統大選進行嘗試。據2015年報道,Intel和IBM等行業的領導者使用情緒分析技術來解讀員工的情緒。
表情符號、諷刺以及語言的復雜性給情緒分析帶來了挑戰,然而各公司還是迅速投資情緒分析技術,以理解公眾情感、擴大客戶體驗并收集消費者見解。
NLP的未來在哪里?
除了本文提到的NLP的主要應用之外,NLP也可以解決主題建模、文檔摘要和字符識別等問題。
當前NPL場景主要以深度學習為主。在回歸神經網絡的驅動下,基于深度學習的NLP正在使用卷積神經網絡進行實驗。
而該算法已被證明對情感分析、問題解答系統和機器翻譯在一定程度上有效。深度學習模型還用于加速或整合NLP任務,包括詞性標注、語法分析和命名實體識別。
人們對NLP越來越興奮,也許十年后,賈維斯就會成為現實,而你就可以去拯救世界了。