人工智能7項關鍵技術,終于有人懂了
指南:企業使用AI的一個復雜因素是,這個主題包含多個底層技術。 這些技術中的大多數可以執行許多替代功能。 技術和功能的結合非常復雜,表1-1列出了七個關鍵技術,包括每個關鍵技術的簡要描述,以及它們可以實現的一些典型功能或應用程序。 表1-1人類智力。 指南:企業使用AI的一個復雜因素是,這個主題包含多個底層技術。 這些技術中的大多數可以執行許多替代功能。 技術和功能的結合非常復雜,表1-1列出了七個關鍵技術,包括每個關鍵技術的簡要描述,以及它們可以實現的一些典型功能或應用程序。
表1-1人工智能關鍵技術
本文更深入地描述了每種技術及其功能。我還將討論每種技術在商業AI世界中是多么常見。 我的工作是商學院教授(與許多不同的公司合作),但我也是德勤戰略和分析實踐部門的高級顧問,該部門集人工智能咨詢為一體。
以下是對每種技術及其功能的深入描述。
托馬斯·達文波特(托馬斯·達文波特)
資料來源:大數據DT(ID:hzdashujuju)
01~03統計機器學習、神經網絡與深度學習
機器學習是一種將模型與數據自動匹配,并通過訓練模型對數據進行“學習”的技術。 機器學習是人工智能最常見的形式之一。
德勤接觸了250名經理(他們的公司已經在2017年探索AI)“了解認知”調查顯示,58%的被調查公司在其業務中使用機器學習。 它是許多人工智能方法的核心技術,有許多版本。 內部和外部數據的爆炸性增長,特別是這些外部數據,使他們使用機器學習來充分理解這些數據是可行的和必要的。
神經網絡是一種更復雜的機器學習形式,出現在20世紀60年代,并用于分類應用,如確定信貸交易是否欺詐。 它分析基于輸入、輸出、可變權重或“特征”將輸入與輸出關聯起來的問題。 它類似于神經元處理信號的方式,但將其與大腦進行比較有點牽強。
最復雜的機器學習形式將涉及深度學習,或通過許多層次的特征和變量預測結果的神經網絡模型。由于當前計算機體系結構的處理速度更快,這些模型能夠應對數千個特性。
與早期的統計分析形式不同,深度學習模型中的每個特征通常對人類觀察者沒有什么意義。 結果是模型難以使用或難以解釋。 只有34%的德勤調查使用了深度學習技術。
深度學習模型使用一種稱為反向傳播的技術來預測或分類輸出通過模型。 人工智能技術推動了該領域的許多最新進展,從在圍棋比賽中擊敗人類專家到對互聯網圖像進行分類,使用反向傳播進行深度學習。 杰弗里辛頓(GeoffreyHinton),在多倫多大學和谷歌工作,經常被稱為深度學習之父,部分原因是他早期的反向傳播。機器學習使用了數百種可能的算法,其中大多數算法有點深奧。 它們的范圍從梯度增強(一種建立用于解決先前模型錯誤的模型的方法,從而增強預測或分類能力)到隨機森林(模型作為一組決策樹模型)。
越來越多的軟件工具(包括數據機器人、SAS和Google的AutoML)支持自動構建機器學習模型,可以嘗試許多不同的算法來找到最成功的算法。 一旦通過訓練數據找到可以預測或分類的最佳模型,就可以部署它,并可以預測或分類新的數據(有時稱為評分過程)。
除了使用的算法外,機器學習的另一個關鍵是模型如何學習。 監督學習模型(到目前為止,商業中最常用的類型)是使用一組標記為輸出的培訓數據進行學習。
例如,試圖預測銀行欺詐的機器學習模型需要對顯然構成欺詐案件的系統進行培訓。 這是不容易做到的,因為實際欺詐的頻率可能只有十萬(有時被稱為不平衡分類問題)。
監督學習與傳統的分析方法(如回歸分析)在評分模型中的應用非常相似。 在回歸分析中,目標是創建一個模型,該模型使用與輸出相關的一組輸入變量,并且其值已知以預測已知結果。 一旦模型開發完成,就可以用同一輸入變量的已知值來預測未知結果。
例如,根據患者的年齡、體力活動水平、卡路里消耗和體重指數,我們可以建立回歸模型來預測他患糖尿病的可能性。
我們為糖尿病患者或非糖尿病患者建立模型(通常使用所有可用數據來建立回歸模型)。 一旦找到合適的預測回歸模型,它就可以根據一組新的數據(輸入變量達到特定水平的患者的糖尿病可能性)來預測未知的結果)。 后續活動(在回歸分析和機器學習中)稱為評分。
回歸過程與監督機器學習相同,但:
在機器學習中,用于開發(訓練)模型的數據稱為訓練數據,它可以是為訓練目的顯式保留的數據子集;
在機器學習中,通常使用另一個數據子集來驗證訓練模型,并已知該子集的預測結果;
在回歸中,可能不需要使用模型來預測未知的結果,但在機器學習中,結果將被假定;
許多不同的算法類型可以用于機器學習,而不是簡單的回歸分析。
通常很難開發無監督的模型來檢測模式并預測未標記數據中的未知結果。
強化學習是第三種變體,這意味著機器學習系統為每一步目標設定目標并獲得某種形式的獎勵。 它在玩游戲中非常有用,但它也需要大量的數據(在許多情況下,太多的數據對方法不起作用)。
應該注意的是,有監督的機器學習模型通常不會繼續學習。 他們從一組訓練數據中學習,然后繼續使用相同的模型,除非使用一組新的訓練數據來訓練新的模型。
機器學習模型是基于統計的,應該與常規分析進行比較,以闡明其價值增量。 它們通常比基于人類假設和回歸分析的傳統“手動”分析模型更準確,但也更復雜和難以解釋。 自動化機器學習模型比傳統的統計分析更容易創建和揭示更多的數據細節。
考慮到學習所需的數據量,深度學習模型在圖像和語音識別等任務中是很好的(遠遠優于以前對這些任務的自動化方法,并且在某些領域接近或超過人類的能力)。
04自然語言處理
自20世紀50年代以來,理解人類語言一直是人工智能研究人員的目標。 這個領域被稱為自然語言處理(自然語言處理,NLP),包括語音識別、文本分析、翻譯、生成應用程序和其他與語言相關的目標。
在了解認知和調查中,53%使用NLP。 統計NLP有兩種基本方法:統計NLP和語義NLP。2統計NLP基于機器學習,比語義NLP執行得更快。 在性能方面,需要一個大的和ldquo;語料庫和rdquo;或語言系統來學習。
例如,它需要大量的翻譯文本,統計分析表明,西班牙語和葡萄牙語中的Amor在統計上與英語中的love一詞高度相關。 這有點像蠻力,但通常很有效。
語義NLP是近十年來唯一現實的選擇。 如果系統能夠有效地訓練單詞、語法和概念之間的關系,它將是相當有效的。
語言訓練和知識工程(通常是為特定領域創建的知識圖譜)可能會消耗大量的人力和時間。 然而,它需要開發一個知識主題的模型或單詞和短語之間的關系。 雖然很難創建語義NLP模型,但一些智能座椅系統已經在使用這種方法。
NL應以兩種方式衡量P系統性能。 一是看它能聽懂多少%的口語。 隨著深度學習技術的發展,該指標不斷提高,往往超過95%。
衡量NLP的另一種方法是看看它能回答多少種不同類型的問題,或者它能解決多少問題。 語義通常需要NLP,但由于在這一領域沒有重大的技術突破,Q&A和問題解決系統都是特定于上下文的,必須進行培訓。
IBM watson在回答“危險邊緣”問題方面做得很好,它不能回答“命運之輪”問題(財富之輪,綜藝節目),除非它經過訓練,通常是以勞動密集型的方式。 也許未來的深度學習將應用于解決問題,但它還沒有。
基于規則的專家系統
在20世紀80年代,人工智能的主導技術是一個基于一套“if-then”規則的專家系統,當時它開始廣泛應用于商業中。 今天,人們通常認為它不太先進,但2017年德勤(Deloitte“Cognitive”)的研究表明,49%的引入人工智能的美國公司使用了該技術。
專家系統要求人類專家和知識工程師在特定的知識領域構建一系列規則。 例如,它們通常用于保險承保和銀行信貸承保(但也用于一些深奧的領域,如富士咖啡的咖啡烘焙或金寶罐頭湯的湯準備)。
專家系統在一定程度上運行良好,易于理解。 然而,當規則的數量很大(通常超過幾百條),規則開始相互沖突時,它們往往會崩潰。 如果是知識如果字段發生變化,更改規則將是困難和耗時的。
基于規則的系統自其早期全盛以來沒有太大的改進,但保險和銀行等大量使用這些系統的行業仍然需要新一代基于規則的技術。 研究人員和供應商已經開始討論“自適應規則引擎”,引擎將基于新數據或規則引擎和機器學習的組合不斷修改規則,但它們尚未被廣泛使用。
06物理機器人
每年安裝20多萬臺工業機器人,物理機器人是眾所周知的。 在美國和ldquo;了解認知和研究調查中,32%的公司在一定程度上使用了物理機器人。 他們在工廠和倉庫中進行起重、重新定位、焊接或組裝產品等。 歷史上,這些機器人在仔細的計算機程序控制下執行特定的任務。
然而,機器人越來越能夠與人類一起工作,更容易訓練,只是根據預定的任務移動機器人的部件。 他們也變得更加聰明,因為其他的人工智能能力被嵌入到他們的大腦和研發系統中。 隨著時間的推移,我們在人工智能的其他領域看到的改進很可能被納入物理機器人。
07機器人過程自動化
機器人過程自動化(RoboticProcessAutomation,RPA)技術就像人類用戶在執行結構化數字任務時按照腳本或規則工作。 關于RPA是否屬于人工智能/認知技術的集合,存在爭論,因為因為它不是很聰明。 然而,由于RPA系統如此受歡迎、自動化和日益智能化,我認為它們是人工智能世界的一部分。
有些人稱它們為數字勞動力和rdquo,與其他形式的人工智能相比,它們便宜、易于編程和透明。 您可以理解甚至開發RPA。 如果您可以操作鼠標,理解流程圖,并理解一些if-then業務規則,這些系統也比其他方法更容易配置和實現,例如用編程語言開發自己的程序。
RPA并不真正涉及機器人,它只是服務器上的一個計算機程序。 它依賴于工作流程、業務規則和信息系統的集成和ldquo;表示層和rdquo;來作為系統的半智能用戶工作。
有些人在電子表格中比較RPA和宏,但我不認為這是一個公平的比較,RPA可以執行更復雜的任務。還與業務流程管理(Business Process Management,BPM)工具進行了比較,該工具可能具有一些工作流功能,但通常旨在記錄和分析業務流程,而不是實際自動化。
一些RPA系統已經具有一定的智能。 他們可以觀察和研究人類同事的工作(例如。 回答常見的客戶問題),然后模仿他們的行為。 另一些則將過程自動化與機器視覺相結合。 與物理機器人一樣,RPA系統正在慢慢變得更加智能,其他類型的AI技術正在被用來指導他們的行為。
我分別描述這些技術,但在現實中,它們越來越結合和整合。 是的目前,商業決策者必須知道什么技術可以完成什么任務。
全球公司(Global Inc.)首席信息官克里希納·內森(Krishna Nathan)指出,他2018年的主要優先事項之一是“幫助我的利益相關者了解人工智能可以和不能這樣做,以便我們能夠以正確的方式使用人工智能;。 也許在未來,這些技術將是混合的,以便這樣的理解將不再是必要的,甚至是可行的。
作者:Thomas H.Davenport(Thomas H.Davenport),巴布森學院(Babson College)信息技術與管理杰出教授,曾獲哈佛大學哲學博士學位,曾在哈佛商學院,芝加哥大學和波士頓大學任教。 曾任埃森哲戰略變革研究所所長,他擁有廣泛的研究領域,包括信息和知識管理、重組和信息技術在商業中的應用。
本摘要是由出版商授權的“數字時代的企業AI優勢:IT巨人的業務實踐”匯編而成。