從人工智能到統計機器學習
當前位置:首頁 > 軟件開發 > 人工智能 > 正文
從人工智能到統計機器學習
ink>作者:Carl 來源:LiveSpace 2007-09-09
今天一天收獲頗豐,我在微軟亞洲研究院訪問時的老板,機器學習領域的大牛,李航研究員來工大講學了,錯過了上次與其直接交流的機會(上次他來時,我恰好去韓國開會),這次可堅決不能放過。于是,一大早我就去了教室,結果還記錯了時間,早到了半小時,呵呵
不過我認為絕對不虛此行,大牛就是大牛,談古論今,旁征博引,整個上午的講座充滿了趣味性,將人工智能進行了系統的回顧和展望,并focus到統計機器學習,這個目前人工智能領域最熱門的話題上來。
他首先根據自己的經驗,給AI一個工程化的定義,就是機器能夠類似于人的能力和行動,在給定輸入的條件下,輸出一個結果。最典型的例子就是Turing Test。因此說AI更偏向于工程,而非科學(數學化的自然)。
另外,他提到的Karl Popper"s的Refutability(反證不可能)哲學思想很有意思,大概意思是說,如果一個命題沒法證反,比如社會學,歷史學等,就沒有研究的意義了。此人在西方很出名,但是由于他批判馬克思主義反證不可能,所以被共產黨封殺也很正常了,呵呵
三種AI實現的方法:
1)Cognitive Science,通過自省的方法實現AI,這個基本上很難,因為人畢竟很渺小,大多數的東西,只知其然,不知其所以然,也就是說必要條件可知,但是充分條件很難知道了。
2)Physical Science,通過研究人腦的物理現象,如腦電流等實現AI,這就更困難了,就像我們如果想要弄清楚CPU的工作機理,只通過測量CPU的電流,電壓等參數一樣,基本不可實現。
3)Simulation方法,以目前人們的認識來看,就剩下這樣一種相對可能的方法了,說其相對可能,是因為和上面兩種方法比較起來,這種方法更容易實現,效果也更好。但是模擬的方法很難抓住本質,因為多數事物都是橫看成嶺側成峰,只從一個片面的角度對其模擬,往往是一葉障目,不見泰山。
為什么說AI比較難呢?
1)Concept Hierachy很難獲得和定義。Wittgenstein"s "game"例子,也就是對于各種“game”,很難找到共性。
2)Inference過程難。人往往能夠進行快速,模糊的推理,而機器沒有這個能力。
3)智能也會受到Language的影響。Dani人對顏色的認識就三種,他們的智力和其他種族的會有差異。
4)人類Generalization的能力很強,可以舉一反三。
5)人類Discovery的能力很強。Hanson"s "Pattern of Discovery",講述了人類進行科學發現的時候,往往是心中有一種模式了,然后才來證明。聯想的自己的研究經歷,確實也是這樣。比如做實驗,往往是證明自己方法的有效性,而不會去證明其無效。
說道AI的趨勢,大概有以下幾個(面向應用):
1)統計機器學習;
2)Data driven;
3)Task-oriented;
4)High Performance Computers
后半部分講的是統計機器學習,由于以前聽過,這里就不詳述,簡單說說其中的一些閃光點吧:
統計機器學習的三要素:
1)模型(Model):假設(Hypothesis)
2)策略(Strategy):損失函數優化(Optimization of Loss function)
3)算法(Algorithm):尋找最優模型(Finding optimal model)