MetaMind獲800萬美元風投資金,揭開深度學習的神秘面紗
編者按:深度學習的概念源于人工神經網絡的研究。作為人工智能的一種,“深度學習”是一個訓練系統,能處理海量信息,它們來源于音頻、圖像和其他輸入的信號,如果向這個系統展示新信息,它會以推論的形式作出反潰像Google和Facebook這樣的科技企業已經在這個領域取得了技術進步并展開并購,“深度學習”的初創公司也在大量涌現。
斯坦福大學研究生Richard Socher在畢業之后創建了metaMind,且于四個月后便從風投巨頭Khosla Venture和Salesforce首席執行官Marc Benioff獲得 800 萬美元投資。
(metaMind創始人Richard Socher,和 Sven Strohband在位于加州的辦公室)
Richard Socher從沒想到他會進入人工智能的尖端領域,他只是想把自己喜歡的數學和語言結合起來。
但是事情一件接一件地發生了,他開發完成了一項出色的技術“遞歸神經網絡”(recursive neural networks),現在,他從大學離職后創辦的企業metaMind正式啟動了,并獲得了數家著名企業的金融支持。
公司成立僅四個月,Socher和他的團隊力圖證明在“深度學習”領域metaMind處理圖像和文本的能力比目前任何技術都更卓越。為此,除了宣布從Khosla Venture和Salesforce首席執行官Marc Benioff那里得到了800萬美元的資金之外,metaMind還在官網演示了他們的多種技術能力。
作為人工智能的一種,“深度學習”是一個訓練系統,能處理海量信息,它們來源于音頻、圖像和其他輸入的信號,如果向這個系統展示新信息,它會以推論的形式作出反潰像Google和Facebook這樣的科技企業已經在這個領域取得了技術進步并展開并購,“深度學習”的初創公司也在大量涌現。
但是,Socher認為人們在使用metaMind時能體會到它的優勢,這家初創公司擁有兩項核心技術,一是受聘于Facebook的紐約大學教授Yann LeCun研發的“卷積神經網絡”,該技術在圖片挖掘方面取得了突破性進展;還有就是索赫爾自己的“遞歸神經網絡”,它在文本處理方面成就斐然。
Socher接受科技博客VentureBeat的采訪時說:“我們處在這項技術的前沿,并能與其他公開的技術一較高下,我們想盡量用科學化的語言來表述它。”
像拖放那樣簡單
它就像鼠標拖放一樣簡單,這意味著現在幾乎任何人都能進行“深度學習”。
“你不必是程序員”,正如Socher演示的那樣,用戶可以給metaMind一些簡單的文本來進行訓練,然后會收到若干行代碼,它們可以直接嵌入應用程序,不需建立數據中心,甚至用像“亞馬遜網絡服務”這樣的公共云,所有的一切metaMind全能搞定。
metaMind網站上還有很多這樣的演示,有的可以指出兩個句子在語義上是多么相近,有的能就用戶搜索的某一主題詞顯示推文的肯定或否定程度。metaMind還可以形成一個分類器:用戶上傳一個帶有文本標簽的電子表格,使系統知道要搜索什么,然后再給它一些文本,讓它進行動態分析。
只要用一組相關圖片進行訓練,metaMind還能對圖像進行分類。當它“消化”了一些食物圖片之后,你可以拖拽一盤魚或者薯片的照片,它可以很自信地說出圖片里是魚或者薯片。
Socher還演示了metaMind如何提取與文本框中輸入的文字相匹配的圖像。
或是輸入幾個詞
Socher用筆記本電腦輸入了“鳥”(bird)這個詞,系統展示了一些圖像,每張都有一只鳥。然后他輸入了鳥的復數形式(birds),圖像發生了變化,每張上都有很多只鳥。他說:“最酷的是它真的具有語義合成的感覺——詞匯如何組成了較長語句的意義。”他鍵入“水上的鳥”,然后系統給出了鳥在水上飛翔的圖片。
這種工作要求多種類型的“深度學習”,“卷積神經網絡”在掃描大量圖像之后能夠提取特征,而“遞歸神經網絡”能從句子中提取意義,這兩項技術可以協同工作。Google和微軟最近分別宣布他們已經掌握了一次性處理文字和圖像的技術,但是Socher去年獨立完成了這項研究,并在今年2月發表了兩篇論文。他說:“我們擁有這項技術已經有幾個月了。”
Socher走過了一條漫長的道路,他是德國人,大學期間他研究自然語言處理(NLP),但是他覺得其中數學的成分太少了,因此研究生階段他開始研究計算機視覺,雖然數學的成分多了,但是仍不完美,因為那太簡單了。隨后他去美國讀博士,在斯坦福大學專攻機器學習。在那里他聽了Andrew Ng教授關于“深度學習”及其在計算機視覺中的應用的報告。
“我覺得那是非常棒的想法,但是它們仍然不太適合自然語言處理,”索赫爾說,“我創造了一些‘深度學習’的新模式,可以應用于自然語言的處理。”
他的“遞歸神經網絡”分析相鄰兩個詞之間的關聯,然后它再分析這兩個詞和它們左邊那個詞的聯系,以此類推,“遞歸”這個詞的意思就是直到它能理解一句話中所有的語言成分的意義。
2011年他首次提出了這些模型,在學術界引發了興趣,之后他發表了數篇論文來證明“遞歸神經網絡”的可行性。
他曾想從事研究工作,但是今年初,他意識到他不想走這條路。
作為斯坦福大學“機器學習”課程300多名學生的助教,Socher看到大家很想把這種技術應用于所有的數據類型。
“每五分鐘就有一個完全不同領域的新項目,”他說,“我喜歡這樣,機器學習前景廣闊,而且它的重要性將進一步顯現。”
幾年來,他拒絕了大公司提供的工作邀請,他想把這些技術帶入更廣闊的領域,讓更多的個人和企業能夠使用。
創立企業
他需要資金建立團隊來實現這些想法,最后他去了Khosla風投,見到了這家公司的首席技術官Sven Strohband。現在,Strohband已經加入metaMind擔任首席執行官。
同時,Khosla風投的創始人Vinod Khosla(也是Sun Microsystems的聯合創始人)擔任這家初創公司的顧問,Salesforce網的首席執行官貝尼奧夫和蒙特利爾大學該領域領軍人物Yoshua Bengio都加入了公司高層。
metaMind已經建立了一個10人團隊,并且開始吸引付費用戶,他們為小企業提供服務,也為財富500強的大企業工作。他們為在企業數據中心運行的metaMind系統發放許可證,還可以為使用metaMind動力系統的公司提供額外的咨詢服務。
具體業務包括抽取財務分析報告中隱藏的關鍵詞,或分析人們尋求客服幫助的聊天記錄。更豐富的應用還有根據X光片預測病情等。
雖然metaMind已經有很多此類應用,但是他們還在征集新的項目,顯示出開放的心態,目的是想讓世界告訴他們什么才是最好的選擇,這對一個初創公司來說是非常正確的。
Strohband說:“我們相信它應該為更多人所用,因為我們認為它有很多用途,坦率的說我們真的無法預料人們會用它還干什么。”