突破機器視覺障礙和人工智能革命
谷歌于2015年12月發布了其云視覺API,以執行這些任務,如識別人臉、標志和單詞、檢測對象和了解其環境的使用。 一些用戶對這些功能非常興奮,市場上的其他公司正在尋找類似的服務,以使其適應其交易模式。
為什么機器和設備需要視覺? 視覺是主要的感覺。 為了能夠理解人類并帶來他們所需要的支持,機器和設備需要能夠在視覺行業中觀察和反思。 這可能是一種小型相機的方法,可以關心盲人去“看”,并感覺繞著他們在國外。 或家庭監控系統,正確識別一群流浪貓之間的差異,或移動樹枝,以及一種防盜的方法。
在過去的一年里,圍繞人工智能的嗡嗡聲一直非常微弱。 我們從未如此接近看到這種技能的好處。在2016年,新的人工智能分發設備將被看到,由于我們在人工智能方面面臨的最困難的挑戰之一,也取得了類似的進展:讓我們的設備了解他們所看到的。
在我們的日常生活中,隨著設備逐漸成為我們不可分割的一部分,我們類似于看到沒有足夠的視覺天賦,越來越多的使用程序將失敗。 這些包括空中無人機碰撞和機器人吸塵器,“吃”他們不應該吃的東西。
視覺系統是人工智能的一個快速發展的分支,旨在使機器和設備與人類視覺相媲美。 隨著研究人員使用專門的神經網絡來關心識別和理解實際外國圖像的機器和設備,視覺系統在過去幾年中取得了很大的進展。 今天的電腦正在可視化從在網絡上識別貓到在許多照片中識別特定的面孔。 只是,這種技能還有很長的路要走。 今天,我們看到,視覺系統可以離開數據中心,能夠將我們的食物從自主無人機打包到機器人人員。
為了更好地理解視覺系統,一個常見的類比,機器人人類視覺和人類視覺,就像天空中的飛鳥和飛機。 兩者最終都將依賴于基本的物理來關心它們在空中的飛行,但這并不意味著飛機將帶著翅膀飛行。 僅僅因為人和機器很可能看到同樣的東西,而解決這些圖片的方法很可能有一定的共性,最終的結果仍然很可能是非常不同的。
雖然類似的圖片分類變得更加容易,但當它涉及從抽象場景中提取意義和信息時,機器人設備面臨著一系列新的問題。幻覺是一個很好的例子,機器和設備人類的視覺還有很長的路要走。
例如,當人們看兩張臉的輪廓時,他們看到的不僅僅是抽象的外觀。 他們的大腦走得更遠,允許他們識別圖片的多個部分,看到兩張臉,或者看到一個花瓶。 但是對于機器設備來說,這樣的圖片很難理解。 類似的分類器無法區分兩個面和花瓶。 它可以看到物體,如短柄斧頭、鉤子、避難所甚至吉他。 該系統沒有確定物體在圖像附近,這表明這種圖像的識別對于機器和設備來說是具有挑戰性的。
如果我們看到更復雜的事情,這個問題甚至會變得比就像貝弗利·杜利特爾的一幅畫一樣,雖然每個看到這幅畫的人都很可能找不到,但事實上,每個人的臉都在這張畫布上,他們幾乎立即看到的圖片比他們眼皮上看到的要多。 此外,作為復雜的圖片,實際的外國也是非常混亂的。 邊界附近的正常飛行不能通過開發和設計分析數據的算法來完成。 它需要對真實的場景有一個清晰的理解,并能相應地采取行動。