從云端到終端 機器學習也能在嵌入式設備上實現
開發者需要能夠快速開發出實施機器學習功能的深度學習神經網絡,并將其轉換到低功耗的嵌入式終端設備上,集成了神經網絡算法的DSP芯片將成為這一難題的解決方案。
終端設備智能化的需求催生本地智能化(local intelligence)
當聯網的終端設備越來越多時,產生的信息數據也將呈指數式增長。如果將所有數據和數據處理全部都交給云端,必然會產生通信擁堵、傳輸變慢、處理時延等問題,無用的數據也會浪費云端的存儲資源。
因此需要本地智能(local intelligence)讓終端設備有能力判斷數據的價值,只將真正有價值的數據傳到云端存儲。而終端設備也需要分析數據做出決策的智能化功能,尤其家庭中的圖像識別和語音識別設備需要在本地實時處理信息,以保護用戶的隱私。
近來,具備深度學習功能的卷積神經網絡(CNN)在圖像處理和計算機視覺領域得到廣泛的應用,其識別正確率也大大提高。在一些生活場景中,如無人機自動避障、家庭服務機器人路徑規劃等,需要將這些神經網絡應用到嵌入式設備上,甚至是一些低功耗的嵌入式設備,以提高設備的智能化程度和與人的交互能力。
▲深度學習技術取得顯著成效
與神經網絡深度結合的DSP處理器將成為機器學習的實施方案
目前,因為內存、功耗、計算能力等限制,在傳統CPU+GPU架構的嵌入式設備上實施神經網絡還有難度。業界需要一種將神經網絡引入到低功耗嵌入式設備的方法。
11月23日,全球領先的信號處理器IP授權公司CEVA在深圳召開了年度技術研討會,并發布了專為在低功耗嵌入式設備上實現深度學習和人工智能應用的第五代圖像處理器IP CEVA-XM6。
其主要參數包括:最高頻率1.5GHz;采用8路VLIW以提高并行計算能力;創新矢量處理單元架構,確保95%以上的MAC利用率;32路SIMD矢量浮點單元可選項,支持IEEE半精度標準及常用的非線性運算增強。
為了讓開發者更好的使用CEVA-XM6,CEVA還提供基于CEVA-XM6的軟件開發平臺,包括硬件加速器、神經網絡軟件框架、軟件庫、CDNN工具包。CDNN是CEVA的一套深度學習綜合開發工具包,這次研討會發布了其第二代產品。用戶可以先在線下訓練深度學習的神經網絡模型,然后使用CEVA網絡生成器將線下的網絡模型轉換成適用于CEVA-XM6處理器的實時嵌入式網絡。
▲CDNN開發包與CEVA-XM6軟硬件組合使用
在研討會上,CEVA給出了一個對比案例,使用CEVA-XM6處理器的參考設計開發板,相比于NVidia今年推出的TX1 GPU在實現AlexNet和GoogleNet兩種神經網絡時,處理速度快4倍,同時能耗效率提高25倍,十分適合應用在低功耗的嵌入式設備上,如智能攝像、人臉識別、無人機、全景拼接、3D重建等。
▲CEVA-XM6的應用場景
具備機器學習功能的終端設備將催生更多的應用場景
智能家居要真正做到智能化,與用戶之間良好的交互能力必不可少,比如語音控制、手勢控制等,這些都需要產品具有深度學習的功能,能夠識別出用戶的語音命令和手勢動作。
在本次研討會上,美國的一家語音處理技術公司展示了他們基于CEVA的處理器IP開發的低功耗語音控制芯片方案,應用于智能手機、智能家居的語音交互和語音控制,工作電流低于1mA,可以去除靜態和非靜態噪聲,根據使用場景做定制化開發,通過前期的語音訓練后能夠只識別主人的語音,過濾其他人的語音命令,防止別人的誤操作。
在機器視覺領域, Arcsoft公司展示了他們的最新的照片美化技術,除了傳統的白膚、瘦臉等美顏功能外,還可以基于圖像識別分析出拍攝對象的年齡、性別、人種、情緒和拍攝環境(如白天、夜晚)等因素,針對不同場景和對象做定制化美顏處理,省去了用photoshop做后期處理的環節,讓一個普通人也可以非常簡便地拍出專業級的美麗圖片。他們還推出了畫面防抖功能,當用戶手持相機走動拍攝視頻時,通過處理可以使畫面保持靜止狀態,消除走動帶來的畫面抖動。
總結
隨著技術的發展,原本只能在大型高功耗計算平臺上實現的深度學習神經網絡,將逐步在低功耗嵌入式設備上實現,使得人工智能離我們的日常生活又近了一步,也提高了物聯網設備的智能化程度。在產品開發上,軟硬件深度結合的開發模式將越來越普遍(比如CEVA推出的CDNN開發包與CEVA-XM6的組合使用),基于特定場景應用的算法優化和數據訓練之后的智能設備才能跟人們的日常生活無縫對接,物聯網技術與具體行業具體領域的聯系將會越來越緊密。