加速人工智能發展的三要素
引言:算法、計算能力和數據是人工智能快速發展的三大要素。首先,算法上的突破讓人工智能的商業化發展看到了希望。其次,隨著計算能力的提高,可以實現復雜的算法,快速獲得訓練結果,降低成本。最后,大數據時代為人工智能的訓練和學習提供了大量的信息。沒有它,算法、計算能力和數據是人工智能快速發展的三大要素。首先,算法上的突破讓人工智能的商業化發展看到了希望。其次,隨著計算能力的提高,可以實現復雜的算法,快速獲得訓練結果,降低成本。最后,大數據時代為人工智能的訓練和學習提供了大量的信息。沒有它們,人工智能就無法實現大規模的商業應用。
1.算法
算法是人工智能發展的基礎,現在主要作為深度學習算法使用。大部分算法框架,比如Caffe,TensorFlow,Torch等。已經實現了開源并成為大多數工程師的選擇,這對加速行業發展和培養人才起到了非常重要的作用。
全球開源平臺的成熟也使中國企業能夠快速復制其他地區開發的先進算法。就應用而言,中國和其他國家在算法開發程度上沒有太大差異。事實上,中國在語言識別的人工智能算法方面取得了突破,領先世界。
2.計算能力
計算能力是人工智能的基礎設施之一,具有很高的戰略意義。GPU(圖形處理器)強大的并行計算能力顯著提高了計算機的性能,降低了成本。英偉達最新的GTX1080游戲顯卡有9TFLOPS浮點性能,但是價格只有700美元。每個GFLOPS的計算成本只有8美分。1961年,IBM1620不得不提供1 GFLOPS的計算能力,成本約為9萬億美分。
在計算部門,全球三大芯片供應商NVIDIA、Intel和AMD負責提供GPU和CPU。硅谷也在開發用于人工智能計算的FPGU(現場可編程門陣列)和ASIC(專用集成電路)。云計算和超級計算機也在為人工智能的發展提供服務。
3.數據
人工智能系統必須通過大量數據“訓練”自己,才能不斷提高輸出結果的質量。你擁有的高質量數據越多,神經網絡的效率就越高。
訓練是人工智能的基礎,就像人類想要獲得一定的技能,就必須不斷的訓練,都說熟能生巧。AI也是如此。神經網絡只有經過大量的訓練,才能總結出規律,應用到新的樣本中。如果現實中有一個訓練集從未出現過的場景,網絡基本會處于瞎猜狀態,正確率可想而知。比如識別勺子是必須的,但是勺子在訓練中總是一起出現,網絡大概就學會了碗的特性。如果新圖只有碗沒有勺子,還是有可能被歸為勺子。所以對于AI來說,大量的數據太重要了,需要覆蓋各種可能的場景,才能得到一個看起來更聰明的性能良好的模型。