清華團隊打造光學人工智能,讓《三體》中的計算機成為現實

以深度學習為代表的人工智能技術已在包括自動駕駛、醫療診斷、語音翻譯等眾多領域帶來巨大的變革。隨著深度學習算法的迅猛發展,人工神經網絡規模的不斷增大,迫切需要不斷提升計算處理器的運算速度和能效。采用傳統電子計算方式已經越來越難以滿足未來人工智能對處理器計算性能的需求。近年來,基于光計算高速、低功耗、高并行的顛覆性優勢,通過光電融合的方式構建光學神經網絡與智能光電計算處理器已經成為國際信息技術前沿的熱點研究領域。
然而,現有的光電智能計算技術距離實際應用還面臨著以下挑戰:(1)模型構架簡單,現有的光學神經網絡模型復雜度較低,光學非線性實現較為困難,因此模型性能與電子的人工神經網絡有較大的差距;(2)系統誤差難校正,光計算系統誤差大小和系統復雜度成正相關,因此誤差校正算法對于構建大規模智能光計算系統至關重要,然而迄今為止尚缺普適性的誤差校正方法;(3)系統重構困難,現有光學神經網絡結構難以重構,因此計算功能單一,而網絡參數編程則依賴較為復雜的光學效應,大規模參數的快速精準寫入仍存在困難。
圖一:光電智能衍射計算處理器的基本原理
針對上述挑戰,來自清華大學信息學院的戴瓊海教授研究團隊提出并構建了光電智能衍射計算處理器(Diffractive Processing Unit, DPU),能夠有效地重構實現包含百萬神經元的多類新型光電神經網絡,通過自適應的在線訓練算法實現了高性能的視覺分類任務,并驗證了光電智能計算的優越性。
DPU 的構架采用了光學衍射的物理現象,能夠產生大規模的光學互聯,從而助力構建高復雜度的光學神經網絡(圖一)。此外,該光學處理器原理充分利用了光的波粒二象性,神經網絡權重的調整通過控制光波傳播的波前分布來實現,采用光電效應能夠實現人工神經元的功能。DPU 的運行過程光計算部分則幾乎承擔所有的計算操作,采用高通量可編程的光電器件并結合電子計算的靈活特性,能夠實現高速數據調控以及大規模網絡結構和參數的編程。“在這項工作中我們定義了光電的衍射人工神經元,能夠實現對衍射光場的線性加權求和以及非線性激活響應,這是構建復雜光電深度學習系統的基礎。” 林星特聘研究員說到。