【
儀表網 研發快訊】近日,武漢光電國家研究中心董建績、周海龍等人在光學神經網絡芯片擴展性方面取得重要突破。他們提出了一種名為“部分相干光學深度神經網絡”新架構,成功解決了片上光神經網絡的深度擴展和規模擴展兩大瓶頸。該架構采用級聯增益的光學非線性激活函數和部分相干光源,實現了迄今為止輸入規模最大、層數最多的單片集成光學神經網絡。研究成果發表于Light-Science & Applications,題為“Scaling up for end-to-end on-chip photonic neural network inference”。
光學神經網絡(ONN)因其高帶寬和高能效的優勢,被認為是替代傳統電子芯片的下一代人工智能(AI)計算候選方案之一。然而,在單芯片上實現大規模的端到端(end-to-end)光學推理仍面臨巨大挑戰。首先,傳統光學非線性激活函數的級聯能力弱,能量衰減限制了網絡向更深的隱藏層擴展;其次,片上光學矩陣的規模受限于輸入端口數目,以及對窄線寬激光器等高成本光源的依賴(圖1a)。為突破這些限制,研究團隊提出“部分相干光學深度神經網絡”架構(圖1b),從三個方面進行了創新:
圖1:(a)傳統ONN的擴展挑戰,深度限制源于非線性激活函數缺乏凈增益或需要電放大(TIA),輸入尺寸則受制于相干計算中對相干探測的需求以及非相干計算中對波長數量的需求,(b)本方案:部分相干深度光學神經網絡。
1增益型非線性激活函數:通過設計一種基于光-電-光(O-E-O)轉換的片上非線性激活函數,實現了正值凈增益,確保了信號在多層網絡間的有效傳遞和處理,從而能夠擴展神經網絡的深度。
2部分相干光源:傳統方案中,相干計算依賴復雜相干探測;而非相干計算依賴大量窄線寬波長的擴展,成本高。本方案引入部分相干光源,無需相干探測,顯著降低了系統對窄線寬激光器的依賴,為大規模并行計算和系統擴展提供了新路徑。
3實數域計算架構:整個網絡在實數域中運行,可直接表示正、負權重而無需額外編碼。該設計降低了硬件復雜度和能耗,尤其在部分相干光下更具優勢,因為傳統的相位編碼來表示符號值變得極具挑戰性。
圖2:部分相干光學深度神經網絡的整體架構(a)數學框架,(b)基于載流子注入的強度調制器,(c)作為卷積核的光學點積單元,(d)第一全連接層。
基于上述創新,團隊設計并制造了一款單片集成的深度神經網絡芯片(圖2),其尺寸約為17平方毫米。該芯片包含一個64維輸入層、兩個卷積層、兩個全連接層,是目前已報道的輸入規模最大、網絡深度最深的光學神經網絡芯片。利用該芯片成功進行了端到端的圖像分類任務。在部分相干光源輸入的情況下,芯片對四分類手寫數字的識別準確率達到94%,對二分類時尚圖片的識別準確率達到96%。此外,芯片的單次推理延遲約為4.1ns,計算能效為121.7 pJ/OP,展現了其在高速、節能計算方面的巨大潛力。
該項研究展示了目前輸入規模最大、網絡深度最深的單片集成光學神經網絡,并且首次驗證了利用部分相干光進行實值光學計算的可行性,為構建更易于普及、成本更低且高度可擴展的光學計算系統開辟了新道路。
博士生吳波為該論文的第一作者,董建績教授和周海龍副教授為該工作的共同通訊作者。
所有評論僅代表網友意見,與本站立場無關。