大腦中神經(jīng)元之間的信號傳播速度大約是 100 米每秒,而光的傳播速度是 30 萬千米每秒,如果神經(jīng)元信號也是光速傳播的呢?來自加州大學洛杉磯分校(UCLA)的研究人員利用 3D 打印技術打印出了固態(tài)的神經(jīng)網(wǎng)絡,并且利用層級傳播的光衍射來執(zhí)行計算,實現(xiàn)了手寫數(shù)字的圖像識別,相關成果已發(fā)表在《science》雜志上。
這一想法看似新奇,其實也很自然。神經(jīng)網(wǎng)絡中執(zhí)行的是線性運算,恰好和光衍射的線性相互作用對應,神經(jīng)元的權重、激活值概念也能和光的振幅、相位對應(可調)。此外,固態(tài)光衍射計算還具有能耗小、無發(fā)熱、光速執(zhí)行(盡管傳統(tǒng)計算機電路中的電場傳播也是光速的,但并未直接對應神經(jīng)網(wǎng)絡的計算過程)等優(yōu)點。該研究方向尚處于起步階段,如果能充分利用其優(yōu)勢,也許會有很廣闊的應用前景。
如今,機器學習無處不在,但多數(shù)機器學習系統(tǒng)是隱形的:它們在「黑箱」里優(yōu)化音頻或識別圖像中的人臉。但最近 UCLA 的研究人員研發(fā)出了一個 3D 打印 AI 分析系統(tǒng)。這一系統(tǒng)不僅看得見,還摸得著。與以往通過調節(jié)數(shù)字進行分析的系統(tǒng)不同,該系統(tǒng)通過光線的衍射來分析人工智能。這一新奇、獨特的研究成果表明:這些「人工智能」系統(tǒng)可以看起來非常簡單。
我們通常將機器學習系統(tǒng)看作人工智能的一種形式,其核心是對一組數(shù)據(jù)進行的一系列運算,每一次運算都基于上一次運算或饋送到一個循環(huán)中。運算本身并不太復雜——盡管也沒有簡單到可以用紙筆計算的程度。最終,這些簡單的數(shù)學運算會得出一個概率,即輸入的數(shù)據(jù)與系統(tǒng)「學會」識別的各種模式相匹配。
通常,機器學習系統(tǒng)進行每一次參數(shù)更新或推斷時所需的運算需要在 CPU 或 GPU 上進行。由于當前的深度學習需要大量并行計算,GPU 成了更廣泛的選擇。但即使最先進的 GPU 也是用硅和銅制成的,信息需要沿著錯綜復雜的電路以脈沖的形式傳播。這就意味著,不論是執(zhí)行新的計算還是重復的計算,傳統(tǒng) GPU 都會產(chǎn)生能耗。
因此,當深度學習中的這些「層」已經(jīng)完成訓練,并且所有參數(shù)的值都確定下來,它還會一次次地重復計算與耗能。這意味著 3D 打印 AI 分析系統(tǒng)在訓練完它的「層」后,還可以被優(yōu)化,不會占用太大空間或 CPU 功率。來自 UCLA 的研究人員表示,它確實可以固化,這些層本身就是由透明材料制成的 3D 打印層,印有復雜的衍射圖案,這些圖案可以對光線進行處理。
如果這樣描述讓你覺得有點頭疼,不妨想想機械計算器。如今,數(shù)字計算都是在計算機邏輯中以數(shù)字形式完成的。但是過去,計算器需要移動實際的機械零件才能進行計算——數(shù)字加到 10 都會造成零件位置變換。從某種程度上來說,這種「衍射深度神經(jīng)網(wǎng)絡」與之相仿:它使用并操縱數(shù)字的物理表示,而不是電子表示。這就代表著,如果將模型的預測過程固化為物理表示,那么它在實際預測過程中就能大大降低能耗。
正如研究人員所說:
給定層上的每個點傳輸或反射入射波,該入射波相當于通過光學衍射連接到下一層其它神經(jīng)元的人工神經(jīng)元。通過改變相位和振幅,每個「神經(jīng)元」都是可調的。
「我們的全光深度學習框架能夠以光速執(zhí)行各種復雜任務,基于計算機的神經(jīng)網(wǎng)絡也可以實現(xiàn)這些任務?!寡芯咳藛T在論文中描述其系統(tǒng)時寫道。
為了證明這一點,他們訓練了一個深度學習模型來識別寫手寫數(shù)字。完成之后,他們會把矩陣數(shù)學層轉化為一系列的光學變換。例如,一個層可能會通過將兩者的光線重新聚焦到下一層的單個區(qū)域來增加值——實際計算比這要復雜得多,此處只做概述。
通過在印刷版上布置數(shù)百萬個微型轉換,光從一端輸入并從另一個結構中輸出,因此系統(tǒng)能以超過 90% 的準確率判斷它是否為 1、2 和 3 等。
讀者可能會疑問這到底有什么用,因為最簡單的三層感知機在識別手寫數(shù)字時都能輕松達到 95% 以上的準確率,而卷積網(wǎng)絡可以實現(xiàn) 99% 以上的準確率。這一形式目前確實沒什么實際用處,但是神經(jīng)網(wǎng)絡是非常靈活的工具,系統(tǒng)完全有可能識別字母而不是僅限于數(shù)字。因此可以令光學字符識別系統(tǒng)在硬件中運行,且基本上不需要能耗或計算。
真正的局限在于制造工藝:打造一個能實現(xiàn)按需處理任務的超高精度衍射板非常困難。畢竟,如果需要精確到小數(shù)點后七位,而印刷版卻只能精確到第三位的話,那就相當麻煩了。
這只是一個概念的證明——對大型數(shù)字識別機器并沒有迫切需求——但這個想法十分有趣。該想法可能會對攝像機和機器學習技術產(chǎn)生影響——在物質世界而非虛擬世界里構造光與數(shù)據(jù)??雌饋硐袷堑雇?,但也許只是鐘擺在向后擺動。
深度學習已經(jīng)提高了我們使用計算機執(zhí)行高級推理任務的能力。我們在本文中引入了一種物理機制來執(zhí)行機器學習,這是一種全光衍射深度神經(jīng)網(wǎng)絡(D^2NN)架構,可以按照基于深度學習設計的、集體工作的被動衍射層來實現(xiàn)多種函數(shù)。為此,研究人員構建了 3D 打印的 D^2NN 來實現(xiàn)手寫數(shù)字和時尚產(chǎn)品的圖像分類,以及成像鏡頭在太赫茲光譜的函數(shù)。我們的全光深度學習框架能以光速計算多種基于傳統(tǒng)計算機的神經(jīng)網(wǎng)絡也可以實現(xiàn)的復雜函數(shù),并將在全光圖像分析、特征檢測和目標分類中開發(fā)新的應用,此外它還允許設計新的攝像頭和光學器件,以利用 D^2NN 執(zhí)行獨特的任務。
來源:3d打印網(wǎng)
編輯:董強
全部評論 0
暫無評論