殿上欢,欢乐颂,古风名字

完全通過光學(xué)，不要計算機(jī)也能構(gòu)建個神經(jīng)網(wǎng)絡(luò)？港科大的研究團(tuán)隊提出了一種全光學(xué)神經(jīng)網(wǎng)絡(luò)，所有線性變換、激活函數(shù)通過光學(xué)模塊就能實現(xiàn)。

在處理模式識別、風(fēng)險管理以及其他同樣復(fù)雜的任務(wù)時，最強(qiáng)大的計算機(jī)都無法與人腦匹敵。但是，近來光學(xué)神經(jīng)網(wǎng)絡(luò)取得的進(jìn)展通過模擬人腦中神經(jīng)元的反應(yīng)方式縮小了計算機(jī)與人腦之間的差距。這種光學(xué)神經(jīng)網(wǎng)絡(luò)比 ML 中的網(wǎng)絡(luò)能耗更低、運(yùn)算更快，是未來大規(guī)模應(yīng)用 AI 的堅實基礎(chǔ)。

近日，來自香港科技大學(xué)的研究團(tuán)隊在《Optica》雜志上發(fā)表了一篇論文，詳細(xì)描述了他們提出的雙層全光學(xué)神經(jīng)網(wǎng)絡(luò)。這是一個功能完善的全光學(xué)神經(jīng)網(wǎng)絡(luò)（AONN），其中所使用的線性函數(shù)和非線性激活函數(shù)都是完全根據(jù)光學(xué)實現(xiàn)的。而且這種全光學(xué)神經(jīng)網(wǎng)絡(luò)還能擴(kuò)展到更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)，從而完成圖像識別等更復(fù)雜的任務(wù)。

這個復(fù)雜的東西就是一個兩層的全光學(xué)神經(jīng)網(wǎng)絡(luò)，它和機(jī)器學(xué)習(xí)中的兩層全連接網(wǎng)絡(luò)有點(diǎn)「類似」。

研究團(tuán)隊成員之一 Junwei Liu 表示：「我們提出的全光學(xué)神經(jīng)網(wǎng)絡(luò)能夠以光速執(zhí)行光學(xué)并行計算，并且耗能極少。這種大規(guī)模的全光學(xué)神經(jīng)網(wǎng)絡(luò)可應(yīng)用于圖像識別以及科學(xué)研究等諸多領(lǐng)域?！?/p>

港科大的全光學(xué)神經(jīng)網(wǎng)絡(luò)是什么

在傳統(tǒng)混合光學(xué)的神經(jīng)網(wǎng)絡(luò)中，光學(xué)組件通常用于線性運(yùn)算，而非線性激活函數(shù)通常使用電子的方式實現(xiàn)。這主要因為非線性光學(xué)元器件需要高功率的激光器，這在光學(xué)神經(jīng)網(wǎng)絡(luò)中是很難實現(xiàn)的。

為了克服這方面的問題，研究者使用具有電磁感應(yīng)透明度的冷原子實現(xiàn)非線性函數(shù)。研究團(tuán)隊的 Shengwang Du 說：「這種光感應(yīng)效應(yīng)可以通過非常小功率的激光器實現(xiàn)，且該效應(yīng)是基于非線性量子干涉的。因此這種效應(yīng)可以將我們的系統(tǒng)擴(kuò)展到量子神經(jīng)網(wǎng)絡(luò)，從而解決經(jīng)典方法難以解決的問題?！?/p>

為了確認(rèn)新方法的能力與可行性，研究者構(gòu)建了一個雙層全連接全光學(xué)神經(jīng)網(wǎng)絡(luò)，它的輸入單元與輸出單元數(shù)目分別是 16 與 2。研究者使用他們的全光學(xué)網(wǎng)絡(luò)分類 Ising 模型（一種磁場的統(tǒng)計學(xué)模型），即 order 和 disorder 階段兩個類別。結(jié)果表明，全光學(xué)神經(jīng)網(wǎng)絡(luò)與一般基于計算機(jī)的神經(jīng)網(wǎng)絡(luò)一樣準(zhǔn)確。

圖 1：全連接網(wǎng)絡(luò)的結(jié)構(gòu)與全光學(xué)神經(jīng)網(wǎng)絡(luò)的一般結(jié)構(gòu)。

如上 a 為機(jī)器學(xué)習(xí)中常見的全連接網(wǎng)絡(luò)，b 則是香港科技大學(xué)研究者提出的全光學(xué)神經(jīng)網(wǎng)絡(luò)（AONN），它們都會進(jìn)行非線性變換。與一般的 ONN 不同，AONN 沒有復(fù)雜的電場神經(jīng)元，AONN 所有的信都通過光學(xué)的方式進(jìn)行編碼。

非線性光學(xué)激活函數(shù)

這篇論文核心的突破就是采用了基于光學(xué)的非線性激活函數(shù)，因此整個網(wǎng)絡(luò)才能稱為「全」光學(xué)神經(jīng)網(wǎng)絡(luò)。那么什么是非線性光學(xué)激活函數(shù)？簡單而言，它就是一種基于電磁感應(yīng)透明的模塊（electromagnetically induced transparency， EIT）完成的，我們只要知道 EIT 是一種原子躍遷之間的光量子干涉效應(yīng)就行了。

EIT 非線性光學(xué)激活函數(shù)由激光冷卻的 85Rb 原子在 dark-line 二維磁光阱（MOT）中實現(xiàn)，如下圖 3（a）所示。圖 3（b）所示為原子能級，原子在基態(tài)|1》中制備。

在沒有耦合光束的情況下，原子介質(zhì)對共振探測光束是不透明的，它如圖 3（c）透射光譜中的實現(xiàn)所示最大程度地被原子吸收。

圖 3：EIT 非線性光學(xué)激活函數(shù)的實現(xiàn)。

對「光學(xué)神經(jīng)網(wǎng)絡(luò)」的不懈追求

當(dāng)然，香港科技大學(xué)的這個全光學(xué)神經(jīng)網(wǎng)絡(luò)并非研究者在該領(lǐng)域的唯一探索。今年 5 月份，在《Nature》的一篇論文中，德國的研究人員提出了一種在毫米級光子芯片上實現(xiàn)的、基于相變非線性材料的全光學(xué)脈沖神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)內(nèi)部沒有光到電的轉(zhuǎn)換，輸入的數(shù)據(jù)被電子調(diào)制成不同的波長以注入網(wǎng)絡(luò)，但之后所有數(shù)據(jù)都會停留在芯片上。利用集成相變材料來實現(xiàn)權(quán)重調(diào)制和神經(jīng)元集成；它們位于兩種微環(huán)諧振器上，具有突觸或神經(jīng)功能。

在不同工作波長情況下注入的未調(diào)制光接收到在相變材料中累積的神經(jīng)元激活，之后將它們傳遞到網(wǎng)絡(luò)下一層。即使沒有芯片上光學(xué)增益（在這個過程中，一種介質(zhì)將能量傳遞給通過它傳輸?shù)墓猓@個設(shè)置也可能擴(kuò)展至更大的網(wǎng)絡(luò)。作者在其上實現(xiàn)了小規(guī)模的監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。

利用上述全光學(xué)神經(jīng)元進(jìn)行監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。a 和 b 表示兩個神經(jīng)元在不同輸入模式下的輸出；C：全光學(xué)神經(jīng)元的無監(jiān)督學(xué)習(xí)機(jī)制；d：重復(fù)顯示「0110」模式時四個突觸的權(quán)重隨時間的變化。

香港科技大學(xué)的研究者在論文中也提到了這項研究，但他們指出，這兩項研究存在根本差別。首先，德國這項研究中的系統(tǒng)是單層的，而本文中提出的是一個 16 個輸入、2 個輸出的雙層全光學(xué)神經(jīng)網(wǎng)絡(luò)，還帶有 4 個具有非線性光學(xué)激活函數(shù)的中間神經(jīng)元。而且，港科大的研究者利用 EIT 量子干涉實現(xiàn)了非線性光學(xué)激活函數(shù)，這與那項研究的方法完全不同。

除了上述全光學(xué)神經(jīng)網(wǎng)絡(luò)，還有研究者嘗試從局部入手，把神經(jīng)網(wǎng)絡(luò)的一部分替換為光學(xué)卷積層。

去年 8 月，斯坦福大學(xué)在《Nature》子刊《Scientific Reports》上發(fā)表論文，提出在 CNN 網(wǎng)絡(luò)前端替換一個光學(xué)卷積層（opt-conv）的方案，可以在保持網(wǎng)絡(luò)性能的同時顯著降低能耗，并在 CIFAR-10 數(shù)據(jù)集的分類任務(wù)上驗證了其結(jié)論。

光學(xué)卷積層也就是用光學(xué)器件實現(xiàn)的卷積層，其光學(xué)運(yùn)算具備高帶寬、高互聯(lián)和并行處理特性，并能光速執(zhí)行運(yùn)算，功耗接近于零。該技術(shù)有望在低功耗機(jī)器學(xué)習(xí)領(lǐng)域得到進(jìn)一步發(fā)掘。

光學(xué)卷積層設(shè)計。（a）4f 系統(tǒng)圖，可以通過在傅里葉平面上放置相位掩模來實現(xiàn)光學(xué)卷積層（opt-conv）。（b）數(shù)字卷積層的標(biāo)準(zhǔn)組成，包括輸入圖像、卷積核堆棧和相應(yīng)的輸出量。（c）opt-conv 層中的等效組成，核和輸出以二維數(shù)組的形式平鋪在平面，而不是堆疊在深度維數(shù)中。

此外，為了實現(xiàn)光速運(yùn)算，加州大學(xué)洛杉磯分校（UCLA）的研究者甚至用 3D 打印打造出了固態(tài)的神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)利用層級傳播的光衍射來執(zhí)行計算，實現(xiàn)了手寫數(shù)字的圖像識別，相關(guān)成果已發(fā)表在《science》雜志上。

這一想法看似新奇，其實也很自然。神經(jīng)網(wǎng)絡(luò)中執(zhí)行的線性運(yùn)算，恰好和光衍射的線性相互作用對應(yīng)，神經(jīng)元的權(quán)重、激活值概念也能和光的振幅、相位對應(yīng)（可調(diào)）。此外，固態(tài)光衍射計算還具有能耗小、無發(fā)熱、光速執(zhí)行（盡管傳統(tǒng)計算機(jī)電路中的電場傳播也是光速的，但并未直接對應(yīng)神經(jīng)網(wǎng)絡(luò)的計算過程）等優(yōu)點(diǎn)。

當(dāng)然，也有人對此提出質(zhì)疑，認(rèn)為這種固態(tài)的神經(jīng)網(wǎng)絡(luò)對安裝精度和環(huán)境震動要求比較嚴(yán)格，可行性有待考證。

更復(fù)雜的光學(xué)神經(jīng)網(wǎng)絡(luò)

最后，研究者還計劃擴(kuò)展全光學(xué)的這種方法，從而構(gòu)建具有復(fù)雜架構(gòu)的大規(guī)模全光學(xué)深度神經(jīng)網(wǎng)絡(luò)，這些網(wǎng)絡(luò)能用于更復(fù)雜的圖像識別等任務(wù)。該論文的作者說：「盡管我們的工作是概念性驗證，但它展示了全光學(xué)神經(jīng)網(wǎng)絡(luò)在未來人工智能中的可能性。下一代的 AI 硬件在本質(zhì)上應(yīng)該更快、更低能耗，從而高效支持復(fù)雜的 AI 應(yīng)用。」

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4811

瀏覽量
103041
計算機(jī)

計算機(jī)

+關(guān)注

關(guān)注
19

文章
7638

瀏覽量
90363
神經(jīng)元

神經(jīng)元

+關(guān)注

關(guān)注
1

文章
368

瀏覽量
18780

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

完全通過光學(xué)，不要計算機(jī)也能構(gòu)建個神經(jīng)網(wǎng)絡(luò)？

港科大的全光學(xué)神經(jīng)網(wǎng)絡(luò)是什么

非線性光學(xué)激活函數(shù)

評論

搜索歷史

完全通過光學(xué)，不要計算機(jī)也能構(gòu)建個神經(jīng)網(wǎng)絡(luò)？

港科大的全光學(xué)神經(jīng)網(wǎng)絡(luò)是什么

非線性光學(xué)激活函數(shù)

評論

完全通過光學(xué)，不要計算機(jī)也能構(gòu)建個神經(jīng)網(wǎng)絡(luò)？