在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種創(chuàng)新的存內(nèi)計(jì)算架構(gòu)

lC49_半導(dǎo)體 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-10-31 15:14 ? 次閱讀

摘要

傳感器和數(shù)據(jù)生成設(shè)備的大規(guī)模發(fā)展推動(dòng)了現(xiàn)代計(jì)算范式的轉(zhuǎn)變,從以算術(shù)邏輯為中心向以數(shù)據(jù)為中心的處理。在硬件層面,這迫切需要將密集、高性能和低功耗的存儲(chǔ)單元與Si邏輯處理器單元集成起來(lái)。然而,像搜索和模式匹配這樣的數(shù)據(jù)密集型問(wèn)題也需要在電路和架構(gòu)級(jí)別進(jìn)行范式更改創(chuàng)新,以支持內(nèi)存計(jì)算(CIM)操作。CIM體系結(jié)構(gòu)結(jié)合了數(shù)據(jù)存儲(chǔ),同時(shí)提供低延遲和小占用是非常受歡迎的,但尚未實(shí)現(xiàn)。在這里,我們提出了氮化鋁鈧(AlScN)鐵電二極管(FeD)憶阻器件,允許存儲(chǔ),搜索和基于神經(jīng)網(wǎng)絡(luò)的模式識(shí)別在一個(gè)無(wú)晶體管的架構(gòu)。我們的設(shè)備可以直接集成在Si處理器的頂部,以可擴(kuò)展的后端流程。我們利用聯(lián)邦儲(chǔ)備系統(tǒng)的現(xiàn)場(chǎng)可編程性、非波動(dòng)性和非線性來(lái)演示電路塊,該電路塊可以支持原位內(nèi)存搜索操作,搜索延遲時(shí)間< 0.1 ns,單元占用面積< 0.12μm2。此外,我們還演示了用FeD的4位運(yùn)算進(jìn)行矩陣乘法運(yùn)算。我們的研究結(jié)果表明,F(xiàn)eD是快速、高效和多功能CIM平臺(tái)的有前途的候選者。

簡(jiǎn)介

大數(shù)據(jù)與人工智能(AI)的融合催生了多個(gè)新興技術(shù),涵蓋了一系列計(jì)算應(yīng)用。傳感器和邊緣/物聯(lián)網(wǎng)設(shè)備的日益普遍的存在創(chuàng)造了大量的數(shù)據(jù),這暴露了計(jì)算硬件的巨大效率差距,從移動(dòng)和邊緣設(shè)備到數(shù)據(jù)中心和云計(jì)算硬件。此外,基于硅的互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)器件小型化的放緩進(jìn)一步加劇了基于傳統(tǒng)馮·諾依曼計(jì)算硬件架構(gòu)(特別是中央處理單元(CPU)、圖形處理單元(GPU)和現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA))之間的資源需求差距。此外,眾所周知,在馮·諾依曼架構(gòu)中,許多以數(shù)據(jù)為中心的任務(wù),大部分的能量和時(shí)間都消耗在內(nèi)存訪問(wèn)和數(shù)據(jù)移動(dòng)上,而不是實(shí)際的計(jì)算上。為了緩解和克服這一瓶頸,已經(jīng)提出了幾種解決方案,其中一個(gè)突出的解決方案是將內(nèi)存和邏輯單元放置在物理上非常接近的位置。雖然在材料和設(shè)備層面上這些方面已經(jīng)取得了重大進(jìn)展,但一種革命性的方法將是使用原位存儲(chǔ)器執(zhí)行計(jì)算功能。這通常稱為存內(nèi)計(jì)算(CIM)。CIM的首要目標(biāo)是通過(guò)在數(shù)據(jù)存儲(chǔ)的位置就地完成計(jì)算,從根本上改變計(jì)算架構(gòu),而不是通過(guò)在內(nèi)存帶寬、新的非易失性內(nèi)存(NVM)技術(shù)和數(shù)據(jù)并行性方面的單獨(dú)優(yōu)化來(lái)重新設(shè)計(jì)傳統(tǒng)的馮·諾依曼架構(gòu)架構(gòu)。雖然已經(jīng)有幾個(gè)使用馮·諾依曼架構(gòu)的CIM體系結(jié)構(gòu)演示,但大部分工作都被限制在單一類型的計(jì)算任務(wù)上,例如矩陣乘法加速器,通常使用記憶交叉條陣列實(shí)現(xiàn)。然而,利用“大數(shù)據(jù)”的AI計(jì)算任務(wù)通常需要在同一個(gè)芯片上進(jìn)行多個(gè)數(shù)據(jù)密集型計(jì)算操作,最好使用相同的架構(gòu)來(lái)處理管道中的信息。三個(gè)最重要的功能或操作是:1)片上存儲(chǔ),2)并行搜索,3)矩陣乘法。構(gòu)建CIM體系結(jié)構(gòu)的一個(gè)關(guān)鍵挑戰(zhàn)是實(shí)現(xiàn)這三個(gè)功能所需的性能和靈活性之間的矛盾權(quán)衡。因此,雖然CIM加速器已經(jīng)被證明可以在矩陣乘法加速方面實(shí)現(xiàn)高性能,但從根本上來(lái)說(shuō),它們并不適合于并行搜索等其他大數(shù)據(jù)操作。因此,為CIM概念化和開(kāi)發(fā)可重構(gòu)和操作靈活的硬件非常重要,以同時(shí)支持基本的數(shù)據(jù)操作,如片上存儲(chǔ)器、并行搜索和矩陣乘法加速。

在這項(xiàng)工作中,我們利用了氮化鋁鈧(AlScN)鐵電二極管(FeD)器件的獨(dú)特特性——特別是其現(xiàn)場(chǎng)可編程性、非波動(dòng)性和非線性——并演示了基于FeD器件的電路塊,該器件在無(wú)晶體管設(shè)計(jì)中支持多個(gè)基本原始數(shù)據(jù)操作的原位存儲(chǔ)器(圖1)。具體來(lái)說(shuō),首先,我們展示了非易失性且具有自整流行為的FeD裝置,其非線性> 106,高開(kāi)/關(guān)比超過(guò)102,續(xù)航超過(guò)104個(gè)周期,現(xiàn)場(chǎng)編程速度超過(guò)500ns,并與CMOS線后端(BEOL)處理兼容。然后,我們利用這些獨(dú)特的特性,并演示了使用0-晶體管/2-FeD單元的非易失性三元內(nèi)容尋址存儲(chǔ)器(TCAM)。這些都是大數(shù)據(jù)應(yīng)用中并行搜索過(guò)程的內(nèi)存計(jì)算硬件實(shí)現(xiàn)的關(guān)鍵構(gòu)建塊。這種無(wú)晶體管的方法是我們的設(shè)備和存儲(chǔ)單元設(shè)計(jì)的一個(gè)關(guān)鍵優(yōu)點(diǎn)。因此,與基于2-晶體管/2電阻(2T-2R)的TCAM細(xì)胞相比,2-饋源TCAM具有最緊湊的設(shè)計(jì)(45 nm節(jié)點(diǎn)0.12μm2/cell),搜索延遲顯著降低(45 nm節(jié)點(diǎn)< 0.1 ns),通過(guò)集成電路強(qiáng)調(diào)(SPICE)模擬進(jìn)行評(píng)估。最后,我們還表明,通過(guò)電脈沖,F(xiàn)eD器件可以編程成具有優(yōu)越線性和對(duì)稱性的4位獨(dú)特導(dǎo)電狀態(tài)。利用這種可編程的、多比特的鐵電二極管屬性,我們以模擬電壓-振幅矩陣乘法的形式演示了神經(jīng)網(wǎng)絡(luò)計(jì)算的硬件實(shí)現(xiàn),這是神經(jīng)網(wǎng)絡(luò)計(jì)算的一個(gè)關(guān)鍵核心。我們演示了接近理想的、基于軟件的神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性。通過(guò)在卷積神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)中將神經(jīng)網(wǎng)絡(luò)權(quán)重映射到實(shí)驗(yàn)FeD電導(dǎo)狀態(tài),對(duì)矩陣乘法操作進(jìn)行基準(zhǔn)測(cè)試,用于推理和原位學(xué)習(xí)任務(wù),結(jié)果表明我們的精度接近MNIST數(shù)據(jù)集的理想軟件級(jí)模擬。我們的研究結(jié)果表明,基于氮化鋁鈧(AlScN)、現(xiàn)場(chǎng)可編程、非volatile的FEDS為構(gòu)建可重構(gòu)CIM體系結(jié)構(gòu)提供了獨(dú)特的機(jī)會(huì),可以在性能和靈活性之間取得卓越的平衡。

現(xiàn)場(chǎng)可編程氮化鋁鈧(AlScN)

鐵電二極管(FeD)存儲(chǔ)器

我們的FeD器件由一層45納米厚的濺射沉積鐵電AlScN層夾在頂部和底部的鋁電極之間。這形成了金屬絕緣體(MIM)結(jié)構(gòu),如圖2a左面板所示。AlScN是一種新發(fā)現(xiàn)的鐵電材料,具有近乎理想的鐵電滯回線、剩余極化記錄值和成分可調(diào)的矯頑力場(chǎng)。此外,它可以直接集成在8英寸晶圓上的CMOS BEOL兼容工藝技術(shù)中。它也被證明是最有前途的高性能鐵電存儲(chǔ)器件的候選人之一,可擴(kuò)展到小于10 nm的厚度。AlScN薄膜進(jìn)行了電性表征,并表現(xiàn)出2-4.5 MV/cm的大矯頑力場(chǎng)EC。這對(duì)于擴(kuò)展到更薄的鐵電層非常重要,同時(shí)保持大的內(nèi)存窗口、高的開(kāi)/關(guān)比和良好的保持。當(dāng)結(jié)合測(cè)量到的高殘留極化(Pr為80-150μC/cm2)時(shí),基于強(qiáng)的隧道勢(shì)壘調(diào)制,會(huì)產(chǎn)生顯著的隧穿電阻效應(yīng),從而產(chǎn)生高的開(kāi)/關(guān)比(補(bǔ)充注釋1)。圖2(a)給出了MIM FeD器件的代表性截面透射電子顯微鏡(TEM)圖像,該器件由AlScN薄膜和Al頂部電極組成,沉積在Al/AlScN/Si襯底上。AlScN薄膜的原子分辨率TEM圖像如圖2(b1)所示。圖2(b2)顯示了AlScN/底部Al界面處約2nm厚的界面層。

3794b170-56c7-11ed-a3b6-dac502259ad0.png

圖1所示。基于現(xiàn)場(chǎng)可編程鐵電二極管的可重構(gòu)CIM。

a.具有鐵電AlScN上下極化的交叉桿結(jié)構(gòu)中的FeD器件示意圖。如b-d所示,這些設(shè)備的現(xiàn)場(chǎng)可編程性、非波動(dòng)性和非線性可以用于多個(gè)基本數(shù)據(jù)操作,如存儲(chǔ)、搜索和神經(jīng)網(wǎng)絡(luò),而不需要額外的晶體管。

b.兩端FeD器件表現(xiàn)出類似二極管的自整流行為,具有非線性> 106,同時(shí)具有超過(guò)102的開(kāi)/關(guān)比和超過(guò)104循環(huán)的耐久性,使FeD器件在存儲(chǔ)的內(nèi)存層次中處于很好的位置。此外,高非線性可以抑制潛電流,而不需要額外的接入晶體管或選擇器。

c.對(duì)于搜索操作,一個(gè)非易失性TCAM可以建立在0-晶體管/2-FeD單元上,這是大數(shù)據(jù)應(yīng)用中并行搜索的內(nèi)存計(jì)算硬件實(shí)現(xiàn)的構(gòu)建塊。

d.對(duì)于神經(jīng)網(wǎng)絡(luò),F(xiàn)eD器件可以提供不同的多重導(dǎo)電狀態(tài)的可編程性,且與電脈沖的數(shù)量有高度的線性關(guān)系。這允許映射矩陣乘法運(yùn)算(神經(jīng)網(wǎng)絡(luò)計(jì)算的一個(gè)關(guān)鍵核心),通過(guò)將輸入向量編碼為模擬電壓幅值,并將矩陣元素編碼為一組FeD裝置的電導(dǎo),讀取FeD裝置每位線上的累積電流。

45nm AlScN薄膜的鐵電響應(yīng)通過(guò)在半徑為25μm的圓形金屬/鐵電/金屬電容上進(jìn)行正上,負(fù)下(PUND)測(cè)量來(lái)表征,使用的方波延遲為2μs,脈沖寬度為400 ns(補(bǔ)充圖S11)。PUND測(cè)試優(yōu)于偏振-電場(chǎng)遲滯回線(P-E回線)測(cè)量,因?yàn)?5 nm AlScN的P-E回線顯示出偏振依賴的漏電,這妨礙了對(duì)將材料切換到金屬-極性態(tài)的正應(yīng)用場(chǎng)的極化飽和的觀測(cè)。PUND結(jié)果顯示,殘余極化約為150 μ C/cm2,如圖2c所示,與之前的觀察結(jié)果一致。為了進(jìn)一步驗(yàn)證鐵電開(kāi)關(guān),進(jìn)行了動(dòng)態(tài)電流響應(yīng),觀察到鐵電開(kāi)關(guān)對(duì)應(yīng)的峰值(補(bǔ)充圖S12)。為了進(jìn)一步表征記憶效應(yīng)和可靠性,我們?cè)谡龢O化和負(fù)極化狀態(tài)之間進(jìn)行了耐力測(cè)試,如圖2d所示。圖2d顯示了從20,000個(gè)PUND循環(huán)中提取的剩余正負(fù)極化。同一AlScNFeD裝置的循環(huán)設(shè)置/重置操作表明,正負(fù)極化狀態(tài)都是穩(wěn)定的,并且在相當(dāng)數(shù)量的循環(huán)內(nèi)都是可重寫(xiě)的。如圖2e所示,我們通過(guò)對(duì)頂部電極施加負(fù)/正電壓,同時(shí)對(duì)底部電極接地,在低電阻狀態(tài)(LRS)和高電阻狀態(tài)(HRS)之間反復(fù)設(shè)置/重置FeD裝置,使用準(zhǔn)直流電壓掃描,循環(huán)100次。FeD器件顯示超低工作電流和自整流行為,在9v到0v之間具有非線性> 106,這有助于抑制隱藏電流,而不需要額外的接入晶體管或選擇器。LRS和HRS電阻的分布如圖2f所示,顯示了LRS和HRS之間的比值在周期與周期變化上的緊密分布。

37d8593e-56c7-11ed-a3b6-dac502259ad0.png

圖2所示。AlScN/MoS2 fe - fet的室溫電性表征。

a, AlScN FeD器件的3D示意圖和AlScN FeD的截面TEM圖像,顯示45nm AlScN為鐵電開(kāi)關(guān)層。

b,在(a)中所示區(qū)域(1)和(2)獲得的鐵電體和界面原子結(jié)構(gòu)可見(jiàn)的高分辨率相位對(duì)比TEM圖像。

c,脈沖寬度為400ns,脈沖間延遲為2μs的45nm AlScN薄膜的PUN結(jié)果。PUND測(cè)試顯示飽和剩余極化為150μC/cm2。

d,利用1.5μs脈沖寬度和26 V振幅對(duì)AlScN薄膜進(jìn)行持久測(cè)試時(shí)的PUND測(cè)量提取的剩余極化值。

e,在基于45納米 AlScN的FEDs上進(jìn)行100個(gè)周期的程序和擦除測(cè)量。

f, e中程序和擦除測(cè)量過(guò)程中HRS和LRS電阻的分布。

2-FeD TCAM單元用于搜索

接下來(lái),我們關(guān)注CIM電路架構(gòu)和計(jì)算應(yīng)用程序,包括上述作為非易失性存儲(chǔ)器的FeDs。我們首先演示一個(gè)使用FeDs的TCAM實(shí)現(xiàn)。TCAM是大數(shù)據(jù)應(yīng)用中快速高效并行搜索CIM硬件實(shí)現(xiàn)的關(guān)鍵構(gòu)件。TCAM通過(guò)并行比較輸入數(shù)據(jù)與存儲(chǔ)在內(nèi)存數(shù)組中的數(shù)據(jù)來(lái)執(zhí)行搜索功能,并在檢測(cè)到匹配時(shí)返回?cái)?shù)據(jù)地址。這種并行搜索允許TCAM在一個(gè)時(shí)鐘周期內(nèi)執(zhí)行查找表功能。與存儲(chǔ)“0”或“1”位值的二進(jìn)制內(nèi)容尋址存儲(chǔ)單元不同,TCAM單元可以存儲(chǔ)額外的“X”(“不在乎”)位,這將導(dǎo)致匹配狀態(tài),而不管輸入的搜索數(shù)據(jù)是什么,并使TCAM在搜索應(yīng)用程序中更加強(qiáng)大。然而,在傳統(tǒng)的Si CMOS結(jié)構(gòu)中,需要多個(gè)晶體管(~16)來(lái)構(gòu)建一個(gè)具有靜態(tài)隨機(jī)訪問(wèn)存儲(chǔ)器(SRAM)的TCAM單元(圖3a)。由于晶體管的充放電和互連寄生電容,這種配置導(dǎo)致了大的占地面積和高功耗。這限制了該配置在高速、大規(guī)模和功率受限系統(tǒng)中的使用。非易失性存儲(chǔ)器(NVM)是實(shí)現(xiàn)TCAM的有前途的替代方案,因?yàn)樗鼈兏?jié)約占地面積和更節(jié)能。這是因?yàn)樗鼈冊(cè)诟o湊的體系結(jié)構(gòu)中形成了一個(gè)單獨(dú)的TCAM單元,并且即使電源被切斷,它們也保留了存儲(chǔ)的信息。基于電阻性隨機(jī)存取存儲(chǔ)器(RRAMs)的TCAM、磁隧道結(jié)(MTJ) RAM、浮柵晶體管存儲(chǔ)器(FLASH)和相變存儲(chǔ)器(PCMs)已經(jīng)被證實(shí)。然而,所有這些架構(gòu)仍然構(gòu)建在線前端晶體管之上,沒(méi)有一個(gè)完全兼容BEOL。

在這項(xiàng)工作中,TCAM的單元結(jié)構(gòu)可以通過(guò)僅使用兩個(gè)FeDs而顯著簡(jiǎn)化,由于FeDs具有很大的非線性,因此不需要加入晶體管(圖3a)。圖3b演示了單個(gè)FeD TCAM電池的工作。電池結(jié)構(gòu)使利用FeD crossbar存儲(chǔ)器陣列變得很自然,其中連接到陽(yáng)極和陰極的信號(hào)線在TCAM演示的位搜索中并行,如補(bǔ)充圖S3所示。首先,我們討論了基于FeDs的TCAM如何存儲(chǔ)和搜索“0”或“1”位(圖3b)。在單元操作過(guò)程中,首先將互補(bǔ)狀態(tài)寫(xiě)入兩個(gè)FeDs,如果搜索數(shù)據(jù)在搜索線(SL和非SL)上有偏差,與存儲(chǔ)的信息匹配,匹配線(ML)保持高;否則,ML被下拉。正如我們?cè)诔婵罩兴故镜模現(xiàn)eD設(shè)備具有高度的自整流能力,并能維持較高的開(kāi)/關(guān)比。因此,只有當(dāng)FeD被編程為低電阻狀態(tài)且讀電壓高于FeD的打開(kāi)電壓時(shí),ML上才會(huì)發(fā)生放電。

如圖3b所示,我們將邏輯“1”狀態(tài)寫(xiě)入到FeD TCAM單元中,分別將左/右FeD設(shè)置為低阻/高阻狀態(tài)。在搜索操作中,匹配線被一個(gè)讀電壓VS所偏置,它高于FeD的啟動(dòng)電壓。接下來(lái),我們通過(guò)分別對(duì)左/右FeD施加高/低電壓來(lái)搜索邏輯“1”,并通過(guò)分別對(duì)左/右FeD施加低/高來(lái)搜索邏輯“0”。在這種情況下,“高壓”指的是讀電壓VS,它高于FeD的打開(kāi)電壓,但低于寫(xiě)電壓。相反,“低電壓”指的是接近零的讀電壓,遠(yuǎn)低于FeD的打開(kāi)電壓。由于左FeD與右FeD平行,只有當(dāng)單元中的兩個(gè)FeD都被截?cái)鄷r(shí),才會(huì)觀察到匹配狀態(tài)(圖3b,左面板)。根據(jù)這些寫(xiě)入和搜索方案,當(dāng)存儲(chǔ)數(shù)據(jù)和搜索數(shù)據(jù)匹配時(shí)(如圖3b左面板所示,存儲(chǔ)位為邏輯' 1 ',搜索位為邏輯' 1 '),低電阻為0的FeD器被關(guān)閉,因?yàn)樗年?yáng)極和陰極之間的壓降接近于零,低于它的打開(kāi)電壓。此外,高阻狀態(tài)下的FeD也是截止的,因?yàn)殡娏髟诟咦锠顟B(tài)下通過(guò)FeD時(shí)自然是低的。因此,在兩個(gè)通道的放電電流都是最小的,ML保持較高。但是,當(dāng)搜索數(shù)據(jù)與存儲(chǔ)數(shù)據(jù)不匹配時(shí),即使處于高阻狀態(tài)的右側(cè)FeD仍然被切斷,但左側(cè)FeD沒(méi)有被切斷。左FeD低阻通電時(shí),其正極和陰極之間的壓降為VS,且高于其接通電壓的值為0。因此,放電電流顯著,ML電壓較低(圖3b,中面板)。我們還演示了兩個(gè)基于美聯(lián)儲(chǔ)的TCAM中的三元“不在乎”狀態(tài)。如圖3b的右面板所示,通過(guò)將左右兩個(gè)FeD設(shè)置為高電阻狀態(tài),我們將邏輯“不在乎”狀態(tài)寫(xiě)入FeD TCAM單元。使用上面的寫(xiě)方案和邏輯“1”和“0”相同的搜索方案,無(wú)論什么信號(hào)到達(dá)兩個(gè)FeDs,這兩個(gè)FeDs總是被切斷,因?yàn)樗鼈兲幱诟唠娮锠顟B(tài)。圖3c顯示了在搜索數(shù)據(jù)和存儲(chǔ)數(shù)據(jù)位' 1 '之間的匹配和不匹配狀態(tài)下,使用7 V的中等搜索電壓對(duì)兩個(gè)基于FeD的TCAM單元的電阻進(jìn)行重復(fù)準(zhǔn)直流讀取。圖3d顯示了使用查詢位“1”和“0”對(duì)存儲(chǔ)數(shù)據(jù)位“Don’t care”的兩個(gè)FeD TCAM單元電阻的重復(fù)準(zhǔn)直流讀取。這表明,對(duì)于這兩個(gè)查詢,兩個(gè)基于FeDs的TCAM的ML阻力仍然很高,因此沒(méi)有通過(guò)任何兩個(gè)FeDs進(jìn)行放電。因此,帶有兩個(gè)FeDs的TCAM單元在所有三種狀態(tài)下都能完全工作。兩種基于FeD的TCAM單元的完整查找表匯總在補(bǔ)充表中。

傳統(tǒng)的雙端憶阻器通常與前端晶體管配對(duì)構(gòu)成TCAM單元。這是因?yàn)榫w管需要切斷通道,因?yàn)樗鼈兣c雙端nvm串聯(lián)在一起。基于FeD的設(shè)計(jì)得益于高自整流比,無(wú)需任何晶體管就能切斷通道。換句話說(shuō),F(xiàn)eD將晶體管的功能抽象為自身的自整流行為。沒(méi)有晶體管導(dǎo)致更小的電池足跡和面積效率,并提高了基于美聯(lián)儲(chǔ)的TCAM的搜索速度。通過(guò)SPICE模擬,我們驗(yàn)證了基于FeD的TCAM中的搜索延遲與之前基于2晶體管2電阻(2T-2R)的TCAM體系結(jié)構(gòu)相比有所降低。圖3e顯示了各種TCAM單元橫向足跡與搜索延遲的基準(zhǔn)對(duì)比圖。我們的兩個(gè)基于FeD的超CMOS SRAM TCAM和其他基于晶體管+ NVM設(shè)備的架構(gòu)的卓越性能是顯而易見(jiàn)的。

基于FeDs的TCAM的感知度是自整流比和ON/OFF電導(dǎo)(或電流)比的函數(shù)。根據(jù)我們?cè)敿?xì)的緊湊模型(見(jiàn)補(bǔ)充注釋1),通過(guò)在FeD層頂部集成一個(gè)非鐵電絕緣體,并對(duì)這些鐵電絕緣體和非鐵電絕緣體層之間的厚度比以及鐵電層的矯頑場(chǎng)進(jìn)行工程設(shè)計(jì),可以進(jìn)一步提高FeD的開(kāi)/關(guān)比。未來(lái)的研究將專注于通過(guò)設(shè)計(jì)這些變量來(lái)進(jìn)一步提高感知邊緣。

3819ae2a-56c7-11ed-a3b6-dac502259ad0.png

圖3。2-FeD TCAM單元用于搜索操作

a,帶有匹配線(ML)、搜索線(SL)和搜索線(SL條)電極(左)的TCAM單元的方框示意圖。基于CMOS voltle靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)技術(shù)的單16晶體管(16T) TCAM電池電路圖,以及基于PCM和RRAM等電阻性存儲(chǔ)元件的2晶體管2電阻(2T2R) TCAM電路。(中間)。本工作中提出的兩個(gè)基于二鐵二極體的TCAM電池(右)通過(guò)使用兩個(gè)平行但極性相反的FeDs連接顯著簡(jiǎn)化了TCAM設(shè)計(jì)。

b.由2個(gè)federal組成的單個(gè)TCAM單元對(duì)“匹配”、“不匹配”和“不在乎”狀態(tài)的操作。

c,對(duì)于搜索數(shù)據(jù)和存儲(chǔ)數(shù)據(jù)位' 1 '之間的匹配和不匹配狀態(tài),重復(fù)準(zhǔn)直流讀取兩個(gè)FeDs TCAM單元的電阻,顯示在ML電阻上有>100 X的差異。

d,使用查詢位“1”和“0”重復(fù)準(zhǔn)dc讀取存儲(chǔ)數(shù)據(jù)位“Don’t care”的兩個(gè)鐵二極管TCAM單元的電阻,結(jié)果表明,對(duì)于兩個(gè)查詢,兩個(gè)FeDs TCAM的ML電阻都很高,因此沒(méi)有通過(guò)兩個(gè)FeDs中的任何一個(gè)放電。

e,各種存儲(chǔ)技術(shù)中TCAM細(xì)胞橫向足跡與搜索延遲的基準(zhǔn)對(duì)比圖。這個(gè)估計(jì)假設(shè)單一FeD面積為0.0081μm2。

神經(jīng)網(wǎng)絡(luò)

接下來(lái),我們將關(guān)注我們的FeD設(shè)備陣列在深度神經(jīng)網(wǎng)絡(luò)(DNN)推理中的應(yīng)用,這涉及到重復(fù)矩陣乘法/累積(MMAC)操作。MMAC操作和DNN通常在軟件級(jí)別實(shí)現(xiàn)。然而,它們的軟件實(shí)現(xiàn)使得在電力和資源受限的設(shè)備或環(huán)境中部署它們特別具有挑戰(zhàn)性。同樣,這在很大程度上是由于傳統(tǒng)的馮諾依曼計(jì)算硬件方法,它在內(nèi)存訪問(wèn)方面是密集的,很難并行化。在模擬域進(jìn)行MMAC操作提供了一種有前途的替代方案:具有模擬導(dǎo)管的憶阻器已被證明是執(zhí)行MMAC操作的優(yōu)越硬件介質(zhì)。通過(guò)利用基爾霍夫電流定律(KCL)的高并行性,MMAC操作可以顯著減少到讀取單個(gè)時(shí)鐘在憶阻器的每個(gè)位線上的累積電流。這是通過(guò)將輸入矢量編碼到模擬電壓幅值和將矩陣元素編碼到憶阻器陣列的電導(dǎo)來(lái)實(shí)現(xiàn)的。

理想的適合MMAC的憶性器件應(yīng)該在電氣編程中實(shí)現(xiàn)線性排列的電導(dǎo)值,電流對(duì)驅(qū)動(dòng)電壓的線性依賴,以及抑制電流量的高電阻。該領(lǐng)域的先前研究主要集中在具有優(yōu)異歐姆性能和大量電導(dǎo)狀態(tài)的記憶器件上,如RRAM和PCM。在DNN推理精度的背景下,電流和電壓之間的線性關(guān)系是最小化輸入基準(zhǔn)失真的必要條件,大量的電導(dǎo)將使權(quán)矩陣上的精度損失最小化,這對(duì)于執(zhí)行高度精確的推理任務(wù)是必不可少的。然而,從功率和面積效率的角度來(lái)看,一個(gè)優(yōu)秀的歐姆行為和大量的電導(dǎo)狀態(tài)將損害結(jié)構(gòu)指標(biāo)的功率效率和每次計(jì)算的低延遲。這有幾個(gè)原因。首先,具有優(yōu)異歐姆性能的憶性器件以高器件導(dǎo)電性為代價(jià),這意味著高工作電流限制了陣列的縮放。其次,大量的電導(dǎo)將相應(yīng)地需要高精度模數(shù)轉(zhuǎn)換器(adc)。從先前的工作中我們已經(jīng)知道,在憶阻陣列系統(tǒng)中,電路級(jí)別上的adc支配著能量和面積成本。因此,更多的電導(dǎo)狀態(tài)意味著在DNN推理引擎的架構(gòu)級(jí)別上更多的功率開(kāi)銷(xiāo)。因此,DNN推理的準(zhǔn)確性與功率和面積效率之間存在明顯的權(quán)衡。在這里,我們展示了FeD憶阻器可以用于執(zhí)行這些指標(biāo)之間的最佳權(quán)衡。首先,為了實(shí)現(xiàn)器件導(dǎo)電性的權(quán)衡,重要的是在保持線性行為的同時(shí)降低記憶器件的操作導(dǎo)電性。前一個(gè)條件對(duì)于高度自整流的設(shè)備來(lái)說(shuō)很容易滿足,這是聯(lián)邦儲(chǔ)備銀行的固有屬性;后一個(gè)條件可以通過(guò)在輸入電壓振幅上應(yīng)用編碼器來(lái)線性化電流-電壓關(guān)系(見(jiàn)補(bǔ)充注2)來(lái)滿足。第二,為了放松電導(dǎo)狀態(tài)數(shù)量上的權(quán)衡,需要少量但稀疏且線性排列的電導(dǎo)狀態(tài)。與實(shí)現(xiàn)大量電導(dǎo)狀態(tài)的方法相比,這種方法可以獲得等效的推理精度。

圖4a顯示了通過(guò)逐步電壓脈沖調(diào)制的FeD系統(tǒng)的逐步切換。使用逐步電壓脈沖,F(xiàn)eD電池逐漸編程成16個(gè)不同的電導(dǎo)狀態(tài)。這些電導(dǎo)狀態(tài)顯示與編程脈沖數(shù)量的高度線性,如下所述。圖(左)顯示了一系列編程操作,其中逐步電壓脈沖(范圍從16 V到19 V)應(yīng)用于FeDs的頂部電極上,然后每次都進(jìn)行擦除操作。標(biāo)注窗口(右)顯示了一個(gè)代表性周期的電導(dǎo)與脈沖數(shù)的關(guān)系。圖4b顯示,F(xiàn)eD器件能夠?qū)崿F(xiàn)電壓脈沖誘導(dǎo)模擬雙極開(kāi)關(guān)(范圍從16v到19v,左)。標(biāo)注窗口(右)顯示了一個(gè)逐步編程和逐步擦除的循環(huán)。在雙向調(diào)制中,F(xiàn)eD器件對(duì)16種不同的電導(dǎo)狀態(tài)表現(xiàn)出優(yōu)越的線性(線性擬合的R2分?jǐn)?shù)為0.9997)。圖4c顯示了16種不同電導(dǎo)狀態(tài)下的電導(dǎo)保留率,并沒(méi)有顯示明顯的退化。圖4d顯示了在16個(gè)程序脈沖(脈沖寬度為2 μs),交錯(cuò)讀取(8 V)的相同序列下,五個(gè)獨(dú)立的FeD器件的電導(dǎo)狀態(tài)分布。結(jié)果顯示,這些FeD設(shè)備之間的設(shè)備間的差異可以忽略不計(jì)。我們注意到,用于編程這些狀態(tài)的FeD器件的電導(dǎo)范圍(~25-250 nS)比用于TCAM操作的電導(dǎo)范圍(~ 2-250 nS)小得多。這主要是因?yàn)樵谳^小的電導(dǎo)范圍內(nèi)可以更好地實(shí)現(xiàn)工作中的線性。此外,DNN推理應(yīng)用不一定需要高范圍的電導(dǎo)調(diào)制。我們?cè)谝粋€(gè)用于計(jì)算機(jī)視覺(jué)的訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)的實(shí)際應(yīng)用中,模擬了由這種FeD設(shè)備組成的陣列的性能。在MNIST數(shù)據(jù)集(MNIST, Modified National Institute of Standards and Technology database)上訓(xùn)練一個(gè)CNN(包括兩個(gè)卷積層和一個(gè)全連接層),然后將預(yù)訓(xùn)練的權(quán)重轉(zhuǎn)移到FeD電導(dǎo)范圍。該網(wǎng)絡(luò)的示意圖如圖4e所示。我們分析了由于重量轉(zhuǎn)移到低精度的電導(dǎo)值,加上一個(gè)附加的可變因子A,這是一個(gè)非線性指標(biāo),精度下降。A因子與非線性的關(guān)系已在補(bǔ)充注3中詳細(xì)討論。因此,全精度訓(xùn)練網(wǎng)絡(luò)的權(quán)重被量化為若干電導(dǎo)狀態(tài)(從1位到9位不等)。然后,對(duì)網(wǎng)絡(luò)在MNIST測(cè)試數(shù)據(jù)集上的準(zhǔn)確性進(jìn)行重新評(píng)估。卷積神經(jīng)網(wǎng)絡(luò)對(duì)于低精度的權(quán)值傳遞具有較低的非線性(A > 0.5)的魯棒性,如圖4f所示。圖4f中,對(duì)于低精度的權(quán)值傳遞變化,在單精度浮動(dòng)點(diǎn)數(shù)格式(FP32)上僅用3位的權(quán)值精度恢復(fù)了97.5%的全精度測(cè)試精度。對(duì)于較高的非線性(A <0.35), FP32上需要1 ~ 2位權(quán)精度才能恢復(fù)全精度測(cè)試精度,這說(shuō)明線性排列稀疏的電導(dǎo)狀態(tài)具有良好的線性性,可以替代大量的電導(dǎo)狀態(tài),實(shí)現(xiàn)等效推理精度。此外,我們?cè)贔eD陣列上模擬原位訓(xùn)練的內(nèi)存實(shí)現(xiàn),其中訓(xùn)練相同的卷積神經(jīng)網(wǎng)絡(luò),并在每次反向傳播后將權(quán)值更新直接映射到FeD的實(shí)際電導(dǎo)狀態(tài)。如圖4g所示,對(duì)于圖4a中FeD器件中演示的16個(gè)獨(dú)立電導(dǎo)狀態(tài),原位學(xué)習(xí)精度比在FP32上訓(xùn)練的精度下降了約2%。然而,使用更先進(jìn)的低精度訓(xùn)練技術(shù)和軟件上的模型壓縮技術(shù),我們相信這個(gè)數(shù)字可以大幅減少,允許在訓(xùn)練階段執(zhí)行低精度權(quán)重轉(zhuǎn)移到FeD設(shè)備時(shí)幾乎沒(méi)有精度下降。

38568fd4-56c7-11ed-a3b6-dac502259ad0.png

圖4。FeD-based神經(jīng)網(wǎng)絡(luò)。

a,通過(guò)逐步電壓調(diào)制脈沖在鐵二極管(FeD)中逐步開(kāi)關(guān)。使用逐步電壓脈沖將FeD電池逐步編程成各種電導(dǎo)狀態(tài)。左面板顯示了一系列編程操作,其中逐步電壓脈沖偏向于聯(lián)邦電極上的頂部電極,每次都跟著一個(gè)擦除操作。標(biāo)注窗口(右面板)顯示一個(gè)代表性周期的電導(dǎo)與脈沖數(shù)的關(guān)系。

b, FeD被證明能夠進(jìn)行電壓脈沖誘導(dǎo)模擬雙極開(kāi)關(guān)(左)。標(biāo)注窗口(右)顯示了一個(gè)逐步編程和逐步擦除的循環(huán)。在16個(gè)不同的狀態(tài)下,F(xiàn)eD器件顯示了優(yōu)越的線性。

c, 16個(gè)不同電阻狀態(tài)的電阻保留率。

d,受16個(gè)程序脈沖(2 μs脈沖寬度)序列和交錯(cuò)讀取(8 V)的影響,五個(gè)獨(dú)立的FeDs的電阻狀態(tài)分布。

e,為MNIST數(shù)據(jù)集訓(xùn)練的CNN的插圖。使用鐵二極管陣列進(jìn)行矩陣乘法的神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)可以在完全模擬模式下運(yùn)行,而無(wú)需外圍的模數(shù)轉(zhuǎn)換器。

f.仿真包括實(shí)現(xiàn)模擬權(quán)層的FeD設(shè)備,以及在MNIST上訓(xùn)練的帶有FP32計(jì)算的網(wǎng)絡(luò)的不準(zhǔn)確權(quán)映射。(f)中的模擬表明,當(dāng)A < 0.5時(shí)權(quán)重精度僅為3位時(shí),網(wǎng)絡(luò)推理精度的退化小于1%。

g,直接使用實(shí)現(xiàn)模擬權(quán)層的FeD設(shè)備對(duì)(e)中的網(wǎng)絡(luò)進(jìn)行原位訓(xùn)練的模擬。利用fbi漸進(jìn)編程中的優(yōu)越線性,模擬權(quán)值層具有16個(gè)電阻狀態(tài),其推理精度可與FP32計(jì)算基線相媲美。

結(jié)論

總之,我們證明了基于AlScN的ferrodiode(鐵二極管器件)是一種新穎的、BEOL兼容的無(wú)晶體管架構(gòu)多功能CIM平臺(tái)。我們通過(guò)一個(gè)TCAM電路實(shí)現(xiàn)了搜索功能的實(shí)驗(yàn)演示,該電路具有橫向單元足跡和搜索延遲,優(yōu)于所有現(xiàn)有和實(shí)驗(yàn)NVM技術(shù)。最后,我們演示了一種穩(wěn)定的、脈沖可編程的4位存儲(chǔ)器,來(lái)自ferrodiode,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn),其推理精度可與軟件相媲美。因此,我們的工作通過(guò)使新型ferroelectric和使用它們制造的二極管器件成為可能,為CIM平臺(tái)打開(kāi)了新的可能性。

番外

FeD設(shè)備制造的方法

FeD由Si/Al0.8Sc0.2N (85 nm)襯底上的Al (80 nm)/Al0.68Sc0.32N (45 nm)/Al (30 nm) 的薄膜堆棧組成。為了準(zhǔn)備這個(gè)堆棧,我們首先濺射沉積一層85納米厚的Al0.8Sc0.2N模板在6英寸Si <100>晶圓的頂部。采用脈沖-直流無(wú)功濺射沉積單合金Al0.8Sc0.2N靶材料,靶功率為5 kW,壓力為7.47x10-3 mbar,沉積溫度為375℃,在N2氣氛中沉積了Al0.8Sc0.2N。第一層85 nm的Al0.8Sc0.2N將隨后80 nm厚的Al層定向?yàn)閧111}取向。這一層Al (80 nm厚)作為第二層Al0.68Sc0.32N(45 nm厚)的底部電極,這是本器件使用的鐵電層。在Evatec CLUSTERLINE200 II脈沖直流物理氣相沉積系統(tǒng)中,45nm厚的鐵電Al0.68Sc0.32N薄膜從單獨(dú)的4英寸Al和Sc目標(biāo)共濺射。Al和Sc靶分別在1250 W和695 W下工作,卡盤(pán)溫度350℃,Ar氣體流量10 sccm和N2氣體流量25 sccm。腔室壓力維持在~1.45x10-3 mbar。這種濺射條件導(dǎo)致沉積速率為0.3 nm/秒。高取向{111}Al層促進(jìn)了AlScN的生長(zhǎng),其[0001]軸方向垂直于襯底,因此,產(chǎn)生了高紋理的FE薄膜。在不破真空的情況下,濺射出一層30 nm的Al層作為頂電極和蓋層,防止鐵電Al0.68Sc0.32N的氧化。

設(shè)備特征

使用Keithley 4200A半導(dǎo)體表征系統(tǒng)在環(huán)境溫度下的空氣中進(jìn)行電流電壓測(cè)量。利用Keithley 4200A半導(dǎo)體表征系統(tǒng)和輻射精度Premier II測(cè)試平臺(tái)進(jìn)行了FeD AlScN的P-E遲滯回線和PUND測(cè)量。在FEI Helios Nanolab 600聚焦離子束(FIB)系統(tǒng)中,采用原位提升技術(shù)制備TEM橫截面樣品。樣品被涂上薄薄的碳質(zhì)保護(hù)層,用記號(hào)筆在表面寫(xiě)上一條線。隨后使用電子束和離子束沉積鉑保護(hù)層,以防止FIB銑削過(guò)程中的電荷和加熱效應(yīng)。在最后的清洗階段,低能的Ga+離子束(5 keV)用于減少fib誘導(dǎo)的損傷。在200kv加速電壓下運(yùn)行的JEOL F200上進(jìn)行了TEM表征和圖像采集。樣品定向于[001]區(qū)軸進(jìn)行成像。所有捕獲的TEM圖像都是使用數(shù)字顯微軟件收集的。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7603

    瀏覽量

    165795
  • 存內(nèi)計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    30

    瀏覽量

    1458

原文標(biāo)題:一種創(chuàng)新的存內(nèi)計(jì)算架構(gòu)

文章出處:【微信號(hào):半導(dǎo)體科技評(píng)論,微信公眾號(hào):半導(dǎo)體科技評(píng)論】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    內(nèi)計(jì)算并不滿足于現(xiàn)有的算力

    談到內(nèi)計(jì)算,大部分人的第印象就是超低功耗和大算力。內(nèi)計(jì)
    的頭像 發(fā)表于 05-11 00:08 ?3125次閱讀

    內(nèi)生態(tài)構(gòu)建重要環(huán)- 內(nèi)計(jì)算工具鏈

    本篇文章重點(diǎn)講述內(nèi)計(jì)算相關(guān)工具鏈,我們將從工具鏈定義出發(fā),依次講述工具鏈研究背景及現(xiàn)有工具鏈、內(nèi)計(jì)算
    的頭像 發(fā)表于 05-16 14:37 ?1447次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b>生態(tài)構(gòu)建重要<b class='flag-5'>一</b>環(huán)- <b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>工具鏈

    內(nèi)計(jì)算技術(shù)工具鏈——量化篇

    本篇文章將重點(diǎn)講述內(nèi)計(jì)算技術(shù)工具鏈之“量化”,我們將從面向內(nèi)計(jì)算芯片的深度學(xué)習(xí)編譯工具鏈、神
    的頭像 發(fā)表于 05-16 12:35 ?1641次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>技術(shù)工具鏈——量化篇

    內(nèi)計(jì)算芯片研究進(jìn)展及應(yīng)用

    在NOR Flash內(nèi)計(jì)算芯片當(dāng)中,向量-矩陣乘法運(yùn)算基于電流/電壓的跨導(dǎo)與基爾霍夫定律進(jìn)行物理實(shí)現(xiàn),如圖7(a)所示。因此,其核心是設(shè)計(jì)NOR Flash單元陣列以滿足大規(guī)模高能效向量-矩陣乘法
    的頭像 發(fā)表于 05-16 15:30 ?1801次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>芯片研究進(jìn)展及應(yīng)用

    探索內(nèi)計(jì)算—基于 SRAM 的內(nèi)計(jì)算與基于 MRAM 的體的探究

    體技術(shù),包括其工作原理、優(yōu)勢(shì)以及在軍工和大數(shù)據(jù)存儲(chǔ)領(lǐng)域的應(yīng)用。最后,對(duì)比了SRAM的內(nèi)計(jì)算和基于MRAM的體技術(shù)的差異,包括工作原理
    的頭像 發(fā)表于 05-16 16:10 ?3832次閱讀
    探索<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>—基于 SRAM 的<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>與基于 MRAM 的<b class='flag-5'>存</b>算<b class='flag-5'>一</b>體的探究

    內(nèi)計(jì)算原理分類——數(shù)字內(nèi)計(jì)算與模擬內(nèi)計(jì)算

    數(shù)字內(nèi)計(jì)算與模擬內(nèi)計(jì)算各有優(yōu)劣,都是
    的頭像 發(fā)表于 05-21 16:26 ?3452次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>原理分類——數(shù)字<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>與模擬<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>

    內(nèi)計(jì)算WTM2101編譯工具鏈 資料

    領(lǐng)先的內(nèi)計(jì)算芯片企業(yè)。公司針對(duì)AI應(yīng)用場(chǎng)景,在全球率先商業(yè)化量產(chǎn)基于內(nèi)計(jì)算技術(shù)的神經(jīng)網(wǎng)絡(luò)芯片
    發(fā)表于 05-16 16:33

    淺談內(nèi)計(jì)算生態(tài)環(huán)境搭建以及軟件開(kāi)發(fā)

    環(huán)境搭建 ()背景介紹 內(nèi)計(jì)算環(huán)境搭建是一種高效的數(shù)據(jù)處理方法,它涉及在計(jì)算機(jī)內(nèi)存中配置和管
    發(fā)表于 05-16 16:40

    一種創(chuàng)新的機(jī)載娛樂(lè)系統(tǒng)

    `一種創(chuàng)新的機(jī)載娛樂(lè)系統(tǒng)`
    發(fā)表于 08-02 00:35

    一種低開(kāi)銷(xiāo)加固鎖器的設(shè)計(jì)

    一種低開(kāi)銷(xiāo)加固鎖器的設(shè)計(jì)_黃正峰
    發(fā)表于 01-07 21:45 ?0次下載

    一種基于數(shù)字改良的SRAM設(shè)計(jì)內(nèi)計(jì)算方案

    最近的ISSCC上,臺(tái)積電的研究人員提出了一種基于數(shù)字改良的SRAM設(shè)計(jì)內(nèi)計(jì)算方案,能支持更大的神經(jīng)網(wǎng)絡(luò)。 上圖顯示了臺(tái)積電用于其測(cè)試的擴(kuò)展SRAM陣列配置——陣列的
    發(fā)表于 04-25 18:09 ?1379次閱讀
    <b class='flag-5'>一種</b>基于數(shù)字改良的SRAM設(shè)計(jì)<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計(jì)算</b>方案

    ?什么是內(nèi)計(jì)算

    蘋(píng)芯科技成立于2021年,專注于內(nèi)計(jì)算AI芯片研究與應(yīng)用,希望通過(guò)SRAM技術(shù)路線突破傳統(tǒng)馮·諾依曼結(jié)構(gòu)所造成的存儲(chǔ)墻局限,為人工智能行業(yè)下的多元場(chǎng)景提供底層算力。
    發(fā)表于 08-08 09:05 ?5385次閱讀

    架構(gòu)的優(yōu)勢(shì)及分類

    內(nèi)計(jì)算同樣是將計(jì)算和存儲(chǔ)合二為的技術(shù)。它有兩主要思路。第
    發(fā)表于 04-09 10:57 ?1949次閱讀
    <b class='flag-5'>存</b>算<b class='flag-5'>一</b>體<b class='flag-5'>架構(gòu)</b>的優(yōu)勢(shì)及分類

    科技啟動(dòng)首屆內(nèi)計(jì)算創(chuàng)新大賽

    內(nèi)計(jì)算作為項(xiàng)打破“內(nèi)存墻”“功耗墻”的顛覆性技術(shù),消除了與算的界限,相比CPU或GPU能夠?qū)崿F(xiàn)更高
    的頭像 發(fā)表于 11-21 10:44 ?478次閱讀

    開(kāi)源芯片系列講座第24期:基于SRAM算的高效計(jì)算架構(gòu)

    鷺島論壇開(kāi)源芯片系列講座第24期「基于SRAM算的高效計(jì)算架構(gòu)」明晚(27日)20:00精彩開(kāi)播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報(bào)告題目基于SRAM算的高效
    的頭像 發(fā)表于 11-27 01:05 ?614次閱讀
    開(kāi)源芯片系列講座第24期:基于SRAM<b class='flag-5'>存</b>算的高效<b class='flag-5'>計(jì)算</b><b class='flag-5'>架構(gòu)</b>
    主站蜘蛛池模板: 欧美一区二区三区黄色 | 精品国产理论在线观看不卡 | 最近2018中文字幕2019高清 | 久久777国产线看观看精品卜 | 一区二区三区影视 | 国产 高清 在线 | 久久精品国产6699国产精 | 色屁屁www免费看视频影院 | 亚洲三级黄 | 久久精品久久久久 | 永久在线 | 亚洲资源最新版在线观看 | 国产午夜精品一区二区理论影院 | 人人干视频在线观看 | 快播久久 | 成人黄色激情网 | 四虎免费影院在线播放 | 中文天堂最新版在线精品 | 色综合久久网女同蕾丝边 | 午夜影视在线视频观看免费 | 人人做人人爽人人爱 | 国产va免费精品高清在线观看 | 亚洲免费一级片 | 亚洲成色在线综合网站 | 韩国免费特一级毛片 | 免费观看一区二区 | 特级一级黄色片 | 亚洲+国产+图片 | 色婷婷六月丁香在线观看 | 在线激情网址 | 都市激情综合 | 午夜aaaaaaaaa视频在线 | 亚洲一区在线观看视频 | 亚洲91| 午夜精| 曰韩欧美| 91色在线观看 | 一区二区三区四区视频在线 | xxxx日本在线播放免费不卡 | 欲色啪 | 免费看黄色网页 |