突破極限,還是根本沒(méi)有物理限制?
編譯來(lái)源:semiengineering
內(nèi)存供應(yīng)商正在競(jìng)相為 3D NAND 添加更多層,數(shù)據(jù)爆炸以及對(duì)更大容量固態(tài)驅(qū)動(dòng)器和更快訪問(wèn)時(shí)間的需求推動(dòng)了3D NAND市場(chǎng)的競(jìng)爭(zhēng)。
美光已經(jīng)在完成 232 層 NAND 的訂單,而且不甘示弱,SK 海力士宣布將于明年上半年開(kāi)始量產(chǎn) 238 層 512Gb 三層單元 (TLC) 4D NAND。或許更重要的是,芯片制造商私下表示,他們將利用行業(yè)學(xué)習(xí)為目前正在開(kāi)發(fā)的 3D-IC 堆疊 NAND。
西門子 EDA技術(shù)產(chǎn)品經(jīng)理 Ben Whitehead 表示:“處理器的摩爾定律在過(guò)去幾年中可以說(shuō)一直滯后,但對(duì)于 NAND 閃存來(lái)說(shuō),摩爾定律仍然存在并且很好?。”?“這是一件好事,因?yàn)楝F(xiàn)代計(jì)算和網(wǎng)絡(luò)對(duì)快速存儲(chǔ)有著無(wú)法滿足的需求。”
SK 海力士于 2018 年推出了 96 層 NAND 的 4D 命名法。盡管有這個(gè)名字,但該公司并未在四維空間中創(chuàng)建其產(chǎn)品或模仿 tesseract 立方體。但這個(gè)詞也不完全是營(yíng)銷噱頭,它是 3D 架構(gòu)變體的商品名。
“對(duì)于 DRAM,大約需要 10 或 15 年的研發(fā)才能取得成果,但對(duì)于 3D NAND,發(fā)展速度非常快。當(dāng)你想到通常的開(kāi)發(fā)速度時(shí),你會(huì)感到驚訝,”新思科技研發(fā)總監(jiān)林西偉說(shuō)。“除了技術(shù)本身,它還是一款殺手級(jí)應(yīng)用。蘋果是第一個(gè)放入閃存來(lái)存儲(chǔ)數(shù)據(jù)的。今天,我們買 iPhone 還是看內(nèi)存有多少,而且都是閃存。從那里開(kāi)始,大數(shù)據(jù)、人工智能和分析需要高性能計(jì)算。閃存正在填補(bǔ)硬盤驅(qū)動(dòng)器和 RAM 內(nèi)存之間的這一關(guān)鍵延遲差距。由于功耗、外形尺寸和密度成本,你可以看到應(yīng)用程序,尤其是在數(shù)據(jù)中心、分析和游戲領(lǐng)域。”
演變與革命
回顧 2D NAND,它具有平面架構(gòu),浮柵 (FG) 和外圍電路彼此相鄰。2007 年,隨著 2D NAND 達(dá)到其規(guī)模極限,東芝提出了 3D NAND 結(jié)構(gòu)。
三星在 2013 年率先推出了其所謂的“V-NAND”。
3D 設(shè)計(jì)引入了多晶硅和二氧化硅的交替層,并將浮柵交換為電荷陷阱閃存 (CTF)。這些區(qū)別既有技術(shù)上的,也有經(jīng)濟(jì)上的。FG 將存儲(chǔ)器存儲(chǔ)在導(dǎo)電層中,而 CTF 將電荷“捕獲”在電介質(zhì)層中。由于制造成本降低,CTF 設(shè)計(jì)很快成為首選,但肯定不是唯一的。
IBM 研究員 Roman Pletka 指出:“盡管所有制造商都轉(zhuǎn)向電荷陷阱單元架構(gòu),但我預(yù)計(jì)傳統(tǒng)的浮柵單元在未來(lái)仍將發(fā)揮不可忽視的作用,尤其是對(duì)于容量或保留敏感的用例。”
海力士表示,盡管有摩天大樓式堆疊的創(chuàng)新,但第一代 3D NAND 設(shè)計(jì)將外圍電路保留在一邊。
最終,3D NAND 供應(yīng)商將外圍電路移至 CTF 之下。在 SK 海力士的術(shù)語(yǔ)中,它現(xiàn)在是 Periphery Under Cell (PUC) 層。一方面,說(shuō)“4D NAND”比 CTF/PUC NAND 更短更酷。另一方面,最終這是 3D NAND 的另一種變體,每單位的單元面積更小。用于更小尺寸的類似設(shè)計(jì)有不同的商品名稱,例如美光的 CMOS under Array (CuA)。
圖 1:SK 海力士對(duì) 4D NAND 的解釋。 來(lái)源:SK 海力士全球新聞編輯室。
圖 2:外圍電路是 4D NAND 的底層。
來(lái)源:SK 海力士全球新聞編輯室。
美光本身在 2022 年 7 月下旬宣布了 232 層 NAND,該產(chǎn)品正在生產(chǎn)中,從而獲得了宣傳的權(quán)利。根據(jù)該公司的新聞稿,美光表示,其 232 層 NAND 是存儲(chǔ)創(chuàng)新的分水嶺,首次證明了在生產(chǎn)中將 3D NAND 擴(kuò)展到 200 層以上的能力。
“添加這些層的主要作用是增加容量,因?yàn)槊總€(gè)人都在尋找更多的 SSD 容量,”Cadence產(chǎn)品營(yíng)銷集團(tuán)總監(jiān) Marc Greenberg 說(shuō)。“因此,添加更多層基本上意味著可以在單一封裝中存儲(chǔ)更多千兆字節(jié),并在單一類型的多層 3D NAND 組件上進(jìn)行存儲(chǔ)。添加所有這些層及其背后的技術(shù)是一種容量游戲。”
美光還聲稱擁有業(yè)界最快的 NAND I/O 速度 2.4 Gbps,與上一代相比,寫入帶寬提高了 100%,每個(gè)芯片的讀取帶寬提高了 75% 以上。此外,232 層 NAND 包含六平面 TLC 生產(chǎn) NAND,美光表示這是所有 TLC 閃存中每個(gè)芯片最多的平面,并且能夠在每個(gè)平面上獨(dú)立讀取能力。
據(jù)行業(yè)分析師稱,這可能是該公告中最令人印象深刻的部分。由于有六個(gè)平面,這個(gè)芯片可以表現(xiàn)得好像它是六個(gè)不同的芯片。
圖 3:美光的 232 層 NAND。來(lái)源:美光
中國(guó)的公司在232 層 3D NAND 模塊好像也有進(jìn)展。
制造:優(yōu)勢(shì)與挑戰(zhàn)
在去年的 IEEE IEDM 論壇上,三星的 Kinam Kim 發(fā)表了一個(gè)主題演講,他預(yù)測(cè)到 2030 年將有 1000 層閃存。這聽(tīng)起來(lái)可能令人頭暈?zāi)垦#@并不是完全的科幻小說(shuō)。“與 NAND 閃存的歷史趨勢(shì)線相比,這已經(jīng)放緩了,”imec 存儲(chǔ)存儲(chǔ)器項(xiàng)目總監(jiān) Maarten Rosmeulen 說(shuō)。“如果你看看其他公司,比如美光或西部數(shù)據(jù),他們?cè)诠_(kāi)聲明中提出的內(nèi)容,他們甚至比這還要慢。不同的制造商之間也存在一些差異——似乎他們正在延長(zhǎng)路線圖,讓它放慢速度。我們相信這是因?yàn)楸3挚臻g運(yùn)轉(zhuǎn)需要非常高的投資。”
盡管如此,競(jìng)爭(zhēng)風(fēng)險(xiǎn)仍然足夠高,以至于這些投資是不可避免的。“主要的前進(jìn)方向,主要的乘數(shù),是向堆棧添加更多的層,”Rosmeulen 說(shuō)。“進(jìn)行 XY 縮小和縮小內(nèi)存孔的空間非常小。這很難做到。也許他們會(huì)在這里或那里擠壓幾個(gè)百分點(diǎn),把孔放在一起,孔之間的縫隙更少,諸如此類。但這并不是最大的收獲。如果你能繼續(xù)堆疊更多的層,密度只能以目前的速度顯著提高。”
圖 4:NAND 制造中的 3D 步驟。來(lái)源:客觀分析
進(jìn)一步堆疊似乎是合理的,除了整個(gè)過(guò)程的核心不可避免的問(wèn)題。
“主要挑戰(zhàn)在于蝕刻,因?yàn)楸仨毼g刻具有非常高縱橫比的非常深的孔,”Rosmeulen 說(shuō)。“如果你看看上一代有 128 層,這是一個(gè)大約 6、7 或 8 微米深的孔,只有大約 120 納米的直徑,極高的縱橫比。蝕刻技術(shù)有進(jìn)步,可以一次性蝕刻更深的孔,但不會(huì)更快。您無(wú)法提高蝕刻速度。因此,如果工藝流程以沉積和蝕刻為主,而這些工藝步驟并沒(méi)有提高成本效率,那么添加更多層對(duì)于降低成本不再有效。”
蝕刻也只是多個(gè)步驟之一。“除了蝕刻之外,你還需要用非常薄的介電層上下均勻地填充這個(gè)孔,”Synopsys 的 Lin 說(shuō)。“通常情況下,由于晶圓的化學(xué)性質(zhì),沉積幾納米的層并不容易。在這里,他們必須一路向下才能填滿。有亞原子層沉積方法,但它仍然具有挑戰(zhàn)性。另一個(gè)大挑戰(zhàn)是壓力。如果你建立了如此多的層,這些層會(huì)經(jīng)歷一些蝕刻/沉積/清潔/熱循環(huán),這可能會(huì)導(dǎo)致局部和全局壓力。在局部,因?yàn)樵阢@孔后,需要在整個(gè)堆棧中切出一個(gè)非常深的溝槽。它變成了一個(gè)非常高的摩天大樓,搖搖欲墜。如果開(kāi)始進(jìn)行一些洗滌或其他過(guò)程,很多事情都可能導(dǎo)致兩座摩天大樓相互倒塌。那么就失去了收益。并且通過(guò)將如此多的材料相互疊放并切割不同的圖案,這會(huì)產(chǎn)生全局應(yīng)力并導(dǎo)致晶圓翹曲,這將導(dǎo)致晶圓廠無(wú)法處理,因?yàn)榫A必須是平的。”
值得注意的是,蝕刻正在穿過(guò)不同材料的層。
Objective Analysis 的 Handy 表示,三星的解決方案是創(chuàng)建極薄的層。“這對(duì)整個(gè)行業(yè)很有用,因?yàn)槊總€(gè)人都使用幾乎相同的工具來(lái)創(chuàng)造這些東西。”
讓它更好地工作
閃存的基本概念也存在固有的功能挑戰(zhàn)。“人們?cè)絹?lái)越依賴需要越來(lái)越強(qiáng)大的糾錯(cuò)算法來(lái)與這些設(shè)備一起工作,”Cadence 的 Greenberg 說(shuō)。
問(wèn)題是 NAND 閃存設(shè)備內(nèi)置的智能并不多。“通常情況下,SSD 發(fā)生在控制器端,”Greenberg 解釋說(shuō)。“控制器正在向 NAND 閃存設(shè)備發(fā)送命令,NAND 閃存設(shè)備會(huì)做出響應(yīng),但它并沒(méi)有太多的智能。它只是響應(yīng)請(qǐng)求,例如針對(duì)特定地址的數(shù)據(jù)塊。NAND 閃存設(shè)備將簡(jiǎn)單地響應(yīng)該數(shù)據(jù)塊。但是在控制器端,你必須首先對(duì)接收到的數(shù)據(jù)進(jìn)行糾錯(cuò),然后確定該塊中是否存在不可接受的錯(cuò)誤數(shù)量,然后決定如何重新映射該塊地址空間并在其位置放置一個(gè)不同的塊。所有這些決定都發(fā)生在控制器端。”
盡管如此,由納米級(jí)摩天大樓建造的世界重新強(qiáng)調(diào)了 ONFI 控制器和 ONFI PHYS 等組件,并為設(shè)計(jì)人員提出了新的挑戰(zhàn)。
“內(nèi)存工廠可以生產(chǎn)的層數(shù)使與這些內(nèi)存接口的控制器的設(shè)計(jì)驗(yàn)證問(wèn)題變得非常復(fù)雜——而且它們可能并不那么明顯。SSD 控制器必須處理更多的內(nèi)存通道。將許多管道與越來(lái)越快(但永遠(yuǎn)不夠快)的主機(jī)接口連接起來(lái)會(huì)在非常意想不到的地方產(chǎn)生瓶頸,”西門子的 Whitehead 說(shuō)。“另一個(gè)設(shè)計(jì)驗(yàn)證挑戰(zhàn)是功率。長(zhǎng)期以來(lái),大多數(shù)存儲(chǔ)控制器的優(yōu)先級(jí)較低,但現(xiàn)在已轉(zhuǎn)變?yōu)殛P(guān)鍵功能。移動(dòng)到較小的幾何節(jié)點(diǎn)會(huì)有所幫助,但代價(jià)高昂。商業(yè)模式不能容忍重新旋轉(zhuǎn),更不用說(shuō)供應(yīng)鏈難以排長(zhǎng)隊(duì)了。上市時(shí)間的延遲讓高層管理人員非常清楚。存儲(chǔ)的增長(zhǎng)動(dòng)力甚至更多,這需要我們重新思考如何驗(yàn)證設(shè)計(jì)。AI 加速器需要更大的存儲(chǔ)控制器,這可能會(huì)很快消耗您的仿真和原型設(shè)計(jì)能力。邊緣智能需要數(shù)量級(jí)更復(fù)雜的設(shè)計(jì)驗(yàn)證。內(nèi)存計(jì)算,如 CSD,需要測(cè)試新的處理器組合,將 RTOS 和 HTOS 與以前看不見(jiàn)的工作負(fù)載混合在一起。”
這是人們?nèi)绱岁P(guān)注驗(yàn)證 IP 的原因之一。
西門子數(shù)字工業(yè)軟件公司的 ICVS 產(chǎn)品經(jīng)理 Joe Hupcey 表示:“使用此 IP 的自動(dòng)化可以快速生成測(cè)試平臺(tái),讓設(shè)計(jì)和驗(yàn)證團(tuán)隊(duì)在幾分鐘內(nèi)啟動(dòng)并運(yùn)行。”?“這種生產(chǎn)力水平使我們能夠?qū)φ麄€(gè)設(shè)計(jì)進(jìn)行架構(gòu)探索,從而盡早對(duì)所選擇的權(quán)衡取舍充滿信心。同時(shí),它還建立了自動(dòng)跟蹤指標(biāo)的框架——如代碼、功能和場(chǎng)景覆蓋率,使團(tuán)隊(duì)能夠衡量他們的進(jìn)度并擁有做出簽核決定所需的數(shù)據(jù)。最后,基于我們?cè)?CXL/PCIe 協(xié)議方面的專業(yè)知識(shí),我們看到通用芯片互連快速 (UCIe) 等新興標(biāo)準(zhǔn)在使團(tuán)隊(duì)能夠協(xié)作以快速設(shè)計(jì)和驗(yàn)證這些大規(guī)模可擴(kuò)展內(nèi)存模塊方面發(fā)揮著關(guān)鍵作用。”
此外,Imec 正在探索 3D NAND 的潛在新結(jié)構(gòu)。它展示了所謂的“溝槽架構(gòu)”,這是一種設(shè)計(jì)變體,其中存儲(chǔ)單元是溝槽側(cè)壁的一部分,兩個(gè)晶體管位于溝槽的相對(duì)兩端。Imec 鐵電體項(xiàng)目總監(jiān) Jan Van Houdt 解釋了它的價(jià)值:“與目前使用的環(huán)柵(或圓柱形)架構(gòu)相比,3D 溝槽架構(gòu)具有雙倍密度的潛力。”
然而,他接著指出了一些缺點(diǎn)。“有兩個(gè)高縱橫比(=具有挑戰(zhàn)性的)蝕刻步驟而不是一個(gè),以及在閃光情況下隧道氧化物中的電場(chǎng)較低。第二個(gè)缺點(diǎn)在使用鐵電 FET 時(shí)不存在,這使得溝槽版本對(duì)鐵比對(duì)閃存更有吸引力。”該設(shè)計(jì)仍處于原型階段。
結(jié)論
2016 年,專家指出,由于技術(shù)問(wèn)題,3D NAND 可能會(huì)在 300 層或接近 300 層時(shí)失去動(dòng)力。這似乎已被今天的謹(jǐn)慎樂(lè)觀所取代。
“在 SK海力士的 238 層之后我預(yù)計(jì)未來(lái)幾年層數(shù)將以大致相同的速度增加,”IBM 的 Pletka 說(shuō)。“然而,從技術(shù)角度來(lái)看,由于高縱橫比蝕刻工藝,增加層數(shù)受到挑戰(zhàn),而且資本支出也受到挑戰(zhàn),因?yàn)橹圃煨酒臅r(shí)間隨著層數(shù)的增加而增加。這就是為什么我們將通過(guò)制作更薄的層、橫向縮放(例如更密集地放置垂直孔)以及使用更有效的布局(例如共享位線和邏輯縮放)來(lái)看到新的縮放方向(例如,使用拆分門架構(gòu)或存儲(chǔ)更多每個(gè)單元的位數(shù))。有了這些技術(shù),預(yù)計(jì) NAND 閃存的存儲(chǔ)密度至少在未來(lái) 5 到 10 年內(nèi)會(huì)以類似的速度增長(zhǎng)。”
“當(dāng)人們說(shuō)我們不能超過(guò)這個(gè)層數(shù)時(shí),沒(méi)有物理限制,”O(jiān)bjective Analysis 的首席分析師 Jim Handy 說(shuō)。“在半導(dǎo)體領(lǐng)域,總是有人說(shuō)我們做不到。我們不能在 20 納米以下進(jìn)行光刻。現(xiàn)在,他們正在研究 1 納米。三星談到了 1000 層。”
編輯|:黃飛
?
評(píng)論