回顧存儲(chǔ)的發(fā)展歷程。3D Xpoint是自NAND Flash推出以來,最具突破性的一項(xiàng)存儲(chǔ)技術(shù)。由于具備以下四點(diǎn)優(yōu)勢(shì),3D Xpoint被看做是存儲(chǔ)產(chǎn)業(yè)的一個(gè)顛覆者:
(1)比NAND Flash快1000倍;
(2)成本只有DRAM的一半;
(3)使用壽命是NAND的1000倍;
(4)密度是傳統(tǒng)存儲(chǔ)的10倍;
而得益于這些優(yōu)勢(shì),3D Xpoint能被廣泛應(yīng)用在游戲、媒體制作、基因組測(cè)序、金融服務(wù)交易和個(gè)體化治療等領(lǐng)域。以上只是3D Xpoint的一些應(yīng)用示例。但從以上介紹,我們可以看出,3D Xpoint未來的應(yīng)用非常有潛力。
目前存儲(chǔ)器存在的一些問題
存儲(chǔ)器的性能是PC設(shè)備上目前的短板。這一點(diǎn)從很多用戶由HDD更換為SSD后,感覺像是“換了一個(gè)電腦”就能體現(xiàn)出來。HDD目前的傳輸速度往往在200MB/s以內(nèi),尋道時(shí)間約為10ms級(jí);SSD傳輸速度為數(shù)百M(fèi)B/s到幾GB/s,尋道時(shí)間約為0.1ms以內(nèi);更快的內(nèi)存帶寬為幾十GB/s,延遲時(shí)間低至ns級(jí)。再向上還有更高速的緩存、寄存器等設(shè)備。
DRAM:易失性難以解決
拋開和處理器緊密相關(guān)的高速緩存和寄存器不說,先來看內(nèi)存和外部存儲(chǔ)這兩個(gè)級(jí)別。目前我們使用的內(nèi)存主要是DRAM。DRAM的核心問題是易失性,其它方面的表現(xiàn)優(yōu)秀——比如在性能上DRAM的延遲很低(納秒級(jí)別)、帶寬較為充裕;壽命方面由于原理所致,DRAM壽命很長(zhǎng)。不過,DRAM的存儲(chǔ)需要不停供電,斷電就會(huì)丟失存儲(chǔ)的數(shù)據(jù)。從DRAM被發(fā)明出來到現(xiàn)在,DRAM只是不斷地在預(yù)取值和總線上進(jìn)行調(diào)整,核心的存儲(chǔ)架構(gòu)其實(shí)變化不大。
NAND:壽命、延遲不盡如人意
再來看目前廣泛應(yīng)用于存儲(chǔ)設(shè)備的NAND閃存。NAND閃存分為SLC、MLC、TLC等多種分支顆粒。從壽命上說,NAND是有平均讀寫次數(shù)的壽命的,即使是性能最好的SLC NAND顆粒,其壽命也比DRAM小得多。雖然可以通過設(shè)置緩沖空間、平衡磨損算法、提前設(shè)置壽命預(yù)警來確保NAND不會(huì)在使用時(shí)“掉鏈子”、引發(fā)數(shù)據(jù)丟失,但壽命依舊是NAND在使用中不可回避的問題。
此外,受制于存儲(chǔ)原理,NAND延遲較高,尤其是寫入時(shí)存在充電時(shí)間,怎么也快不起來,目前只能被用作外部存儲(chǔ)設(shè)備。但在今天,由于之前有性能更低的HDD機(jī)械硬盤的存在,基于NAND顆粒的SSD仍舊讓用戶感受到了性能的巨大提升。
▲隨著制程提升,NAND的容量正在迅速提升,但壽命和延遲等問題,并沒有革命性的變化。
▲NAND工作原理圖,絕緣浮置柵極是其存儲(chǔ)數(shù)據(jù)的核心。
性能鴻溝:PC架構(gòu)的問題
所謂性能鴻溝,就是上下兩級(jí)系統(tǒng)存在較大的性能差距,使得級(jí)次緩存的設(shè)計(jì)方案很難體現(xiàn)出最佳的效果堪稱天塹;在NAND和DRAM上,這個(gè)鴻溝相比DRAM和HDD之間的性能鴻溝略有縮小,但是本質(zhì)上的變化并不明顯。舉例來說,NAND設(shè)備目前的最快速度差不多在2GB/s~3GB/s,處理器的內(nèi)存帶寬已經(jīng)突破50GB/s大關(guān),兩者間差了一個(gè)數(shù)量級(jí)。延遲上,DRAM只有十幾納秒,相比NAND的約一百微秒,快了好多個(gè)數(shù)量級(jí)。
實(shí)際上,內(nèi)存和外部存儲(chǔ)之間的性能差距過大,已經(jīng)成為影響用戶體驗(yàn)繼續(xù)提升的瓶頸。所以研究機(jī)構(gòu)一直在提出很多解決方案,試圖解決這個(gè)鴻溝,比如相變存儲(chǔ)器、賽道存儲(chǔ)器、全新的高速磁存儲(chǔ)設(shè)備等。但這些技術(shù)不是還深藏在實(shí)驗(yàn)室中,就是剛在PPT上公諸于眾。到了去年,作為存儲(chǔ)業(yè)界的領(lǐng)軍企業(yè)之一的英特爾和美光,終于將其中一種全新的存儲(chǔ)技術(shù)推向了前臺(tái),這種技術(shù)同時(shí)擁有高性能和非易失性兩種特性,這就是今天的主角:3D XPoint!
▲內(nèi)存的基本技術(shù)結(jié)構(gòu)也已經(jīng)很久沒有革命性的變化。目前最快的DDR4內(nèi)存,仍舊只能充當(dāng)暫存器。
3D XPoint的原理
目前英特爾和美光對(duì)3D XPoint應(yīng)用的物理特性閉口不談,資料更是匱乏。一些不具名的介紹資料顯示,3D XPoint使用的標(biāo)記數(shù)據(jù)狀態(tài)的物理值不是業(yè)內(nèi)常用的電壓、也不是電流,更不是目前還在實(shí)驗(yàn)室內(nèi)的磁極,而是電阻。
3D XPoint的工作原理與NAND存在著根本性的不同。NAND通過絕緣浮置柵極捕獲不同數(shù)量的電子以實(shí)現(xiàn)bit值定義,而3D XPoint則是一項(xiàng)以電阻為基礎(chǔ)的存儲(chǔ)技術(shù)成果,其通過改變單元電阻水平來區(qū)分0與1。
3D XPoint的結(jié)構(gòu)非常簡(jiǎn)單。它由選擇器與內(nèi)存單元共同構(gòu)成,二者則存在于字線與位線之間(因此才會(huì)以‘交叉點(diǎn)’來定名)。在字線與位線之間提供特定電壓會(huì)激活單一選擇器,并使得存儲(chǔ)單元進(jìn)行寫入(即內(nèi)存單元材料發(fā)生大量屬性變化)或者讀取(允許檢查該存儲(chǔ)單元處于低電阻還是高電阻狀態(tài))。
猜測(cè),寫入操作要求具備較讀取更高的電壓,因?yàn)槿绻麑?shí)際情況相反,那么3D XPoint就會(huì)面臨著上在讀取存儲(chǔ)單元時(shí)觸發(fā)大量材料變化(即寫入操作)的風(fēng)險(xiǎn)。
英特爾與美光雙方并沒有透露內(nèi)部讀取/寫入的具體電壓數(shù)值,不過根據(jù)得到的消息,其電壓值應(yīng)該低于NAND——后者需要利用約20伏電壓來編寫/擦除以創(chuàng)建出足夠通過絕緣體的電場(chǎng)電子隧道。而這種較低的電壓要求自然也能夠使得3D XPoint擁有比DRAM以及NAND更低的運(yùn)行功耗。
顧名思義,3D XPoint的存儲(chǔ)單元可以以3D方式進(jìn)行堆疊,從而進(jìn)一步提升存儲(chǔ)密度。目前第一代晶粒樣品使用的是雙層設(shè)計(jì)方案。雙層聽起來實(shí)在有些寒磣,特別是考慮到目前的3D NAND芯片已經(jīng)擁有32層,且逐步開始向48層進(jìn)軍。不過3D XPoint的構(gòu)建方式完全不同,直接進(jìn)行層數(shù)比較顯然并不科學(xué)。
3D NAND在制造過程中首先加入沉積導(dǎo)電層,而后再在每一層之上添加絕緣材料。只有在全部層沉積完畢之后,整個(gè)“單元塔”才能以光刻方式進(jìn)行定義,而后再在高縱橫比蝕刻孔內(nèi)填充通孔材料以實(shí)現(xiàn)各層內(nèi)存儲(chǔ)單元的彼此互通。
相比之下,3D XPoint的每一層都需要進(jìn)行光刻與蝕刻(即在各層之上重復(fù)同樣的流程),接下來再對(duì)下一層進(jìn)行沉積。這種方式犧牲掉了3D NAND所帶來的一部分經(jīng)濟(jì)優(yōu)勢(shì)(即光刻步驟較少),但3D XPoint卻同時(shí)帶來了遠(yuǎn)高于純光刻技術(shù)所能實(shí)現(xiàn)的出色存儲(chǔ)密度。
英特爾與美光公司指出,未來工藝尺寸伸縮將同時(shí)出現(xiàn)在光刻與層3D堆疊這兩個(gè)方面。橫向與縱向的規(guī)模可調(diào)整能力將成為關(guān)鍵,保證其未來仍然具有進(jìn)一步可延展性,這是因?yàn)榛跉宸膫鹘y(tǒng)多模式浸沒式光刻技術(shù)在10納米級(jí)別上已經(jīng)失去了經(jīng)濟(jì)性優(yōu)勢(shì),而目前尚未出現(xiàn)任何明確的繼任技術(shù)可供選擇。
當(dāng)下業(yè)界普遍將希望寄托在EUV身上,而英特爾與美光則確認(rèn)稱,3D XPoint將(不出所料)兼容EUV光刻,而且存儲(chǔ)單元設(shè)計(jì)尺寸可以最大縮水至個(gè)位數(shù)納米級(jí)別——同時(shí)不會(huì)對(duì)使用幫助/可靠性造成顯著影響(事實(shí)上,隨著物理尺寸的下降,其在某些方面反而有所改善)。
不過在未來幾年內(nèi),恐怕仍然無法利用EUV實(shí)現(xiàn)批量化生產(chǎn)。首批EUV生產(chǎn)的主要重心也將放在邏輯層面,這一方面是因?yàn)槠湓O(shè)備成本實(shí)在太過高昂,另一方面也是因?yàn)檫壿嫙o法像記憶體般進(jìn)行垂直綻放、因此可能導(dǎo)致散熱問題。
從理論層面講,3D XPoint也支持多層單元設(shè)計(jì),但英特爾與美光雙方目前并不打算追求這條路線。雖然在實(shí)驗(yàn)室當(dāng)中實(shí)現(xiàn)多個(gè)電阻層級(jí)并不是件太難的事,但其實(shí)際難度還是要遠(yuǎn)遠(yuǎn)高于保證生產(chǎn)的數(shù)萬片晶圓當(dāng)中、每個(gè)晶粒都具備必要的特性以實(shí)現(xiàn)雙層單元操作。
相比之下,這一思路很像是二十年前每單元2 bit機(jī)制剛剛出現(xiàn)在NAND領(lǐng)域的狀況,因此目前英特爾與美光暫時(shí)會(huì)將注意力集中在光刻技術(shù)及3D伸縮方面,從而提高存儲(chǔ)密度及成本效益。不過相信在未來,多層單元設(shè)計(jì)也將逐步出現(xiàn)在3D XPoint當(dāng)中。
而與NAND在架構(gòu)上的最大區(qū)別在于,3D XPoint實(shí)際上是以bit層級(jí)進(jìn)行訪問。在NAND當(dāng)中,整頁(yè)(在最新節(jié)點(diǎn)中為16KB)必須一次性進(jìn)行編程才能存儲(chǔ)1 bit數(shù)據(jù)。而更糟糕的是,我們必須要在塊層級(jí)(至少包含200個(gè)頁(yè))執(zhí)行擦除操作。
如此一來,NAND就需要使用更為復(fù)雜的垃圾回收算法,從而更為高效地實(shí)現(xiàn)性能水平。然而無論算法多么精巧,處于穩(wěn)定狀態(tài)的驅(qū)動(dòng)器在性能上仍然會(huì)因此受到影響,因?yàn)楸仨毑捎霉潭ǖ淖x取-修改-寫入周期才能對(duì)塊中的單一頁(yè)進(jìn)行擦除。
而作為以bit為基礎(chǔ)訪問單位的3D XPoint來說,其并不需要配合任何垃圾回收機(jī)制即可高效運(yùn)作,這不僅極大簡(jiǎn)化了控制器與固件結(jié)構(gòu),更重要的是還將實(shí)現(xiàn)更高性能水平與更低功耗需求。
在最終產(chǎn)品——特別是面向存儲(chǔ)需求的產(chǎn)品——當(dāng)中,3D XPoint仍然會(huì)保留一部分邏輯頁(yè)以降低追蹤操作帶來的負(fù)擔(dān),這是因?yàn)樵赽it層級(jí)上進(jìn)行數(shù)據(jù)追蹤將需要大量高速緩存作為配合。
然而,英特爾與美光公司已經(jīng)在聲明當(dāng)中就此作出了明確回應(yīng),表示日前發(fā)布的公告僅僅屬于一項(xiàng)技術(shù)性結(jié)論。兩家公司拒絕就基于這項(xiàng)新技術(shù)的未來面世產(chǎn)品發(fā)表任何評(píng)論。換句話來說,這兩家企業(yè)將各自打造自己的產(chǎn)品方案,并預(yù)計(jì)將在明年正式將其交付至廣大用戶手中。
內(nèi)存單元:3D XPoint背后的秘密
從子陣級(jí)角度出發(fā),3D XPoint的運(yùn)作方式還算比較容易理解,但探究大量屬性變化過程中內(nèi)存單元之內(nèi)的實(shí)際動(dòng)態(tài)則是個(gè)非常復(fù)雜的問題。能想到的就是需要通過兩種方式實(shí)現(xiàn)這一目標(biāo)——以物理方式利用外部刺激調(diào)整存儲(chǔ)單元屬性,從而實(shí)現(xiàn)晶體結(jié)構(gòu)變更; 或者是以化學(xué)方式對(duì)單元內(nèi)的材料屬性進(jìn)行調(diào)整。
在發(fā)布會(huì)之后的對(duì)話環(huán)節(jié)當(dāng)中,我們得到的消息3D XPoint所使用的并非相變材料,這就消除了一種潛在可能性——即3D XPoint利用相變材料通過單元晶體結(jié)構(gòu)變化來實(shí)現(xiàn)電壓切換。
英特爾與美光選擇的方式也極具現(xiàn)實(shí)意義,因?yàn)橐龑?dǎo)穩(wěn)定晶體結(jié)構(gòu)發(fā)生變化很可能意味著對(duì)不同原子結(jié)構(gòu)長(zhǎng)度進(jìn)行頻繁調(diào)節(jié),而這有可能影響到存儲(chǔ)單元之間連接材料,最終導(dǎo)致使用壽命降低。考慮到這一點(diǎn),惟一可行的就只有化學(xué)調(diào)整方式了,更具體地講對(duì)存儲(chǔ)單元中的bit電子結(jié)構(gòu)進(jìn)行調(diào)整,從而使其出現(xiàn)電阻差異。
咱們不妨在這里就其實(shí)現(xiàn)原理展開一番探討。
自旋交叉
根據(jù)以往的經(jīng)驗(yàn),自然而然地想到了自旋電子與自旋交叉化合物的應(yīng)用。簡(jiǎn)而言之,這意味著此類材料擁有兩種不同電阻級(jí)別,具體取決于結(jié)構(gòu)內(nèi)電子層級(jí)中的電子狀態(tài)。而外部刺激(包括溫度、電壓以及磁場(chǎng)的變化)則用于實(shí)現(xiàn)兩種電子狀態(tài)之間的切換。
接下來的內(nèi)容可能有些艱深,我們最好是從單個(gè)過渡金屬原子出發(fā)進(jìn)行考量。根據(jù)該金屬原子周邊的局部排列,金屬的鍵合軌道部分會(huì)充斥著大量電子:
這里是一個(gè)處于2+價(jià)環(huán)境下的鐵化合物分子,其主要成鍵軌道為t2g(低能量)與eg(高能量)。根據(jù)Pauli提出的不相容原理,6個(gè)電子配對(duì)構(gòu)成三條軌道,而且每個(gè)電子對(duì)中的一個(gè)電子“自旋加快”、另一個(gè)則“自旋減慢”。這就是我們所說的基態(tài),也被稱為低自旋狀態(tài)。其整體自旋值S等于0,因?yàn)橐粋€(gè)電子的自旋值1/2會(huì)被另一個(gè)電子的自旋值-1/2所抵消。
此原子的另一種模式則為高自旋態(tài),其中2個(gè)電子轉(zhuǎn)移到了較高的鍵合軌道當(dāng)中,而總體自旋值S=2:
由于外部刺激的存在,其中將有2個(gè)電子翻轉(zhuǎn)自旋并占據(jù)高能量eg軌道,而這也就是所謂“亞穩(wěn)定”狀態(tài)。根據(jù)周邊原子的實(shí)際排列,這種狀態(tài)實(shí)際上也可以表現(xiàn)得非常穩(wěn)定,但卻與原始基態(tài)在性質(zhì)上存在很大的不同。
不過將這種原理推廣到大量材料之上,從原則上講非常困難。簡(jiǎn)要概括,各類研究論文指出自旋交叉化合物可以直接進(jìn)行對(duì)接并實(shí)現(xiàn)電阻變化,但與這類操作相關(guān)的大部分論文都屬于化工學(xué)科,探討的也主要為碳納米管、石墨烯層或者有機(jī)鏈等對(duì)象。
在這篇論文當(dāng)中,低自旋/高自旋狀態(tài)將提供或不提供兩種極性之間的導(dǎo)電率,具體取決于金屬原子的實(shí)際性質(zhì)、電阻、特性以及/或者平臺(tái)穩(wěn)定性水平。英特爾公司需要開發(fā)出這樣一種材料,其能夠通過電壓變化而非外部刺激實(shí)現(xiàn)編程,而這顯然將復(fù)雜性提升到了新的高度。
一般來講,自旋交叉化合物具備特定的溫度窗口,在不同溫度下其電子可以在高狀態(tài)與低狀態(tài)之間往來切換,這意味著溫度因素對(duì)其穩(wěn)定性存在直接影響。
從這一點(diǎn)出發(fā),材料的可延展性與基礎(chǔ)特性成為實(shí)現(xiàn)大規(guī)模自旋交叉的主要障礙,特別是在同時(shí)采用碳納米管的情況之下。如果要對(duì)大量金屬材料進(jìn)行延展,那么我們需要為其提供一個(gè)單獨(dú)的金屬環(huán)境進(jìn)行批量處理,帶線(與間隙)會(huì)令原本單純的軌跡概念變得更加模糊,因此我們根本無法將其納入至存儲(chǔ)單元之中。
英特爾公司還指出,他們的技術(shù)能夠讓每個(gè)存儲(chǔ)單元承載多bit,而自旋交叉的排布問題能夠利用電子隧道機(jī)制加以解決,從而達(dá)成構(gòu)建存儲(chǔ)單元的目標(biāo)。
自旋轉(zhuǎn)矩效應(yīng)(簡(jiǎn)稱STT)
內(nèi)存單元的自旋轉(zhuǎn)矩效應(yīng)取決于單元兩種狀態(tài)之間的電阻水平,外加在存儲(chǔ)單元內(nèi)部控制磁性的能力。簡(jiǎn)而言之,如果大家對(duì)某種材料的磁性布局作出調(diào)整,也就能夠同時(shí)調(diào)查其電阻并將其作為記憶體加以使用。
而更為具體的解釋是,自旋轉(zhuǎn)矩效應(yīng)的長(zhǎng)期存在依賴于被稱為自旋極化電流的性質(zhì)。電子自旋從根本角度講分為兩種方向,即自旋加速與自旋減速。
一般的電流通常由這兩類方向均勻混合,這樣整體看起來就呈現(xiàn)出非極化電流的形式(即不存在整體自旋方向性)。而當(dāng)一股非極化電流通過一層厚厚的磁性材料時(shí),其立刻開始呈現(xiàn)出極化特征。
如果這種極化電流隨后通過處于不同電子密度狀態(tài)的薄磁層,那么電流的極性則會(huì)產(chǎn)生磁性,從而使更多電子自然進(jìn)入反向自旋狀態(tài)。
由于厚磁層具有恒定的磁場(chǎng)向性,而薄磁層(或者稱作自由層)能夠進(jìn)行翻轉(zhuǎn)(具體取決于材料本身),因此這兩者相結(jié)合后所產(chǎn)生的電阻即可作為記憶體單元使用。
論文指出,自旋轉(zhuǎn)矩效應(yīng)方案的優(yōu)勢(shì)在于其能耗水平低于DRAM,但性能表現(xiàn)則與后者基本相當(dāng)。而這項(xiàng)技術(shù)的實(shí)現(xiàn)障礙主要源自以納米光刻這樣極為微小的立足點(diǎn)構(gòu)建永久磁體的能力,外加如何將眾多如此微小的磁體以彼此接近的方式加以排布(類似于磁盤驅(qū)動(dòng)器當(dāng)中的bit單位)——這有可能導(dǎo)致其中一部分發(fā)生意外翻轉(zhuǎn)。
除此之外,也并不清楚使用這種方法能夠提供每單元單一二進(jìn)制bit以上的容納能力。而且現(xiàn)有研究表明,其需要同時(shí)使用一個(gè)控制晶體管方能正常起效。而英特爾方面已經(jīng)明確指出,3D XPoint并不使用任何控制晶體管。
自旋轉(zhuǎn)矩效應(yīng)技術(shù)的公開發(fā)展歷史最早可追溯到2011年由高通公司推出的1 Mb IC以及2012年來自Everspin公司的64 Mb模塊,不過二者始終未能投入實(shí)際生產(chǎn)。
導(dǎo)電橋接技術(shù)(簡(jiǎn)稱CB)
對(duì)通路電阻進(jìn)行調(diào)整的最簡(jiǎn)單辦法之一就是通過物理變化將電子運(yùn)動(dòng)路徑幾乎完全阻斷。導(dǎo)電橋接技術(shù)(或者被稱為可編程金屬化單元)則采用類似于電解的技術(shù)在電極之間創(chuàng)造出一道納米橋,從而降低單元電阻。
在一個(gè)導(dǎo)電橋接單元當(dāng)中,一層薄電解質(zhì)膜(過去一直以液態(tài)方式存在,但現(xiàn)在也可以呈現(xiàn)為固態(tài))處于活性與惰性電極之間。當(dāng)惰性電極被施加一個(gè)負(fù)偏壓時(shí),電解質(zhì)中的金屬離子會(huì)被不愿為金屬原子。
當(dāng)析出并連接的金屬原子數(shù)量達(dá)到一定程度后,其會(huì)形成一條位于兩個(gè)電極之間的導(dǎo)線。而要切斷這條導(dǎo)線,我們需要施加反向電位差,從而將導(dǎo)線中的原子重新氧化成電解質(zhì)的組成部分。最終的電極-電解質(zhì)-電極組合仍然具備導(dǎo)電能力,但其電阻要高于前面提到的存在導(dǎo)線的情況。
不過對(duì)于任何一位對(duì)于電解機(jī)制比較熟悉的朋友來說,以上概括性描述同時(shí)也帶來了大量問題。首先,也許存儲(chǔ)單元當(dāng)中使用的是液態(tài)材質(zhì),但我們更傾向于假定需要處理的是處于固態(tài)材料當(dāng)中的移動(dòng)離子,其活動(dòng)空間介于各嵌入點(diǎn)之間(也就是晶格/框架之間的空間)。
真正值得仔細(xì)推敲的還是要數(shù)上述表達(dá)中提到的“導(dǎo)線”一詞。通常來講,通過電解實(shí)現(xiàn)的原子析出往往缺乏指向性——我們是領(lǐng)先不同晶體面的活動(dòng)來推出析出,這就導(dǎo)致離子擴(kuò)散以多向性方式進(jìn)行,不過根據(jù)實(shí)際晶體面的增長(zhǎng)情況、電極指向會(huì)略有偏差。
在這種情況下,分叉線就會(huì)出現(xiàn)——類似于閃電的表現(xiàn)形式。而在對(duì)不同電極進(jìn)行彼此連接時(shí),或者至少是在電子隧道的長(zhǎng)度之內(nèi),導(dǎo)線本身的電阻差異(從高電阻到低電阻)也相當(dāng)巨大。不過隨著導(dǎo)線的持續(xù)構(gòu)建,電阻值也會(huì)不斷降低。
考慮到這一點(diǎn),建立導(dǎo)線這種處理方式確實(shí)能夠?yàn)槊總€(gè)單元提供多bit容納能力,但正如我之前所提到,其實(shí)施難度也相當(dāng)之大。另一項(xiàng)因素在于逆轉(zhuǎn)的過程——通常是由同樣的材料作為離子提供活性電極,但這意味著電極本身基本上也具備可溶解性。通過研究我們看到,這恐怕會(huì)對(duì)產(chǎn)品的使用壽命造成影響。
而在導(dǎo)電橋接技術(shù)的優(yōu)勢(shì)角度,其在理論上能夠?qū)崿F(xiàn)低于浮柵單元的物理尺寸、而布局也相對(duì)簡(jiǎn)單。根據(jù)報(bào)告所言,其能夠在功耗與性能水平方面較當(dāng)前NAND改善達(dá)數(shù)個(gè)量級(jí)。
考慮到上述問題與優(yōu)勢(shì)的存在,我認(rèn)為導(dǎo)電橋接技術(shù)目前應(yīng)該作為3D XPoint方案的優(yōu)先使用對(duì)象。美光公司曾于2002年的官方許可當(dāng)中作出過相關(guān)暗示,而且2014年美光分析師大會(huì)上展出過的幻燈片資料也提到了他們?nèi)绾慰朔抑疤岬降囊恍﹩栴}:
圖片下方列出的正是當(dāng)時(shí)正處于研發(fā)狀態(tài)的存儲(chǔ)單元,演示材料中確實(shí)提到了橋接技術(shù)的存在。為了確保活性電極不會(huì)在逆向編程過程中被“吃掉”,技術(shù)人員設(shè)置了一套大型離子庫(kù)供其調(diào)用。另一個(gè)電極則尺寸很小,以便于導(dǎo)線能夠定向構(gòu)建。只要整個(gè)電解質(zhì)層夠小(數(shù)個(gè)單分子層),那么讀取/寫入操作的速度將極快、實(shí)現(xiàn)也將非常容易。
未來發(fā)展
總結(jié)而言,如果我們快速跳轉(zhuǎn)至2015年2月,那么請(qǐng)注意美光公司在其分析師會(huì)議當(dāng)中公布的另一份演示資料:
在這幅圖片的下半部分,我們可以明顯看到美光公司正著眼于左側(cè)基于自旋轉(zhuǎn)矩效應(yīng)的記憶體方案,而亦有分析師報(bào)告指出圖片右側(cè)的RRAM單元很可能使用的就是導(dǎo)電橋接技術(shù)。而在本周公布的3D XPoint演示資料中,多位分析人士認(rèn)為最優(yōu)先的實(shí)現(xiàn)選項(xiàng)很可能是利用二極管探測(cè)實(shí)際電阻特性。
考慮到公告強(qiáng)調(diào)稱目前正在進(jìn)行的技術(shù)研發(fā)從根本角度講迥異于此前有過的嘗試,而3D XPoint產(chǎn)品進(jìn)入批量生產(chǎn)的最大難關(guān)在于制造材料,我最終無法判斷其具體采用了哪一種實(shí)現(xiàn)方式。
從可能性方面來看,英特爾與美光雙方也許使用的是導(dǎo)電橋接技術(shù)打造出了這款產(chǎn)品。最為精確的細(xì)節(jié)將被牢牢掌握在英特爾與美光手中,因?yàn)楫吘惯@項(xiàng)技術(shù)成果從概念到產(chǎn)品的整個(gè)推進(jìn)流程殊為不易——考慮到前面提到的2002年發(fā)布導(dǎo)電橋接技術(shù)許可,整個(gè)研究周期已經(jīng)延續(xù)了整整十年。
從英特爾給出的一些圖片來看,3D XPoint的基本單元結(jié)構(gòu)和目前的存儲(chǔ)芯片非常相似,都擁有完整的字線和位線,數(shù)據(jù)存儲(chǔ)在交叉疊起的字線和位線之間。字線或者位線之間存在的特定電壓差,能夠改變一種特殊材料的電阻。當(dāng)數(shù)據(jù)需要讀取時(shí),字線和位線可以檢測(cè)某個(gè)存儲(chǔ)單位的電阻值,根據(jù)其電阻值來反饋數(shù)據(jù)存儲(chǔ)情況。
3D XPoint的特點(diǎn)
了解了3D XPoint的基本工作原理,看起來似乎很簡(jiǎn)單。但實(shí)際情況遠(yuǎn)遠(yuǎn)比上文描述的復(fù)雜。尤其是特殊的電壓差和特定的材料,目前尚沒有第三家廠商掌握其中的原理。接下來,我們重點(diǎn)來看看3D XPoint到底能給我們的生活和應(yīng)用帶來怎樣的變化。
定位:并非你死我活
據(jù)英特爾給出的說法是,3D XPoint并不是用于徹底替代DRAM和NAND的技術(shù),它的定位是計(jì)算機(jī)存儲(chǔ)中的一個(gè)新的層級(jí),可以在不同的應(yīng)用領(lǐng)域增強(qiáng)目前的存儲(chǔ)結(jié)構(gòu)體系。
從英特爾給出的延遲數(shù)據(jù)來看,3D XPoint產(chǎn)品的讀取延遲大約在10納秒級(jí)別(寫入延遲更長(zhǎng)一些),和DRAM最低可達(dá)幾納秒還存在一點(diǎn)點(diǎn)差距,但遠(yuǎn)遠(yuǎn)好于NAND的微秒級(jí)別;壽命方面,3D XPoint的壽命約為百萬級(jí)讀寫次數(shù),相比NAND中MLC的數(shù)千次讀寫提升了幾個(gè)數(shù)量級(jí),當(dāng)然,和DRAM還是沒法比;帶寬方面,多通道技術(shù)的應(yīng)用使得3D XPoint在帶寬上并不存在什么劣勢(shì)。
在英特爾的官方宣傳中,3D XPoint擁有NAND類似的容量和DRAM類似的性能。包括比NAND速度快(應(yīng)該是指延遲低)1000倍以上,壽命是NAND的1000倍以上,數(shù)據(jù)密度則達(dá)到了DRAM的十倍以上。
▲3D XPoint的性能表現(xiàn)非常出色。
英特爾認(rèn)為,這樣的性能可以讓用戶根據(jù)不同的需求來選擇新的存儲(chǔ)系統(tǒng)組合,比如可以選擇組成DRAM+3DXPoint+NAND三級(jí)存儲(chǔ)系統(tǒng),或者是3D XPoint接管DRAM+NAND,亦或者組成DRAM+3D XPoint的方案,甚至也可以是3D XPoint+NAND的系統(tǒng),不同方案的成本、側(cè)重點(diǎn)和性能都有所不同,結(jié)局是開放性的,并沒有氣勢(shì)洶洶地取代誰,而是根據(jù)市場(chǎng)選擇來搭配合適的方案。
▲NAND和3D XPoint并不是你死我活的競(jìng)爭(zhēng)關(guān)系。
▲3D XPoint在系統(tǒng)中的地位。
壽命:勝任所有的熱溫存儲(chǔ)場(chǎng)景
有關(guān)壽命問題,實(shí)際上是在NAND的應(yīng)用中被討論最多的,因?yàn)門LC的NAND芯片在千次級(jí)別的完全讀寫就有可能耗盡一個(gè)單元的所有壽命。千次聽起來非常短,但目前大量的數(shù)據(jù)中心和企業(yè)用戶都布置了NAND存儲(chǔ)設(shè)備,這證明在各種平均摩擦和數(shù)據(jù)緩沖算法的幫助下,NAND的壽命問題得到了比較好的解決。在我們之前的測(cè)試中,TLC芯片的SSD,在壓力測(cè)試下同樣未出問題。
相比NAND,3D XPoint的壽命問題其實(shí)更不是問題。根據(jù)英特爾數(shù)據(jù),3D XPoint如果擁有200萬次的讀寫壽命,在平衡算法下,一個(gè)512GB的3D XPoint設(shè)備理論上需要完全讀寫1024PB才會(huì)死亡,相當(dāng)于在五年內(nèi)每天寫入574TB數(shù)據(jù)。除了那些必須使用DRAM維持超高負(fù)載的特殊場(chǎng)合,3D XPoint完全可以勝任目前幾乎所有的熱/溫存儲(chǔ)中心應(yīng)用。至于冷存儲(chǔ),從成本的角度看一直就不適合最新的高速存儲(chǔ)設(shè)備。
▲3D Xpoint在高性能消費(fèi)級(jí)PC上也有用處,在各級(jí)隊(duì)列深度下的IOPS吞吐速度提升極快。
價(jià)格:不會(huì)太便宜
說起3D XPoint的價(jià)格,需要考慮兩個(gè)方面的內(nèi)容:一是成本,二是市場(chǎng)定位。
先來看成本。根據(jù)英特爾和美光展示出來的資料,3D XPoint的單個(gè)晶元可以切割396個(gè)3D XPoint晶粒,每個(gè)晶粒面積大約為210平方毫米(每個(gè)晶粒容量為128Gb)。相比之下,20nm 128Gb的MLC NAND晶粒的面積約為202平方毫米。
總的來看,除開研發(fā)和生產(chǎn)中其他成本,僅從晶元的角度來看,3DXPoint的成本應(yīng)該和NAND相差不多,當(dāng)然良率又是另外一說了。
接下來看市場(chǎng)定位。一般來說,一個(gè)產(chǎn)品的市場(chǎng)定位是由其在市場(chǎng)中所處的性能位置所決定的。目前3D XPoint的性能定位在DRAM之下、NAND之上,但是更偏向于DRAM,因此也應(yīng)該具有類似的市場(chǎng)定位。考慮到目前DRAM的價(jià)格,可以說3D XPoint的價(jià)格應(yīng)該不會(huì)太便宜。
另一方面,英特爾自己也有龐大的NAND工廠和不小的市場(chǎng)份額,3DXPoint無論從技術(shù)上還是商業(yè)利益上來看,都不會(huì)在目前這個(gè)時(shí)候去搶NAND的飯碗。而如果從企業(yè)級(jí)和消費(fèi)級(jí)來劃分,按照慣例,產(chǎn)品成熟后,英特爾顯然會(huì)更傾向于將這一新技術(shù)首先運(yùn)用于面向利潤(rùn)較高的企業(yè)級(jí)產(chǎn)品中。
評(píng)論
查看更多