近日,《烏合麒麟撤回道歉,稱3D堆疊就是芯片優(yōu)化技術(shù)》事件在網(wǎng)上引起爭論,今天ASPENCORE記者歐陽洋蔥同學(xué)進(jìn)一步對“ 14nm + 14nm 達(dá)成‘比肩’7nm 性能的問題”展開了專業(yè)的分析。
原文如下:
說點(diǎn)題外話,大家就當(dāng)看個熱鬧吧,既然說舊工藝的“疊加”,那咱就聊聊疊加嘛。
首先還是強(qiáng)調(diào)一點(diǎn),現(xiàn)在所謂的幾 nm 工藝,這個幾 nm 的數(shù)字并不是指晶體管的 gate length(或溝道長度)——很多人對此是存在誤解的。比如臺積電的 7nm 工藝,晶體管并不存在任何一個物理參數(shù)是 7nm。7nm 只是一個代號,你也可以叫它 α nm。14nm、7nm 這樣的稱謂是歷史原因造成的,對此有興趣的可以看我的文章:為什么說Intel 10nm工藝比別家7nm先進(jìn)?(上)
有關(guān) 14nm + 14nm 達(dá)成“比肩”7nm 性能的問題,稍帶腦洞地說兩點(diǎn),也算是無聊閑扯吧。
第一是光刻技術(shù)的“疊加”。把光刻比做是一把雕刻刀,用現(xiàn)在的“光刻刀”,只下刀一次的話,其實(shí)是無法“雕刻”出你期望的晶體管大小的(包括 EUV),而需要下好幾次刀。雖然這個“疊加”和某媒體所說的 14nm + 14nm 并不是同一回事,但反正 14nm 也不是真的 14nm(前面說了,這個數(shù)字沒意義),所以開個腦洞也沒什么。
比如說三星的 8nm(8LPP)工藝,這種工藝下金屬堆棧部分的最小金屬間距是 44nm。我們知道 8nm 工藝,在光刻這道工序上還沒有應(yīng)用 EUV 極紫外光,仍然是 DUV 深紫外光,ArF(argon fluoride)光源本身的波長是 193nm。
這把“光刻刀”不夠銳啊,咋辦呢?要克服衍射效應(yīng),“雕刻”更小的圖案,業(yè)界其實(shí)是引入了多種技術(shù)的,包括“疊加”的雙重曝光、四重曝光(quad patterning)之類的;也就是既然一次刻不出那么高的精度,那就多刻幾次(當(dāng)然還需要配合周邊的很多技術(shù))。
三星應(yīng)用的是一種叫 LELE 的技術(shù),也是 DUV 多重曝光的一種技術(shù)方向。其過程是這樣的(以下資料來自 Wikichip,圖片也來自 Wikichip,我只是搬運(yùn)工;我之前被 Wikichip 警告過一次,所以這里大家多點(diǎn)鏈接去看看原文吧。。。):
首先呢就是像上圖這樣,要有襯底、圖案層(device layer)、硬掩膜(hardmask)。假定我們的目標(biāo)是 64nm 的金屬互聯(lián)間距,那么 LELE 的步驟大致是下面這張圖這樣的:
這個步驟的大致過程就是光刻膠(photoresist)在 mask 覆蓋下曝光,形成需要的圖案。
第一步,上方有個掩膜圖案,在光源照射下,能做出 128nm 的間距(左上圖:Litho 1)。第二步,將圖案通過第一次蝕刻轉(zhuǎn)到硬掩膜之上——?dú)埩舻挠惭谀鳛楹罄m(xù)步驟的掩膜存在。
第三步,用另一組掩膜圖案和光刻膠,重復(fù)該過程,仍采用相同的 128nm 圖案間距進(jìn)行光刻。最后,再用硬掩膜和光刻膠作為蝕刻掩膜,二次蝕刻后就在下面的圖案層形成了所需的圖案。
由于兩次 litho-etch(光刻-蝕刻)操作,就形成了 64nm 的互聯(lián)間距。
不需要去深入研究這個過程,反正知道是通過了兩次差不多的操作才達(dá)成了 64nm 間距的。其實(shí)三星在 8nm 節(jié)點(diǎn)上用了 LELELELE,也就是四次上述的 LE 操作。說人話就是要刻最多 4 次,才能刻出所需的精度。
當(dāng)然了,這個過程難度頗大,需要克服的工程難點(diǎn)也很多;而且步驟越多,成本也會越高;所以才需要用更銳的“光刻刀”嘛,比如 EUV 就比 DUV 更“銳”,也就不需要刻這么多次。但像 LELE 這樣的操作,是不是可簡單認(rèn)為是某種舊工藝方案的“疊加”呢?(衰。。。說得過去吧。。。
第二點(diǎn)是針對這個話題,現(xiàn)在數(shù)碼圈討論比較多的 die 的 3D 堆疊。其實(shí)當(dāng)時某媒體(微博)原文說法是“雙芯疊加”,“特定的芯片設(shè)計(jì)方法”。人家也沒說是垂直堆疊嘛(雖然感覺“疊”好像直覺上勢必得垂直方向了;不管了),
更沒說雙芯必須同等 die size 或同等微架構(gòu)的比較。而且原文提到了“將疊加性能提升至比肩 7nm 芯片的程度,并且功耗發(fā)熱也很不錯”。性能、功耗、成本分開來談,還是很好的說法。
14nm 芯片只要堆料充分,性能超越 7nm 芯片不成問題啊。比如 Rocket Lake 的 8 核 Intel 酷睿處理器(i9-11900K)性能,肯定比高通驍龍 865 性能強(qiáng)吧。前者是 Intel 14nm,后者是臺積電 7nm。這倆就不是一個平臺、一個定位,連 14nm 和 7nm 這倆名字對比的維度都不同(或者也可以比 7nm 的 Ryzen 5 5600U。。。)。
何況現(xiàn)在很多超算芯片也沒用尖端工藝,難道性能還比不上 5nm 手機(jī) SoC 了?這真的在于你堆了多少料,雖然達(dá)成同等性能,越早的工藝要付出的成本和功耗會顯著增加。(當(dāng)然工藝代差不能太大,否則會涉及到一些更現(xiàn)實(shí)的工程問題)
這種對比只在于性能堆料,純比性能(Performance),根本就沒意義;又沒比效率、功耗(Power)和成本(Area)。原文只說“功耗發(fā)熱也很不錯”。。。“不錯”多含糊。。。是不是。。。
至于 3D 垂直堆疊,不管是 Intel Fevoros,還是臺積電 CoWoS,芯片 die 堆起來應(yīng)該可以吧。不過應(yīng)該不是 compute die 直接疊,而且我估計(jì)如果兩層 14nm 要達(dá)成同代設(shè)計(jì) 7nm 芯片的性能,可能散熱會成問題。所以還是不要垂直堆起來吧,就 die size 做大點(diǎn),或者多 die 以 side-by-side 的方式封裝就好了。。。
前一陣 AMD 推的 3D V-cache,前不久才寫了篇文章,這篇文章也總結(jié)了臺積電目前的 3DFabric 封裝工藝:把CPU三級緩存堆到192MB,AMD與臺積電的合謀以上算純開玩笑。。。
畢竟原文的說法就相當(dāng)模糊,我們模糊點(diǎn)理解,也沒什么問題吧。。。況且海思是做 IC 設(shè)計(jì)的,就算要做垂直堆疊,也必須與 foundry 廠合作才行,不是自己在家就搞一搞,然后就強(qiáng)于世界的。總體上就是扯。。。
補(bǔ)充:聲明一下,可能很多人沒搞清楚我想表達(dá)的東西,我的這篇回答只是個用于課外閱讀的科普;本回答提到了如果要說“疊加”的話,在制造和封裝層面,哪里可以體現(xiàn)出“疊加”這個詞。
我并不贊同“雙芯疊加”就能讓 14nm“比肩”7nm,主要是效率方面。但用 14nm 造性能高于 7nm 工藝的芯片真的不是什么難事,只是功耗發(fā)熱不對等罷了。而且本回答的第一部分提到光刻的多重曝光,DUV “光刻刀”并不是 14nm 的專屬,EUV 也不是 7nm 的專屬。DUV 一樣可以造 7nm/10nm。。。
擴(kuò)展:
有關(guān)于舊工藝需要多大面積來實(shí)現(xiàn)新工藝的同等設(shè)計(jì)。這一點(diǎn)有興趣的同學(xué)可以去看看 Intel 今年桌面酷睿處理器的 Cypress Cove 核心。
Cypress Cove 就是個 14nm 工藝的核心,不過其設(shè)計(jì)是來自于 10nm 的 Sunny Cove(陽光海灣)。或者說 Cypress Cove 實(shí)際上是 Sunny Cove 向前移植(backport)的核心。當(dāng)代不同制造工藝的移植,所需做的工作其實(shí)會比較繁瑣,包括因?yàn)楦蟮木w管和間距,布線之類的都可能在性能上表現(xiàn)出差別。
其實(shí)那些關(guān)心舊工藝做個 2x 面積的 die,能不能達(dá)成新工藝 1x 的 die 的,可以去研究下 Cypress Cove 和 Sunny Cove 的面積差異。我沒仔細(xì)去查過,但估計(jì)應(yīng)該可以查到(雖然可能某些報(bào)告估計(jì)要收費(fèi))。。。。。。
貌似 Arm 平臺也有類似的例子吧。。。。。。
網(wǎng)友評論:終于有人聊些干貨了!
@HelltoHell:終于有干貨了,原文的說法很雞賊,很廢話,主要也是以誤導(dǎo)人為目的的。但人那種說法還真……沒什么錯誤……
@jusdejude :這篇回答解釋的清楚!看完總算對這事兒有點(diǎn)概念了。這么說來,華為微博原文沒毛病啊,人轉(zhuǎn)發(fā)就更沒毛病了啊,那這些數(shù)碼專家揪著人家畫手咬文嚼字到底是他們自己也沒搞懂呢,還是借題發(fā)揮輸出怨氣呢?
還一堆在那洗比喻貼切的,兩杯50度水加一起不等于100度,這類比哪里貼切了?不應(yīng)該是,兩杯燙水加一起實(shí)現(xiàn)了另一杯燙水同樣的暖身體的功效嘛?
@Lee昂昨天:終于有人聊些干貨了,謝謝你
@負(fù)離子3 :因?yàn)?nm線路已經(jīng)足夠接近理論上限,本身就需要額外的設(shè)計(jì)來保障正常工作,使用更大面積的14nm線路來頂一樣性能的邏輯門數(shù)量,其實(shí)也沒有需要簡單計(jì)算的四倍面積之多,兩倍都差不多性能了。
二來你以為這是堆料,沒堆,兩邊計(jì)算單元數(shù)量差不多。我們老說新CPU比舊CPU更強(qiáng),是指在同樣的指甲蓋上填了更多的電路。這邊的事不一樣,這邊是用兩個指甲蓋放原來一個指甲蓋的東西。
三來就是功耗問題,的確理論上會略大,但也就是略大而已,還是因?yàn)?nm這東西太接近理論上限了,額外的東西太多。現(xiàn)在的情況是工藝不成熟,設(shè)計(jì)不合理等原因才是大頭,不是原理。
四是理論上沒有亞空間突破的話,這個疊疊樂就是未來,你一層園林再精巧還是比不過高樓大廈。我們需要的是裝入更多計(jì)算單元,為了這個我們還發(fā)展了更強(qiáng)的電力生產(chǎn)更強(qiáng)的散熱工具,所有一切條件都是為了這個核心服務(wù)的。
編輯:jq
-
芯片
+關(guān)注
關(guān)注
456文章
51189瀏覽量
427293 -
cpu
+關(guān)注
關(guān)注
68文章
10905瀏覽量
213029 -
光源
+關(guān)注
關(guān)注
3文章
711瀏覽量
67897 -
光刻膠
+關(guān)注
關(guān)注
10文章
322瀏覽量
30346 -
DUV
+關(guān)注
關(guān)注
1文章
55瀏覽量
3737
原文標(biāo)題:干貨:14nm + 14nm 如何才能達(dá)成“比肩”7nm 性能?
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論