在語言大模型(LLM)、推理大模型(如DeepSeek)等AI應用爆火的當下,數據存儲和訪問速度、模型訓練與推理效率等相關話題也逐步升溫,SSD在其中扮演著不可或缺的角色。跟隨本欄目,快速了解SSD存儲正在進行著哪些變革。
上期我們對QLC SSD、TLC SSD以及HDD分別進行了優勢對比,并得出了成本分析。本期將重點介紹QLC SSD在設計上存在的諸多挑戰及解決之道。
更大的內部扇區尺寸
從硬件設計及成本上考慮,高密度QLC SSD存儲容量增加時,其配置的DRAM容量通常不變,這意味著盤內單位扇區(Indirect Unit)會變大。
例如,標準的4TB TLC 4KB扇區SSD需要配置4GB DRAM來保存L2P表。對于64TB QLC SSD若其DRAM的配置容量保持不變,則必須使用64KB扇區。此時如果執行一個4KB的隨機寫IO,則需要執行“讀-改-寫”的過程,這將產生16倍的寫放大。而TLC SSD的4KB隨機寫則無此問題。
因此,盡管QLC SSD大尺寸連續寫性能與TLC SSD持平,但是其4KB隨機寫性能遠低于TLC SSD,根源在于其內部扇區更大。
在操作系統下發給SSD盤的讀寫請求中,尺寸小于4KB的請求較為少見,而實際運行中4KB的讀寫請求數量卻不少,主要源于以下幾個方面:
l 塊設備接口的邏輯扇區(LBA)尺寸是512B或者4KB;
l 主流操作系統的內存頁面的尺寸設定為4KB;
l 文件系統的空間分配單位通常不小于4KB。
針對這些問題,操作系統的內存管理和文件系統正在積極修改,以適應更大的SSD內部扇區尺寸,隨著時間的推移,技術將逐步演進成熟,更好地支撐大型內部扇區。
另外,當前的DWPD測試標準是基于JEDEC JESD218制定的,采用4KB寫負載進行評估。雖然4KB寫負載并不能準確模擬實際應用中可能出現的各種工作負載,但是DWPD仍然是評估SSD性能的重要指標,因而必須堅持使用統一的測試標準。考慮到QLC SSD的盤內扇區較大的特性,在這一測試標準下,DWPD測試結果通常會顯得較為遜色。
解決此類現象的思路包括對DWPD測試標準進行調整,使用更加適合QLC SSD特性的寫負載進行評估,或者針對QLC SSD制定專項的測試規范,結合其特有的存儲單元結構和寫入機制,以便更準確地反映QLC SSD在不同使用場景下的表現。行業內的標準化組織也能盡早推動,形成能夠覆蓋不同NAND類型的綜合性測試標準,以體現更公平的性能評估。
布局和堆疊
目前大容量的SSD普遍采用TLC或QLC NAND,一般會采用16~32顆NAND FLASH顆粒。顆粒數量的增加會帶來整盤的器件布局、PCB堆疊設計的挑戰。
一般企業級的SSD,主要器件包括1顆SoC,5-10顆DDR(含ECC),多顆NAND FLASH顆粒,備電電容等。要在有限的空間內實現,對PCB的布局密度提出了更高的要求。
表1、常見企業級SSD硬件形態
在極端的場景下,例如9顆DDR+32顆NAND FLASH,單層PCB已經無法放下, 此時就需要用兩層或者更多層PCB堆疊來實現,PCB通過柔性PCB或者接插件鏈接。比如憶聯 UH610 SSD,采用了高密布局和兩層PCB堆疊來實現。
圖1、憶聯UH610采用柔性PCB
此外,大容量SSD的NAND顆粒一般采用ODP或HDP的封裝,也就是一個顆粒(package)會封裝8個或者16個Die。對于HDP來說,芯片的高度就會稍高于采用ODP、QDP等Die數較少的封裝形式,進而影響結構的堆疊設計。
功耗和散熱
對于單個SSD來說,雖然最大功耗的上限是固定的,但是由于降額的要求,最大功耗場景在一般的業務運行過程中很難出現,我們需要更多關注的是業務場景下的“典型功耗”。
表2、各硬件形態SSD最大功耗
一方面,受限于供電、散熱和SI,即使是大容量的SSD,其最大性能仍略低于普通容量的SSD。但在典型的業務場景下,兩者可達到的性能是基本一致的。SoC的功耗主要取決于性能,因此對于某一款具體的SoC而言,相同業務壓力下的功耗,可以認為是基本不變的。
另一方面,隨著SSD容量的增加,采用的介質(NAND FLASH)不論是Die的數量,還是單Die的容量,均會增加。采用4KB FTL(Flash Translation Layer)粒度的標準SSD,為了支撐更大的物理容量,FTL表項數量也會隨容量成比例增加,帶來DDR顆粒的容量或數量增加。NAND FLASH和DDR顆粒的增加,不論是數量,還是總的Die面積(即規模)增加,都會使漏電流隨之變大,進而導致SSD靜態功耗增加。因此整盤的功耗會隨著容量增加而增大。
圖2、2TB和16TB SSD 14G帶寬順序讀功耗分布
從單個SSD的角度來看,布局密度增加以及PCB的堆疊設計,增加了SSD的風阻,帶來了更高的風壓,風量就會降低,用于熱交換的空氣變少,導致SSD溫度升高。
圖3、阻力越大,風量越小
SSD上的器件(NAND、DDR等)功耗增加,會使流經SoC的空氣,被更多的加熱;外殼殼體也會被加熱到更高的溫度,也會使SSD溫度升高。
對于一個系統來說,不論是服務器還是專用的存儲設備,散熱都需要滿足SSD的最大功耗的要求。但是如前面分析,我們更應該關注“典型功耗”。大容量SSD的典型功耗增加,意味著同樣業務性能下,需要更高的風扇轉速或者液冷工質流速,提供更多的風量或流量散熱。
綜上所述,QLC SSD在逐漸嶄露頭角的同時,也在不斷攻克內部扇區尺寸、布局與堆疊、功耗與散熱等設計上的挑戰,這些創新也為QLC SSD的進一步應用鋪平了道路。
隨著市場對存儲解決方案需求的不斷演變,QLC SSD將會在哪些業務場景中取得領先優勢,又將如何推動存儲技術的進一步發展呢?敬請持續關注本系列文章。
審核編輯 黃宇
-
存儲
+關注
關注
13文章
4379瀏覽量
86287 -
SSD
+關注
關注
21文章
2898瀏覽量
118058 -
TLC
+關注
關注
0文章
137瀏覽量
51643
發布評論請先 登錄
相關推薦
高密度3-D封裝技術全解析

存儲變革進行時:高密度QLC SSD緣何扛起換代大旗(一)

hdi高密度互連PCB電金適用性

揭秘高密度有機基板:分類、特性與應用全解析

高密度Interposer封裝設計的SI分析

群暉PB級高密度存儲,滿足海量數據存儲、備份與存檔

什么是高密度DDR芯片
mpo高密度光纖配線架解析
高密度存儲系統集成必選,8盤位SATA/SAS熱插拔硬盤抽取盒

評論