AI 服務(wù)器是專門為運(yùn)行人工智能算法和處理大規(guī)模數(shù)據(jù)而設(shè)計(jì)的高性能計(jì)算機(jī),它們通常 具備高處理能力、大內(nèi)存和高速存儲(chǔ)器、多核心處理器、高速網(wǎng)絡(luò)接口等特點(diǎn),能夠應(yīng)對(duì)復(fù) 雜的計(jì)算任務(wù)和大數(shù)據(jù)量的處理任務(wù)。 AI 服務(wù)器中 PCB 價(jià)值量的提升主要體現(xiàn)在以下幾個(gè)模塊:GPU 加速卡(OAM),主要由 GPU 芯片、內(nèi)存芯片、電源模塊、散熱器等部件組成,通過(guò) PCB 板 來(lái)連接和傳輸信號(hào)。GPU 加速卡可以分為兩種類型:SXM 版本和 PCIE 版本。SXM 版本是指使 用 NVIDIA 公司開發(fā)的 SXM 接口連接 GPU 芯片和主板的加速卡;PCIE 版本是指使用標(biāo)準(zhǔn)的 PCIE 接口連接 GPU 芯片和主板的加速卡。SXM 版本相比 PCIE 版本具有更高的帶寬和更低的 延遲,但也需要更高級(jí)別的 PCB 板和散熱系統(tǒng)。
先進(jìn)的 GPU 加速卡需要使用 5 階 20 層或以上的 HDI 板,HDI 板是高密度互連板的簡(jiǎn)稱,它是 一種通過(guò)激光鉆孔或微細(xì)加工技術(shù),在普通 PCB 板上形成微小的孔徑或線寬,從而實(shí)現(xiàn)更高 層次、更密集的布線和連接的 PCB 板。HDI 板可以提高信號(hào)完整性、降低電磁干擾、縮小尺 寸和重量、增強(qiáng)可靠性等優(yōu)點(diǎn)。HDI 板可以分為不同的階數(shù)和層數(shù),階數(shù)表示每個(gè)層面上有 多少次激光鉆孔或微細(xì)加工,層數(shù)表示有多少個(gè)層面疊加在一起。一般來(lái)說(shuō),階數(shù)越高,層 數(shù)越多,HDI 板的密度和復(fù)雜度就越高。
GPU 芯片和內(nèi)存芯片都有很多引腳或焊盤,需要通過(guò) HDI 板來(lái)實(shí)現(xiàn)高效率、低延遲、低功耗、低噪聲的信號(hào)傳輸。 GPU 加速卡需要使用高層次、高密度、高可靠性的 HDI 板來(lái)連接各個(gè)部件,主要有以下幾個(gè) 原因:GPU 芯片和內(nèi)存芯片都有很多引腳或焊盤,需要通過(guò) HDI 板來(lái)實(shí)現(xiàn)高效率、低延遲、低 功耗、低噪聲的信號(hào)傳輸。GPU 加速卡的功耗較高,會(huì)產(chǎn)生大量的熱量,如果不能及時(shí)散發(fā),會(huì)影響其穩(wěn)定性和壽 命。
因此,需要使用具有良好導(dǎo)熱性能的 HDI 板材料。GPU 加速卡的尺寸較小,需要使用 HDI 板來(lái)減少 PCB 板的面積和厚度,提高空間利用率 和散熱效果。GPU 加速卡的性能較高,需要使用 HDI 板來(lái)支持更高的頻率和帶寬,提高數(shù)據(jù)傳輸速度 和質(zhì)量。
5 階 20 層以上的 HDI 板是目前 PCB 行業(yè)中高端且昂貴的產(chǎn)品之一,其制造工藝要求非常高, 需要使用先進(jìn)的設(shè)備、材料和工藝。目前,全球能夠生產(chǎn)這種 HDI 板的廠商很少,主要集中 在日本、韓國(guó)、中國(guó)臺(tái)灣等地。 GPU 加速卡對(duì) CCL 的具體要求主要有以下幾點(diǎn):
高頻高速性能:由于 AI 服務(wù)器需要處理大量的數(shù)據(jù)和信號(hào),因此 GPU 加速卡需要使用 具有高頻高速性能的 CCL,即能夠在高頻率下保持低損耗、低時(shí)延、低串?dāng)_、低噪聲等 特性的 CCL。這需要 CCL 具有較低的介電常數(shù)(Dk)、介電損耗(Df)、表面粗糙度(Rz) 等參數(shù)。
導(dǎo)熱性能:由于 GPU 加速卡的功耗較高,會(huì)產(chǎn)生大量的熱量,如果不能及時(shí)散發(fā),會(huì)影 響其穩(wěn)定性和壽命。因此,GPU 加速卡需要使用具有良好導(dǎo)熱性能的 CCL,即能夠有效 地將熱量從芯片傳導(dǎo)到散熱器或外部環(huán)境的 CCL。這需要 CCL 具有較高的導(dǎo)熱系數(shù)(K) 和較低的熱膨脹系數(shù)(CTE)等參數(shù)。
可靠性:由于 GPU 加速卡需要在復(fù)雜的環(huán)境中長(zhǎng)期穩(wěn)定運(yùn)行,因此 GPU 加速卡需要使用 具有高可靠性的 CCL,即能夠抵抗各種應(yīng)力和環(huán)境因素的影響,保持其結(jié)構(gòu)和功能不變 的 CCL。這需要 CCL 具有較高的玻璃化轉(zhuǎn)變溫度(Tg)、較低的水分吸收率(MOT)、較強(qiáng) 的機(jī)械強(qiáng)度和耐化學(xué)腐蝕性等參數(shù)。
GPU 模組板(UBB),即 Unit Baseboard,是一種用于搭載整個(gè) GPU 平臺(tái)的 PCB 板。GPU 模組 板的主要功能是連接多個(gè) GPU 加速卡并與 CPU 主板通信。GPU 加速卡,即 Open Accelerator Module,是一種基于開放標(biāo)準(zhǔn)設(shè)計(jì)的 GPU 模塊,可以插入到 GPU 模組板上。
GPU 之間的高速互聯(lián)可以通過(guò) NVLink + NVSwitch 實(shí)現(xiàn)。NVSwitch 是英偉達(dá)推出的一種高性 能交換芯片,用于實(shí)現(xiàn)多個(gè) GPU 加速卡之間的互聯(lián)和通信,NVLink 2.0 協(xié)議最大能夠提供每 秒 900GB 的雙向帶寬。第三代 NVSwitch 有 64 個(gè)第四代 NVLink 端口,每個(gè)端口可以連接一 個(gè) GPU 加速卡或一個(gè) CPU 主板,從而實(shí)現(xiàn)多達(dá) 64 個(gè) GPU 加速卡的全互聯(lián)架構(gòu)。NVSwitch 基 于 NVLink 的高級(jí)通信能力構(gòu)建,可為計(jì)算密集型工作負(fù)載提供更高帶寬和更低延遲。
基于 第三代 NVSwitch,通過(guò)在服務(wù)器外部添加第二層 NVSwitch,NVLink 網(wǎng)絡(luò)可以連接多達(dá) 32 個(gè) 服務(wù)器、256 個(gè) GPU,并提供 57.6TB/s 的多對(duì)多帶寬,實(shí)現(xiàn) GPU 在服務(wù)器節(jié)點(diǎn)間通信擴(kuò)展, 形成數(shù)據(jù)中心大小的 GPU。為了實(shí)現(xiàn)高速、高效、高可靠的數(shù)據(jù)傳輸和圖形處理,GPU 模組板需要使用高多層通孔板(THP 板)作為載體。
THP 板是指通過(guò)機(jī)械鉆孔或激光鉆孔,在普通 PCB 板上形成大量的通孔,并 在通孔內(nèi)壁鍍上一層導(dǎo)電銅箔,從而實(shí)現(xiàn)不同層面之間的電氣連接。THP 板可以分為不同的 層數(shù),層數(shù)表示有多少個(gè)層面疊加在一起。一般來(lái)說(shuō),層數(shù)越多,THP 板的密度和復(fù)雜度就 越高。 GPU 模組板需要使用高多層 THP 板來(lái)實(shí)現(xiàn)高速數(shù)據(jù)傳輸和高頻信號(hào)處理的原因有:GPU 模組板需要處理大量的數(shù)據(jù)和信號(hào),因此需要使用具有高頻高速性能的 THP 板,即 能夠在高頻率下保持低損耗、低時(shí)延、低串?dāng)_、低噪聲等特性的 THP 板。這需要 THP 板 具有較低的介電常數(shù)(Dk)、介電損耗(Df)、表面粗糙度(Rz)等參數(shù)。GPU 模組板需要連接多個(gè) NVLink 芯片和 GPU 加速卡,因此需要使用具有高層次的 THP 板,即能夠?qū)崿F(xiàn)更多的信號(hào)通道和更好的電氣性能的 THP 板。
這需要 THP 板具有較高的 線寬線距、孔徑、阻抗控制等參數(shù)。GPU 模組板的功耗較高,會(huì)產(chǎn)生大量的熱量,如果不能及時(shí)散發(fā),會(huì)影響其穩(wěn)定性和壽 命。因此,GPU 模組板需要使用具有良好導(dǎo)熱性能的 THP 板,即能夠有效地將熱量從芯 片傳導(dǎo)到散熱器或外部環(huán)境的 THP 板。這需要 THP 板具有較高的導(dǎo)熱系數(shù)(K)和較低 的熱膨脹系數(shù)(CTE)等參數(shù)。
GPU 模組板對(duì)覆銅板有以下具體要求:
層數(shù):由于 GPU 模組板需要連接多個(gè) GPU 加速卡,并且需要實(shí)現(xiàn)多層次的電源分配網(wǎng)絡(luò) (PDN),因此需要使用較高層數(shù)的覆銅板。目前,GPU 模組板使用的覆銅板一般在 16 層 以上;
電性能:由于 GPU 模組板需要支持高速數(shù)據(jù)傳輸和高頻信號(hào)處理,因此需要使用具有較 低介電常數(shù)(Dk)和介質(zhì)損耗因子(Df)的覆銅板,以減少信號(hào)的衰減和失真,提高信 號(hào)的完整性和可靠性,目前 GPU 模組板使用的覆銅板一般采用 PPO 等高性能樹脂材料;
熱性能:由于 GPU 模組板需要承受較高的功耗和發(fā)熱量,因此需要使用具有較高熱導(dǎo)率 和熱穩(wěn)定性的覆銅板,以有效地將熱量從元器件傳導(dǎo)到散熱模組,防止過(guò)熱造成性能下 降或損壞。
目前,GPU 模組板使用的覆銅板一般采用金屬基板或者添加導(dǎo)熱填料的復(fù)合 基板;加工性能:由于 GPU 模組板需要實(shí)現(xiàn)較多的通孔連接不同層次的電路線路,并且需要實(shí) 現(xiàn)較大的面積和厚度,因此需要使用具有較好加工性能的覆銅板,以滿足 THB 的要求, 提高 PCB 的質(zhì)量和良率。目前,GPU 模組板使用的覆銅板一般采用改性 PPO(MPPO)等 可交聯(lián)的熱固性材料,可以提高流動(dòng)性和加工性。
CPU 主板,是 AI 服務(wù)器中連接 CPU、內(nèi)存、存儲(chǔ)等核心部件的部件,它可以實(shí)現(xiàn) CPU 與其他 部件之間的高速數(shù)據(jù)傳輸,并通過(guò) PCIe 5.0 實(shí)現(xiàn)與 GPU 主板的互聯(lián)。CPU 主板一般采用 ATX 或 EATX 等標(biāo)準(zhǔn)規(guī)格,其尺寸為 305mm x 244mm 或 305mm x 330mm,其內(nèi)部包含一個(gè)或多個(gè) CPU 插槽、內(nèi)存插槽、存儲(chǔ)插槽、電源管理芯片等元器件。CPU 主板通過(guò) PCIe 插槽連接到 GPU 主板上,并通過(guò) PCIe 實(shí)現(xiàn)高速數(shù)據(jù)傳輸。
CPU 主板使用的 PCB 一般為高多層通孔板(Through Hole Board, THB),其特點(diǎn)是具有較多 的通孔連接不同層次的電路線路,并且可以實(shí)現(xiàn)較大的面積和厚度。THB 可以實(shí)現(xiàn)更強(qiáng)的結(jié) 構(gòu)支撐和散熱能力,并且可以承載更多更復(fù)雜的元器件。
CPU 主板對(duì)覆銅板有以下具體要求:
介電常數(shù)和介質(zhì)損耗:這兩個(gè)參數(shù)影響信號(hào)的傳輸速度和能量損失,對(duì)于高頻、高速的 CPU 主板來(lái)說(shuō),需要選擇低介電常數(shù)和低介質(zhì)損耗的 CCL,以保證信號(hào)的完整性和質(zhì)量。
熱膨脹系數(shù):這個(gè)參數(shù)影響 CCL 在溫度變化時(shí)的尺寸穩(wěn)定性,對(duì)于高溫、高功率的 CPU 主板來(lái)說(shuō),需要選擇熱膨脹系數(shù)與銅箔相近的 CCL,以避免因?yàn)闊釕?yīng)力導(dǎo)致的層間分離 或過(guò)孔開裂等缺陷。
熱導(dǎo)率:這個(gè)參數(shù)影響 CCL 在散熱方面的性能,對(duì)于高溫、高功率的 CPU 主板來(lái)說(shuō),需 要選擇熱導(dǎo)率較高的 CCL,以有效地將熱量從 CPU 和其他元件傳導(dǎo)到散熱器或外部環(huán)境。
阻燃等級(jí):這個(gè)參數(shù)影響 CCL 在遇到火災(zāi)時(shí)的安全性能,對(duì)于所有的電子產(chǎn)品來(lái)說(shuō),都需要選擇阻燃等級(jí)較高的 CCL,以防止因?yàn)榛馂?zāi)引起的人員傷亡或財(cái)產(chǎn)損失。一般來(lái)說(shuō), 阻燃等級(jí)應(yīng)達(dá)到 UL94 V-0 或以上。
據(jù)產(chǎn)業(yè)調(diào)研,預(yù)估 2024 年 AI 加速卡需求為 400 萬(wàn)顆,加速卡 PCB 用量平均單價(jià) 100 美元/ 顆,如果折算成英偉達(dá) DGX A100 服務(wù)器對(duì)應(yīng)為 50 萬(wàn)臺(tái),對(duì)應(yīng) UBB 板的 PCB 用量為 1000 美 元/臺(tái),對(duì)應(yīng) CPU 主板的 PCB 用量為 200 美元/臺(tái),這三部分帶來(lái)是市場(chǎng)增量合計(jì) 10 億美元。
此外,隨著PCIe 標(biāo)準(zhǔn)升級(jí)下信息交互速度不斷提升,對(duì) PCB 的設(shè)計(jì)、走線、板材選擇等要求提高。
PCIE5.0(第五代 PCI Express 總線標(biāo)準(zhǔn)),是一種用于連接各種外設(shè)設(shè)備的高速串行接口, 于 2019 年 5 月正式發(fā)布。PCIE5.0 相比于上一代 PCIE4.0,帶寬提升了一倍,能夠支持更高 性能的 CPU、GPU、存儲(chǔ)等設(shè)備,滿足 AI 服務(wù)器等高算力需求。通過(guò)改變電氣設(shè)計(jì)改善信號(hào) 完整性和機(jī)械性能,PCIE5.0 新標(biāo)準(zhǔn)減少了延遲,降低了長(zhǎng)距離傳輸?shù)男盘?hào)衰減。與 PCIE4.0 相比,PCIE5.0 信號(hào)速率達(dá)到 32GT/s,x16 帶寬(雙向)提升到了 128GB/s,能夠更好地滿足 吞吐量要求高的高性能設(shè)備,如數(shù)據(jù)中心、邊緣計(jì)算、機(jī)器學(xué)習(xí)、AI、5G 網(wǎng)絡(luò)等場(chǎng)景日益增 長(zhǎng)的需求。除了保證高速傳輸?shù)哪芰Γ琍CIE5.0 還進(jìn)一步加強(qiáng)了信號(hào)完整性,不僅適合連接 顯卡、SSD 等配件,也適用于平臺(tái)總線的使用。
目前 PCB 主流板材為 8-16 層,對(duì)應(yīng) PCIe 3.0 一般為 8-12 層,4.0 為 12-16 層,而 5.0 平臺(tái)則在 16 層以上。從材料的選擇上來(lái)看, PCIe 升級(jí)后服務(wù)器對(duì) CCL 的材料要求將達(dá)到高頻/超低 損耗/極低損耗級(jí)別。 據(jù)產(chǎn)業(yè)調(diào)研,目前支持 PCIe3.0 標(biāo)準(zhǔn)的 Purley 平臺(tái) PCB 價(jià)值量約 2200- 2400 元,支持 PCIe4.0 的 Whitley 平臺(tái) PCB 價(jià)值量提升 30%-40%,支持 PCIe5.0 的 Eagle 平 臺(tái)的 PCB 價(jià)值量比 Purley 高一倍。根據(jù)我們測(cè)算,到 2025 年,PCIe 5.0 的升級(jí)有望為服務(wù) 器平臺(tái) PCB 帶來(lái)百億的價(jià)值增量。
編輯:黃飛
評(píng)論