與第三代EPYC 7003系列處理器相比,新一代EPYC 9004系列處理器有大量的技術進步,主要包括核心數量、計算線程數大幅提升到最高96核心、192線程;5nm“Zen 4”架構帶來了標稱14%的IPC性能提升;AVX-512指令集的加入;雙CPU互聯可以最多對外提供160條PCIe 5.0總線;12通道DDR5內存系統則讓服務器的內存性能突飛猛進(注:如果您想深入了解新一代EPYC 9004系列處理器的具體技術架構、產品組成,請閱讀我們在今天發布的第二篇文章:《第四代AMD EPYC處理器先進技術指南》)。那么在實際測試與應用中,它的性能究竟能有多少提升呢?在此背景下,我們特別針對第四代AMD EPYC(霄龍)9004系列處理器進行了獨家測試。
參測處理器規格解析
《微型計算機》評測室本次對AMD EPYC 9654、EPYC 9554、EPYC 9374F這3款處理器進行了詳細測試。其中EPYC 9654處理器是第四代EPYC處理器中定位最高的產品,雖然它的最高加速頻率在所有產品中不算高,只有3.7GHz,但它卻擁有多達96核心、192條線程,384MB三級緩存。相對64核心的產品,其TDP熱設計功耗也沒有上升太多,為360W,與EPYC 9554這類高頻64核心處理器相同。更值得一提的是,AMD EPYC 9654支持組建雙路系統,為用戶打造192核心、384線程多核心的超多核心計算系統創造了條件,對那些亟需多線程運算性能的渲染與模擬、科學仿真用戶頗具吸引力。
而第二款AMD EPYC 9554是一款兼具頻率與核心數量的處理器,它采用64核心、128線程設計,能夠滿足各類服務器應用。之所以它的TDP熱設計功耗與AMD EPYC 9654相同,原因就在于它擁有更高的基準頻率,從 EPYC 9654的2.4GHz提升到3.1GHz,全核心加速頻率也從3.55GHz提升到3.75GHz。它既適用于那些對頻率有較高依賴的應用,也能滿足各類多線程計算應用的需求。
我們測試的第三款AMD EPYC 9374F處理器有所不同,其型號帶有“F”,采用這種命名方式的主要目的是突出它擁有更高的單核心基頻及最高加速頻率,其基準頻率就超過前面兩款處理器的最高加速頻率,為3.85GHz,單核心最高加速頻率可達4.3GHz,全核心加速頻率達到4.1GHz。這意味著該處理器很適合進行3D建模與與AEC(建筑、工程、施工)可視化等依賴處理器頻率的各類應用,同時其核心、線程數也不少,擁有32核心、64線程配置,也能從事渲染、科學運算之類的工作。
▲AMD EPYC 9654、EPYC 9554、EPYC 9374F都采用接近正方形的外觀設計,相比上代EPYC處理器面積更大。
為了更直觀地體現第四代EPYC 9004系列處理器的進步,我們還采用第三代AMD EPYC處理器中綜合性能最強的EPYC 7763參與了測試,EPYC 7763采用Zen 3處理器架構,7nm工藝打造,基于64核心128線程設計,基準頻率為2.45GHz,Boost頻率最高為3.5GHz,TDP為280W,支持8通道DDR4 3200內存。在參測處理器中,AMD EPYC 7763的技術規格最接近AMD EPYC 9554,所以請大家特別注意EPYC 9554與EPYC 7763的差異,這也最能體現新一代處理器的進步所在。
我們如何測試
本次測試統一考察的是雙路系統的性能,因此所有參測的三款第四代EPYC 9004系列處理器都統一使用了AMD Titanite SP5 2P2U雙路主板。內存方面,EPYC 9004系列單路CPU支持12個內存通道,比EPYC 7003系列處理器增加了4個內存通道,其中1DPC(DIMM Per Channel,每通道內存數量)支持12根內存,2DPC支持24根內存;EPYC 9004雙路系統則支持24個內存通道,不過由于受限于機架和機箱寬度,雙路服務器只能支持1DPC 24根內存。本次測試所使用的內存為三星DDR5 4800 64GB,內存總數量為24根,內存總容量為1.5TB,搭配美光9300系列企業級NVMe SSD。
而基于Zen 3架構的EPYC 7763雙路系統則采用AMD DAYTONA_X主板、三星 DDR4 3200 32GB內存,總數量為16根,內存總容量為512GB,搭配三星PM883企業級SSD。接下來我們在Ubuntu 22.04操作系統下,特別采用考察處理器浮點與整數性能、內存性能,以及壓縮、光線追蹤、科學仿真等十大專業軟件、13個子項項目對四款處理器的性能進行了全面測試。
▲本次測試統一考察的是雙路系統的性能,第四代EPYC 9004系列處理器采用了AMD Titanite SP5 2P2U雙路主板,12通道、24條內存配置。
第四代AMD EPYC處理器雙路系統測試平臺一覽
處理器:EPYC 9654 ×2
EPYC 9554×2
EPYC 9374F×2
內存:三星DDR5 4800 64GB×24
主板:AMD Titanite(BIOS版本:RT1003F)
硬盤:美光9300系列企業級NVMe SSD
操作系統:Ubuntu 22.04
第三代AMD EPYC 7763雙路系統測試平臺一覽
處理器:EPYC 7763×2
內存:三星 DDR4 3200 32GB×16
主板:AMD DAYTONA_X(BIOS版本:RYM1007C)
硬盤:三星 PM883
操作系統:Ubuntu 22.04
性能測試:SPECrate 2017
SPECrate 2017 測試的是在單位時間內運行的實例數量,這是服務器采購時的主要性能指標,所以服務器廠商和處理器廠商通常提供的是這一測試成績。在SPECrate 2017 中包含SPECrate Integer 和SPECrate Floating Point,前者測試的是整型并發性能,后者測試的是浮點并發性能。
首先我們關注了EPYC 9554與EPYC 7763在雙路配置性能上的對比。測試成績顯示盡管兩款雙路系統的核心數、線程數都為128核心、256線程配置,但使用新架構、DDR5內存,工作頻率也更高的EPYC 9554在測試成績上有非常顯著的提升,其浮點運算性能較上一代產品提升了高達90.2%,整數運算性能也提升了多達62.2%。
同時更為驚人的是,即便核心、線程數更少的EPYC 9374F雙路系統(64核心、128線程)也戰勝了核心、線程數翻倍的AMD EPYC 7763雙路系統。我們分析主要原因在于一是EPYC 9374F處理器的工作頻率大大提升,其全核心加速頻率可達4.1GHz,較EPYC 7763領先900MHz,可以有力彌補在處理器核心數上的不足。二是使用了新的Zen 4處理器核心,即便在同頻率下,Zen 4處理器的IPC性能較Zen 3處理器都有14%的性能提升;三是AMD第四代EPYC 9004系列處理器的雙路系統可以使用升級了規格的4條Infinity Fabric總線連接兩顆處理器,其理論傳輸帶寬最高可達PCIe 5.0 x64即256GB/s,較上代產品使用的PCIe 4.0 x64即128GB/s傳輸帶寬翻倍,可以更通暢、充分地傳輸兩款處理器之間的互聯數據,不會存在數據傳輸瓶頸,從而能更高效地發揮出兩顆處理器的最大計算性能;四還是帶寬助力,AMD第四代EPYC 9004系列處理器采用的是12通道DDR5 4800內存系統,其每路理論內存帶寬也比第三代EPYC使用的8通道DDR4 3200內存系統要大得多,從而也能更好地發揮出新處理器的運算性能。
接下來讓我們再看看怪獸級系統:采用192核心、384線程的EPYC 9654雙路系統的性能表現。憑借更多的計算核心與線程數,它的表現肯定是最優的,其整數性能相對于EPYC 9554雙路系統又領先了多達30.9%,浮點運算性能領先了16.4%。雖說可能由于軟件優化有限,無法充分發揮出384條計算線程的最大威力,但可以肯定的是,如果應用場景需要更強大的多線程運算性能,EPYC 9654就是最佳選擇。
性能測試:Stream-Triad
Stream是業界廣為流行的綜合性內存帶寬實際性能測量工具之一。和硬件廠商提供的理論最大內存帶寬不同,通過fortran、C兩種高級且高效的語言編寫完成的Stream,可以在測試中充分發揮出內存的能力。Stream一共包含Copy、Scale、Add 和Triad 這4種操作,其中Triad組合了前面3種操作,所以其測試成績更具參考價值。
從測試結果可以看到,由于參測的AMD第四代EPYC 9004系列處理器每一路采用的是規格大幅提升的12通道DDR5 4800內存系統,相對于第三代EPYC 7763每一路系統采用的8通道DDR4 3200在單路內存帶寬在規格上就有大幅提升(460.8GB/s VS. 204.8GB/s),因此最終在實際測試上,AMD第四代EPYC 9004系列處理器雙路系統在內存性能上也取得了壓倒性的勝利。三款第四代EPYC處理器的內存帶寬最低成績也有741062.959MB/s,相對于EPYC 7763處理器雙路系統的內存性能領先多達99.2%。
性能測試:7-ZIP壓縮性能
7-Zip是一款完全免費而且開源的壓縮軟件,其大部分代碼都是基于GNU LGPL協議編寫,部分代碼基于BSD 3-clause協議編寫。其壓縮性能測試主要考察處理器壓縮文件的速度,是一個支持多線程壓縮的測試,比較依賴處理器的整數運算性能與內存性能。
結果顯而易見,由于在壓縮應用中內存的性能也至關重要,只有內存快速地傳輸需要壓縮的文件數據才能提升處理器的壓縮效率,因此每路采用12通道DDR5內存的AMD第四代EPYC 9004系列處理器憑借高得多的內存帶寬可以輕松地戰勝每路采用8通道DDR4內存的EPYC 7763處理器。哪怕是雙路EPYC 9374F系統,在核心總數和線程總數都比雙路EPYC 7763少一半的情況下,其壓縮性能也比EPYC 7763領先了18.1%。而在第四代EPYC處理器中,由于7-ZIP也是一款支持多線程壓縮性能的測試,所以核心、線程數更多的192核心、384線程的EPYC 9654雙路系統擁有更好的表現,其壓縮速度比128核心、256線程配置的EPYC 9554雙路系統快了100616MIPS。
性能測試:NAMD
NAMD 是一種并行的分子動力學代碼,由伊利諾伊大學厄巴納- 香檳分校貝克曼高級科學與技術研究所的理論和計算生物物理學小組開發,它主要用于大型生物分子系統的高性能模擬。本次測試中,我們主要通過NAMD來考察參測處理器的浮點性能。
結果與之前的測試類似,憑借Zen 4架構、更高的工作頻率、更強的內存與傳輸總線配置,同為128核心、256線程配置的EPYC 9554雙路系統比EPYC 7763雙路系統快了44.4%,領先幅度非常明顯。其實即使是64核心、128線程配置的EPYC 9374F雙路系統在這一測試中也就比7763雙路系統僅僅慢了0.47%,差距非常小,這也進一步突出了AMD第四代EPYC 9004系列處理器也有效提升了處理器的單核心性能,使得更少核心的處理器就能媲美上一代旗艦產品。而頂級的192核心、384線程EPYC 9654雙路系統依然擁有最好的表現,其執行速度比128核心、256線程配置的EPYC 9554雙路系統還快了43%,優勢很大。就如我們前面所說,在科學仿真類應用中,是能夠發揮出處理器多線程運算性能的。
性能測試:OpenSSL
OpenSSL廣泛用于保護服務器之間的通信,這是許多服務器堆棧中的重要協議。OpenSSL測試主要包含生成簽名和驗證簽名兩部分,我們在本次此時中主要進行了OpenSSL生成簽名測試。
測試結果顯示,OpenSSL測試顯然是一個非常依賴處理器多線程運算性能的測試,不同核心數、線程數配置的雙路系統在成績上都有顯著的區別。如擁有192核心、384線程的EPYC 9654雙路系統在簽名效率上比128核心、256線程配置的EPYC 9554雙路系統快了47.6%。而EPYC 9554雙路系統的簽名效率又比64核心、128線程配置的EPYC 9374F雙路系統快了多達74%。當然處理器架構、工作頻率上的不同也可以在OpenSSL生成簽名測試上拉開差距,如EPYC 7763雙路系統與EPYC 9554雙路系統雖然都為128核心、256線程配置,但后者的簽名效率比前者快了28.8%,Zen 4架構的優勢顯而易見。
性能測試:UnixBench Dhrystone 2和Whetstone
本項目主要用于測試Unix系統性能,其中包括測試字符串處理,體現整數性能的Dhrystone 2 using register variables和測試雙精度浮點操作速度與效率的Double-Precision Whetstone 這兩個測試項目。此外,在這兩個測試項目均可選用單線程或多線程進行測試,本次測試我們使用的是多線程。
測試結果與SPECrate 2017類似,首先EPYC 9554雙路系統在體現整數性能的Dhrystone 2 using register variables上領先EPYC 7763雙路系統高達63.4%,在雙精度浮點性能運算上也領先了19.9%,作為兩個處理器核心數量、線程數相同的雙路系統,第四代EPYC 9004系列處理器的進步得到了充分體現。值得一提的是,64核心、128線程配置的EPYC 9374F雙路系統也再次展現了單核心性能大幅增加的實力,其整數性能只落后EPYC 7763雙路系統約2.3%,要知道它的處理器核心數量可是比后者少了64顆。而192核心、384線程的EPYC 9654雙路系統繼續壓倒群雄,其整數性能、雙精度浮點性能分別領先EPYC 9554雙路系統達29.7%、44.6%。
性能測試:C-ray 1.1
C-ray 是一種常用的光線追蹤基準測試,可以顯示多線程工作負載下處理器的差異,時間越短說明系統性能越強。在本次測試中,我們使用了4K和8K這兩種分辨率進行測試,從而對比參測系統在不同負載下的性能差異。
從測試來看,在普通4K分辨率下,可能由于工作負載不是太大,EPYC 9654與EPYC 9554雙路系統平臺并未拉開差距,耗時相同。不過與上一代EPYC 7763雙路系統,以及核心數少得多的EPYC 9374F雙路系統相比,它們還是具備明顯優勢。其中EPYC 7763雙路系統的耗時比EPYC 9654與EPYC 9554雙路系統多了59.5%,EPYC 9374F雙路系統的耗時則比它們多了50%。
而在工作負載更大的8K分辨率下,四個參測系統就都拉開了差距,192核心、384線程的EPYC 9654雙路系統相對于128核心、256線程配置的EPYC 9554雙路系統優勢明顯,后者耗時比前者多了28.6%。而相同核心數、線程數的上一代EPYC 7763雙路系統在測試耗時上又比EPYC 9554多了17.7%。核心數、線程數最少的EPYC 9374F雙路系統墊底。這充分體現出在執行高分辨率光線追蹤應用時,用戶應盡可能選擇采用新架構、新工藝設計,核心線程數盡可能多的雙路處理器系統。
性能測試:Sysbench CPU
Sysbench是一款被廣泛使用的Linux 基準測試,它可以對CPU進行性能測試,在測試中主要是通過CPU進行質數加法運算,質數極限為10000 個。
同樣,這也是一個非常依賴處理器多核心運算性能的測試,EPYC 9654雙路系統處于遙遙領先的地位,每秒可完成823134.4輪運算,比EPYC 9554多了35.8%。而EPYC 9554雙路系統則憑借新架構、更高的工作頻率比核心與線程數相同的上一代EPYC 7763雙路系統多了24.2%。值得一提的是,核心與線程數只有EPYC 7763雙路系統一半的EPYC 9374F雙路系統在該測試中也達到了前者的71.6%,顯然這同樣應該歸功于AMD第四代EPYC 9004系列處理器擁有更強的單核心運算性能,可以有效彌補這類處理器在核心數量上的不足。
性能測試:HPL
HPL的英文全稱為“High-Performance Linpack”,Linpack 是國際上一款用于測試高性能計算機系統浮點性能的基準測試工具。通過對高性能計算機采用高斯消元法求解一元N次稠密線性代數方程組的測試,考量高性能計算機的浮點性能。值得一提的是,該測試支持AVX-512指令集,在支持AVX-512技術的硬件上,可以使用AVX-512指令集運算來完成該測試。
相對于不支持AVX-512指令集,基于Zen 3架構的EPYC 7763雙路系統來說,新一代EPYC處理器獲得了壓倒性的勝利。首先相同核心、線程數的EPYC 9554雙路系統在測試成績上領先了EPYC 7763雙路系統高達64.8%,即便是核心、線程數只有一半的EPYC 9374F雙路系統在該測試中也能達到EPYC 7763雙路系統性能的99.3%。而192核心、384線程的EPYC 9654雙路系統則一騎絕塵,相對于EPYC 7763雙路系統的領先幅度可以達到驚人的101.9%。AMD第四代EPYC 9004系列處理器能有如此大領先的根本原因就在于Zen 4架構支持AVX-512指令集,Zen 3架構不支持。而AVX-512即高級向量擴展512位指令集可以借助寬度達到512bit的數據寄存器,以及大量專用指令,提升處理器在一條指令中處理多個數據點的能力,所以就能在科學模擬、金融分析、人工智能 (AI) /深度學習、圖像和音頻/視頻處理、密碼學和數據壓縮等支持AVX-512指令集的應用中獲得更快的處理能力。
性能測試:DGEMM
DGEMM是我們此次加入的一個新測試,它是一個基于雙精度矩陣乘法例行程序的快速基準測試,可計算以下乘積:C←αAB+βC。其中A、B和C是包含雙精度浮點值的矩陣,而α和β是標量。AMD的開源DGEMM基準使用了AOCL 4.0的AMD BLIS組件,其結果最終會反饋出一個Gflops值,該值將接近于可實現的最大系統吞吐量。同樣這個測試也可以使用AVX-512指令集運算,可以體現處理器在支持AVX-512指令集后的性能優勢。
測試結果與HPL相比,可謂有過之而無不及,即便是64核心、128線程的EPYC 9374F雙路系統也能小勝不支持AVX-512指令集,128核心、256線程配置的EPYC 7763雙路系統。這充分說明,處理器支持AVX-512指令集后,的確能在支持AVX-512指令集的軟件中實現處理器的運算性能翻番,以一打二。對于需要使用AVX-512相關軟件的用戶而言,升級基于Zen 4架構的AMD第四代EPYC 9004系列處理器顯然是非常有必要的,可以大幅提高生產力。其他方面,核心、線程數更多的EPYC 9554,EPYC 9654雙路系統自然有更強大的性能表現,其中EPYC 9654雙路系統的算力突破8000GFLOPS,遠超其他型號。
質的飛躍!提升生產力與工作效率的利器
顯然,憑借新一代Zen 4架構、對AVX-512指令集的支持、更高的工作頻率、更強大的12通道DDR5內存配置,第四代EPYC 9004系列處理器在以上10大測試項目、13個測試小項中都大獲全勝,特別是均為128核心、256線程配置的EPYC 9554雙路系統在13個子項測試中相對于EPYC 7763雙路系統的最大領先幅度達到102%,最小領先幅度也有17.8%。其平均領先幅度高達51.1%,用質的飛躍來形容毫不為過,而這僅僅是在第三代EPYC發布一年后就獲得了如此大的進步,可以證明第四代EPYC 9004系列處理器的確是一款在技術架構設計、性能表現上非常成功的產品。
再來看看強大的性能怪獸EPYC 9654,我們認為在所有測試將其他產品都遠遠甩在身后的192核心、384線程的EPYC 9654雙路系統,在很長一段時間內,都是不計成本,亟需性能的用戶首選之一。因為根據目前的最新信息,第四代至強可擴展處理器也只能提供最多56個核心,且采用的是8通道DDR5內存配置。而在EPYC 9654之下,還有84核心、168線程的EPYC 9634,64核心、128線程的EPYC 9554、9534系列產品,第四代EPYC 9004系列處理器的高端產品在技術規格上相對于對手具有壓倒性的優勢。至于像AMD EPYC 9374F這類核心數相對較少的第四代EPYC產品,它則是需要兼顧單核心性能或預算較少用戶的高性價比優選。
總體來看,就像消費級產品一樣,5nm生產工藝、Zen 4架構、DDR5內存的引入令第四代EPYC 9004系列處理器成為一款技術規格與性能得到大幅提升的產品。要知道由于周邊廠商進度滯后的緣故,目前其支持PCIe 5.0 SSD、CXL內存的能力還尚未發揮出來,本次測試結果不能代表它的最終完全體狀態,在不久的將來,它還能給用戶更多的驚喜。所以可以預見,更具競爭力的AMD第四代EPYC 9004系列處理器將繼續成為超融合基礎設施、云端應用、數據分析、科學計算、HPC、內容創建等專業領域的領先解決方案,為企業用戶提供卓越的性能、可靠的安全特性,并從容應對各種復雜的IT挑戰。
審核編輯 :李倩
-
處理器
+關注
關注
68文章
19761瀏覽量
233018 -
amd
+關注
關注
25文章
5544瀏覽量
135675
原文標題:一起來體驗96核心、192線程CPU的強大威力——第四代AMD EPYC處理器獨家測試
文章出處:【微信號:Microcomputer,微信公眾號:Microcomputer】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
高通推出第四代驍龍8s移動平臺
曝三星已量產第四代4nm芯片
高通躍龍第四代固定無線接入平臺至尊版發布
安勤科技發布HPM-SIEUA服務器主板,搭載AMD第四代Siena處理器
AMD EPYC嵌入式9004和8004系列處理器介紹

評論