電子發燒友網報道(文/黃晶晶)在數據中心市場,DDR5和CXL內存正在成為廣泛采用的主流趨勢。預計2024年到2029年CXL內存的采用將達到212%的年復合增長率。如今,現有出貨的半數服務器已經支持CXL,預計未來幾年越來越多的服務器將實現對CXL的支持。
基于這一趨勢,AMD宣布推出第二代AMD Versal Premium 系列,這款自適應SoC平臺旨在面向各種工作負載提供最高水平系統加速。第二代 Versal Premium 系列將成為FPGA 行業首款在硬IP中采用 CXL3.1與 PCIe Gen6 并支持LPDDR5的器件。CXL 3.1 和 LPDDR5X 能助力更快速地釋放更多內存,以滿足數據中心、通信以及測試測量市場中數據密集型應用日益增長的實時處理和存儲需求。
近日,AMD自適應與嵌入式計算事業部( AECG ) Versal產品營銷總監Manuel Uhm,和高級產品線經理Mike Rather與媒體交流,分享了第二代AMD Versal Premium系列自適應SoC的特點細節和應用趨勢等等。
創新設計
第二代AMD Versal Premium系列產品,基于第一代產品進行了復用設計,但針對I/O、收發器以及存儲/內存的控制器、主機接口都做了創新。
AMD高管分析,DSP的計算密度方面,實現了更高的每平方毫米的DSP算力。另外引入了一個新的收發器GTM2,GTM2能夠支持的數據速率從1.25 Gb/s到128 Gb/s,同時還支持NRZ和PAM4編碼。保留了非常熟悉的設計流程,開發者可以使用GTM2,同時還確保全過程的可靠性。在I/O方面,增加對于高速MIPI C-PHY和D-PHY接口的支持。第二代新加入的LDPC解碼器的模塊適用于高通量的解碼。
加速主機連接
第二代 Versal Premium 器件支持業界最快的主機接口CXL 3.1和PCIe Gen6,可實現行業領先的高帶寬主機CPU到加速器連接。
AMD高管表示,與主機連接使用的PCIe Gen 6和CXL 3.1都是64Gb/s的速率。與支持 PCIe Gen4或Gen5的FPGA 相比,PCIe Gen6 能提供2至4倍的線速率,而運行 PCIe Gen6 的 CXL 3.1 在類似時延下則能提供使用CXL 2.1 器件的雙倍帶寬,以及增強的架構和一致性功能。
在Versal Premium自適應SoC和AMD EPYC CPU之間能夠形成非常好的協同。PCIe Express能夠提供Versal Premium和CPU之間非常高性能的連接,這可以用于卸載計算、網絡以及存儲工作負載。也能擁有非常連貫的接口,這樣Versal Premium和EPYC處理器就能夠共享內存空間,從而減少擱置內存。再加上PCIe IDE以及內存DRAM的加密,數據能夠做到端到端的安全性。
釋放更多內存
第二代 AMD Versal Premium 系列自適應SoC能以至高8533 Mb/s的最快速LPDDR5存儲器連接加速存儲器帶寬,帶來更快速的數據傳輸和實時響應。與采用 LPDDR4/5 存儲器的同類器件相比,這種超快的增強型DDR存儲器可將主機連接速度提升至高2.7倍。
第二代產品在DDR5和LPDDR5上支持的數據速率,是第一代產品支持的DDR4和LPDDR4的2倍。而且DDR5和LPDDR5相比DDR4和LPDDR4,消耗的功率有20%到30%的下降。
AMD高管表示,第一代Versal Premium系列產品關注的是在高安全性、高通量和帶寬的情況下加速網絡。第二代AMD Versal Premium除了像第一代那樣加速400G或者800G的網絡之外,增加了支持CXL內存的分享和池化,因為我們發現在數據中心需要越來越多的內存來支持大語言模型。
也可以說,第二代AMD Versal Premium助力計算,是通過更好地管理系統的內存,這正是現在人工智能模型以及各種數據集成最需要的。
支持CXL 3.1存儲器擴展模塊方面,專門針對CXL 3.1規范設計的存儲接口,可以和各家供應商的DRAM實現兼容。至高 256x8.533 Gb/s 的 LPDDR5X存儲器帶寬,至高 16x 64 Gb/s 的 PCle Gen6 帶寬,使得總外部存儲器帶寬超過500 GB/S。
增強數據安全
在不斷變化的安全形勢下,增強數據安全性正變得日益重要。增強的安全功能有助于第二代 Versal Premium 系列在傳輸和靜態狀態下均可快速、安全地傳輸數據。其是業界首款在硬 IP 中提供集成 PCIe完整性和數據加密( IDE )支持的 FPGA 器件。硬核 DDR 內存控制器內置的內聯加密可助力保護靜態數據,而 400G 高速加密引擎則能幫助器件以至高 2 倍的線速率保護用戶數據,從而實現更快速的安全數據事務。有了PCIe IDE加上高速加密引擎、DDR內聯加密與ECC,數據無論是在傳輸中、靜態中、還是使用中都非常的安全。
應用
在給出的應用案例中,第二代產品能夠擴大數據中心的CXL應用范圍,CXL 3.1采用PCIe Gen 6協議,可以利用NUMA輕松與現有的軟件集成。
操作模式方面,能夠支持CXL.io、CXL.mem、CXL.cache。器件模式方面,第二代 Versal Premium 可以作為內存的控制器,也可以使用主機模式,連接CXL擴展模塊。在用例方面,支持多主機單邏輯設備(MH-SLD)架構和系統可組合性。
自適應網絡用于GPU集群和橫向擴展方面,很多客戶都會購買并部署GPU集群,而標準的網絡接口卻未必能夠支持在這樣情境下GPU的性能和靈活性。而第二代AMD Versal Premium能夠提供很高的帶寬和靈活性,實現這方面的應用需求。“這個應用我們在Virtex UltraScale+ 和第一代Versal Premium也都支持過,但是現在第二代AMD Versal Premium系列能夠在單個網絡適配器上支持2個400G接口。”AMD高管說道。
在測試與測量領域,開發PCIe Gen 7器件時測試儀器需求128 Gb/s的收發器,這些應用非常重視芯片上的DSP引擎以及內存帶寬和其他的接口能力。另外第二代AMD Versal Premium系列支持測試設備需要的C-PHY和D-PHY等協議。
工具和量產時間
AMD也在不斷地改善Vivado的開發環境,通過采用新的P&R算法,并且改善多線程的性能,增強的增量流,從而減少編譯時間。引入了用于頂層設計的RTL流程,以及用于GTM2的RTL流程等。改善QoR與易用性,通過工具引導的時序收斂,改進的DFX流程,以及分段配置以便加快CPU啟動時間和PCIe的喚醒。
第二代AMD Versal Premium系列產品表顯示有4種產品。從140萬邏輯單元到330萬邏輯單元不等,從3300到7600的DSP引擎不等,GTM2收發器從32個到72個不等,片上內存、100G/600G以太網MAC、400G高速加密引擎、LDPC解碼器等也各有不同。
第二代AMD Versal Premium系列已經向開發者提供早期文檔,AMD將于2024年第四季度提供功率估算工具,2025年下半年提供全套的AMD Vivado工具。2026年上半年將提供芯片的樣片以及開發套件,2026年中實現芯片量產。
-
AI
+關注
關注
88文章
34421瀏覽量
275741
發布評論請先 登錄
AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統實現單芯片智能
面向AI與機器學習應用的開發平臺 AMD/Xilinx Versal? AI Edge VEK280

AMD Versal自適應SoC器件Advanced Flow概覽(下)

AMD Versal自適應SoC器件Advanced Flow概覽(上)

第二代AMD Versal Premium系列器件的主要應用
借助第二代 AMD VERSAL 實現先進醫療成像
AMD推出了Versal Premium Series Gen 2,這是業界第一個支持CXL 3.1和PCIe Gen6的FPGA平臺。

AMD推出第二代Versal Premium系列
AMD Versal自適應SoC CPM5 QDMA的Tandem PCIe啟動流程介紹

第二代AMD Versal Prime系列自適應SoC的亮點

評論