在2025 RISC-V中國峰會的高性能計算論壇上,阿里巴巴達摩院高級技術專家賈昊yan分享了玄鐵處理器IP和生態的最新進展。他表示,玄鐵IP持續完善在多個主流市場的產品矩陣,不斷演進,覆蓋高性能和AI加速場景的C系列,安全和實時性方面的R系列,賦能端測的E系列,以及搭建多核系統方案的玄鐵系列,還有DIC技術等等。
高性能CPU IP玄鐵C930
玄鐵下一代旗艦處理器C930采用15級亂序超標量流水線設計,支持CHI協議,具備多核多cluster可擴展能力,擁有6譯碼寬度和10+發射寬度,性能表現卓越。據測試,C930的SPECint 2006高達15分/GHz以上,達到服務器級別應用水準,可滿足PC、邊緣服務器及自動駕駛等高性能計算場景的嚴苛需求。
C930搭載了512 bits RVV1.0矢量擴展與8 TOPS Matrix雙引擎,將通用高性能算力與AI算力原生融合,并開放DSA(Domain-Specific Architecture)擴展接口,支持更多定制化功能,為AI與高性能計算提供了更強大的底層支撐。
賈昊yan介紹,C930架構包括指令取指子系統、譯碼與亂序發射子系統、執行子系統,以及多集訪存子系統,其中向量執行包括加解密,同時協處理器拓展部分具有較高的可配置性。在RVA23 Profile的基礎上加入了玄鐵自定義的拓展,協處理器的拓展,并且高效支持了RV官方在高性能方面的規范。
在目前的典型工作場景下C930處理器性能可以達到3.4GHz以上,賈昊表示,當玄鐵邁過3GHz大關,才算邁入高性能處理器的大門。而RISC-V處理器在趕超X86和ARM方面,C930既支持RV定義的拓展,同時在玄鐵自定義上實現了8T配置能力,可謂是戰力充沛,并且支持靈活的算力配比,并以解耦實現方式供用戶在能效比還是性能優先之間進行自主選擇,這樣C930可以實現在GEMM算力利用率上相比友商達到2-3倍的性能提升。
玄鐵XL-300
玄鐵XL-300支持彈性可配置架構,最多可支持8處理器的核心,支持大小核的搭配配置,L3開始最大可支持到23兆,還有豐富的對外接口的支持。XL-300還對特定的場景進行性能優化,支持容量分配、帶寬分配,同ID上的DPC獨顯也會進行另行的加速設計。XL-300在團隊不斷優化下,相比XL-200,頻率提升20%,帶寬翻倍,同時我們的面積增加5%。大大控制了硬件成本,也會實現很高的設計質量。
玄鐵在系統方面的重要補充IO MMU,采用分布式高并發的IO TLB設計,它支持靈活集成,采用獨立CU設計,適配多種接口,包括TCIE,集成了IO MPT,也支持虛擬化。面向加速器場景,我們支持GIPC,也支持設備QS的管控。總之玄鐵分布式的IO MMU是一款面向服務器領域的功能完備高性能的IO MMU,實現了全棧軟件生態的支持。
另外,在支持社區定義的多項RISC和安全規范的基礎上,對服務器場景還進行了更加充分的可靠性支持。
玄鐵DSA及可拓展接口
通過玄鐵協處理器拓展接口,可以實現靈活應用的協處理的拓展支持。通過玄鐵預定義的一些自定義指令集拓展,以及譯碼接口,可以幫助客戶快速高效的參照使用運力,實現對自己特定應用場景的加速。通過玄鐵自定義的協處理接口標準,可以實現高速的C930和協處理器之間的數據信息傳遞。這樣可以高效定制指令和工具鏈,客戶只需要根據指令規范,依據實際的需求進行定義、編寫、拓展、描述文件。依據流程自動生成工具鏈,可以完成對玄鐵處理器的適配,這樣可以大大節省開發的周期和成本。
發布評論請先 登錄
知合計算:RISC-V架構創新,阿基米德系列劍指高性能計算
Condor使用Cadence托管云服務開發高性能RISC-V微處理器
速顯微電子亮相2025玄鐵RISC-V生態大會
AI時代,RISC-V是最佳選擇?
玄鐵C930旗艦處理器3月起交付:性能達服務器級,搭載Matrix AI引擎

評論