Arm 近日公開了Arm? Neoverse V1 和 N2 平臺的產品細節,兩者滿足了基礎設施應用的各種需求。這兩個平臺的設計旨在解決當前正在運行的各種工作負載和應用問題,與上一代N1相比,并分別帶來 50%和 40%的性能提升。此外,Arm也同時發布了CMN-700,作為構建基于Neoverse V1和 N2 平臺高性能SoC的關鍵部件。
Neoverse V1:最寬微架構+SVE矢量運算

Neoverse V1平臺 / Arm
與上一代N1相比,Neoverse V1帶來了50%的性能提升和1.8倍的矢量工作負載優化、以及4倍的機器學習工作負載優化。得益于Arm迄今為止最寬的微架構以及SVE功能,Neoverse V1可以容納更多運行中的指令,延長了代碼存活期,也為芯片設計人員提供了靈活性。Arm 現有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于 NEON,SVE可將處理速度提高近3.5倍。

已經用到Neoverse V1的HPC項目 / Arm
目前法國芯片公司SiPearl、印度信息技術部(MEITY)韓國電子通信研究所(ETRI)都在各自的HPC項目中用到了Neoverse V1。
Neoverse N2:首個Armv9+SVE2平臺

Neoverse N2提高云端到邊緣性能效率 / Arm
Arm在幾周前發布了Armv9架構,以滿足全球對無所不在的專用處理能力的需求,而新公布的Neoverse N2平臺正是第一個基于Armv9架構的平臺。

SVE2 / Arm
相比于N1,Neoverse N2在保持相同水平的功率和面積效率的基礎上,單線程性能提升了40%。不僅如此,Neoverse N2也是第一個具備SVE2功能的平臺,作為SVE和Neon的超集,SVE2為云端到邊緣的性能效率帶來了巨大提升。SVE主要用于加速HPC,而SVE2可廣泛運用于機器學習、數字信號處理和5G等應用場景,同時兼具SVE的編程簡易性和可移植性等優勢。
CMN-700:下一代總線賦能異構SoC

Neoverse CMN-700 / Arm
作為上一代CMN-600的升級,CMN-700支持的最大核心數可達512顆。通過對CCIX 2.0和CXL 2.0的支持,也為客戶提供了更多的定制和擴展選項,為緊密耦合的異構計算提供了更大的靈活性。
異構計算的趨勢
隨著異構計算的逐步發展,我們已經看到了很多CPU和GPU搭配的趨勢,比如英偉達近期公布的基于Arm Neoverse的Grace芯片,就是一個用于AI超算的CPU。英偉達在互聯技術上采用的是自研的NVLink技術,而非PCIE。Arm基礎設施事業部高級副總裁兼總經理 Chris Bergey提到,與多樣化的加速器功能進行互聯,比如AI加速器,這對未來的市場時相當關鍵的。比如CMN-700已經支持了CXL和CCIX這樣的互聯標準,未來Arm期待給市場帶來更多的靈活性,并支持更多像Grace這樣的系統。
這樣的異構趨勢也囊括了FPGA,Arm基礎設施事業部全球高級總監鄒挺補充道,現在已經有合作伙伴將Neoverse N2和FPGA加速卡放在異構計算系統中使用。有的Arm合作伙伴還將FPGA加速器和N2放在一個芯片上做成SoC,通過Chiplet的技術來實現異構計算的靈活性。
公有云的廣泛應用

騰訊云加碼Arm生態 / Arm 騰訊云
Neoverse的廣泛應用在公有云廠商中尤為明顯,比如AWS、阿里云和騰訊云等。騰訊專項測試技術中心總監黃聞欣提到騰訊去年和Arm正式簽署了一份合作協議,希望通過合作加速Arm Neoverse技術的測評和適配。通過TencentBench測試框架發現,得益于更多可擴展的CPU核心數,Arm服務器比傳統的服務器性能表現更強勁,尤其是在AI推理和圖片處理領域。
Neoverse V1:最寬微架構+SVE矢量運算

Neoverse V1平臺 / Arm
與上一代N1相比,Neoverse V1帶來了50%的性能提升和1.8倍的矢量工作負載優化、以及4倍的機器學習工作負載優化。得益于Arm迄今為止最寬的微架構以及SVE功能,Neoverse V1可以容納更多運行中的指令,延長了代碼存活期,也為芯片設計人員提供了靈活性。Arm 現有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于 NEON,SVE可將處理速度提高近3.5倍。

已經用到Neoverse V1的HPC項目 / Arm
目前法國芯片公司SiPearl、印度信息技術部(MEITY)韓國電子通信研究所(ETRI)都在各自的HPC項目中用到了Neoverse V1。
Neoverse N2:首個Armv9+SVE2平臺

Neoverse N2提高云端到邊緣性能效率 / Arm
Arm在幾周前發布了Armv9架構,以滿足全球對無所不在的專用處理能力的需求,而新公布的Neoverse N2平臺正是第一個基于Armv9架構的平臺。

SVE2 / Arm
CMN-700:下一代總線賦能異構SoC

Neoverse CMN-700 / Arm
作為上一代CMN-600的升級,CMN-700支持的最大核心數可達512顆。通過對CCIX 2.0和CXL 2.0的支持,也為客戶提供了更多的定制和擴展選項,為緊密耦合的異構計算提供了更大的靈活性。
異構計算的趨勢
隨著異構計算的逐步發展,我們已經看到了很多CPU和GPU搭配的趨勢,比如英偉達近期公布的基于Arm Neoverse的Grace芯片,就是一個用于AI超算的CPU。英偉達在互聯技術上采用的是自研的NVLink技術,而非PCIE。Arm基礎設施事業部高級副總裁兼總經理 Chris Bergey提到,與多樣化的加速器功能進行互聯,比如AI加速器,這對未來的市場時相當關鍵的。比如CMN-700已經支持了CXL和CCIX這樣的互聯標準,未來Arm期待給市場帶來更多的靈活性,并支持更多像Grace這樣的系統。
這樣的異構趨勢也囊括了FPGA,Arm基礎設施事業部全球高級總監鄒挺補充道,現在已經有合作伙伴將Neoverse N2和FPGA加速卡放在異構計算系統中使用。有的Arm合作伙伴還將FPGA加速器和N2放在一個芯片上做成SoC,通過Chiplet的技術來實現異構計算的靈活性。
公有云的廣泛應用

騰訊云加碼Arm生態 / Arm 騰訊云
Neoverse的廣泛應用在公有云廠商中尤為明顯,比如AWS、阿里云和騰訊云等。騰訊專項測試技術中心總監黃聞欣提到騰訊去年和Arm正式簽署了一份合作協議,希望通過合作加速Arm Neoverse技術的測評和適配。通過TencentBench測試框架發現,得益于更多可擴展的CPU核心數,Arm服務器比傳統的服務器性能表現更強勁,尤其是在AI推理和圖片處理領域。
阿里巴巴首席工程師周經森(Kingsum Chow)談道:Arm的CPU資源的話,在我們現有的軟件里會有兩個考慮的點,一個是我們有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要我們把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在這方面,一年之前,我們就跟Arm的員工一起合作,把JVM的性能提高。過去一年里,我們從JDK8到JDK11,通過OpenJDK, 通過阿里巴巴 Dragonwell(OpenJDK的一個發行版),就把我們現有一些Java應用的一些性能提高了50%。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
ARM
+關注
關注
134文章
9328瀏覽量
375661 -
HPC
+關注
關注
0文章
333瀏覽量
24239 -
高性能計算
+關注
關注
0文章
89瀏覽量
13623 -
Neoverse
+關注
關注
0文章
12瀏覽量
4762
發布評論請先 登錄
相關推薦
熱點推薦
AMD實現首個基于臺積電N2制程的硅片里程碑
代號為“Venice”的新一代AMD EPYC CPU是首款基于臺積電新一代N2制程的高性能計算產品。 ? AMD表示,其代號為“Venice”的新一代AMD EPYC?處理器是業界首款完成流片并

解讀基于Arm Neoverse V2平臺的Google Axion處理器
云計算需求在人工智能 (AI) 時代的爆發式增長,推動了開發者尋求性能優化且高能效的解決方案,以降低總體擁有成本 (TCO)。Arm 致力于通過 Arm
如何在基于Arm Neoverse平臺的CPU上構建分布式Kubernetes集群
在本文中,我們將以 X(原 Twitter)為例,演示如何在基于 Arm Neoverse 平臺的 CPU 上構建分布式 Kubernetes 集群,以根據推文實時監控情緒變化。如此一來,你可以充分利用

Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
RZ/V2N——近期在嵌入式世界2025上新發布,為 AI 計算、嵌入式系統及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發者和企業用戶對高性
發表于 03-19 17:54
Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
2025年3月19日——Banana Pi 今日正式發布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發布的最新的高性能處理器RZ/V2N

采用雙核Arm Cortex-A57 CPU的超高性能微處理器RZ/G2N數據手冊
RZ/G2N憑借雙核 Arm? Cortex?-A57(1.5GHz)處理器,具備更高規格的處理性能,同時擁有 3D 圖形處理能力以及 4K 視頻編碼/ 解碼功能。作為該產品的軟件平臺

英特爾18A與臺積電N2工藝各有千秋
TechInsights與SemiWiki近日聯合發布了對英特爾Intel 18A(1.8nm級別)和臺積電N2(2nm級別)工藝的深度分析。結果顯示,兩者在關鍵性能指標上各有優勢。
瑞薩電子RZ MPU家族精品RZ/N2L產品介紹
瑞薩生態合作伙伴RT-Thread推出了一款高性能、多功能以太網MPU開發板EtherKit,搭載瑞薩電子RZ/N2L,并攜手瑞薩電子舉辦了產品發布會和產品研討。瑞薩電子在本次活動中介紹了瑞薩明星

Arm Neoverse如何加速實現AI數據中心
在快速演進的云計算和人工智能 (AI) 時代,企業需要能助力其優化性能、降低成本并在市場競爭中保持領先的方法。Arm Neoverse 已成為眾多前沿企業的選擇,他們希望在推動創新的同
基于Arm Neoverse的微軟全新Azure虛擬機上線
Neoverse CSS N2 所構建。這是我們與微軟長期合作中的一個重要里程碑,通過提供強大的平臺,為各種工作負載帶來出色的性能、可擴展性和繁榮的軟件生態系統。
OFFSET N1和N2這兩個引腳不是都是兩個輸入性質的引腳嗎?為什么會有固定的-12V輸出呢?
N2)發現,均存在一個-12V的電源電壓。
請問,OFFSET N1和N2這兩個引腳不是都是兩
發表于 09-10 07:58
芯品# 高性能計算芯片
(LSE:AWE)是全球技術基礎設施高速連接和計算芯片的全球領導者,與Arm合作開發基于Arm ? Neoverse?計算子系統(CSS)的
評論