隨著AI等新一代數字技術的蓬勃發展,高性能計算(HPC)正逐漸從高精尖科研領域走向更多行業,企業側的應用場景日益豐富。據Hyperion Research預測,云端HPC市場的增長速度將是本地服務器市場的兩倍多,預計到2027年,其市場規模將超過140億美元。
在這一背景下,阿里云智能集團副總裁吳結生表示,當前高性能計算的負載正呈現出多樣化發展趨勢,已廣泛應用于基礎模型預訓練、自動駕駛、生命科學、工業制造和半導體芯片等多個行業和領域。然而,傳統HPC因其高昂的成本和復雜的運維難度,使得許多企業望而卻步。
為了破解這一難題,阿里云推出了Cloud HPC解決方案,以云計算的模式讓高性能計算更加便捷地應用于更多企業。Cloud HPC具備四個顯著優勢:彈性分配資源、異構計算兼容性強、快速部署能力以及平臺化的數據處理生態。
以汽車研發為例,Cloud HPC通過彈性高性能計算集群和并行文件存儲系統,免除了數據的頻繁挪動,提升了整個系統的能力,從而加快了產品研發進程。云上的高性能計算還能借助整個云平臺,將計算、存儲、網絡和安全等方面的能力疊加起來,形成綜合優勢。
面對算力需求的多樣性,阿里云通過多樣化的產品、系統架構和技術方案,滿足不同負載對計算能力、存儲性能和網絡帶寬等方面的差異化需求。在松耦合場景下,阿里云借助自身積累的云資源規模和創新的CIPU(云基礎設施處理器)架構,提供E-HPC Instant服務,滿足用戶對高性價比和彈性算力的需求。在緊耦合場景下,阿里云推出了E-HPC平臺,同時管理HPC的Slurm集群和AI的ACK(K8s)集群,滿足企業對于高性能計算的需求。
特別是在AI時代,大模型的訓練場景對高性能計算提出了更高的要求。阿里云靈駿集群采用HPN 7.0的網絡架構,通過一系列創新支持更大的規模、更優的效率和更高的穩定性。同時,阿里云還提供了高性能的并行文件系統CPFS,滿足訓練和推理的超高性能和成本優化要求。
CIPU架構作為阿里云基礎設施的基石,是實現0虛擬化開銷、提升IO和存儲性能的關鍵。阿里云已經推出了2.0版本的CIPU架構,整機穩定性提升20%,帶寬性能可達400Gbps,VPC可達6000萬pps,彈性RDMA可達5000萬message/s,存儲性能可達360萬IOPS,50GB/s,這些性能均達到業內領先水平。
展望未來,每一家公司都將成為數據+AI的公司,云計算將繼續踐行Scaling Law,高性能計算也將煥發新的動能。阿里云等云計算廠商將不斷創新,提供多元化的產品組合,幫助企業在不同負載場景中落地應用,實現智能化創新。
-
云計算
+關注
關注
39文章
7973瀏覽量
139603 -
AI
+關注
關注
88文章
34691瀏覽量
276700 -
HPC
+關注
關注
0文章
333瀏覽量
24259 -
阿里云
+關注
關注
3文章
1007瀏覽量
43986
發布評論請先 登錄
康佳特推出高性能COM-HPC模塊conga-HPC/cBLS
康佳特發布高性能COM-HPC模塊
阿里云ECS g9i全球邀測啟動
云計算HPC軟件關鍵技術
南京國高電氣備自投 —— 技術創新引領電力切換新時代
AI云服務器:開啟智能計算新時代
帶你了解什么是高性能計算(HPC)

評論