北京2024年9月27日/美通社/ -- 9月25日,MLCommons協會發布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現出眾,在3D-UNet和CosmoFlow兩個模型共計八項測試中,斬獲五項冠軍。
MLPerf? Storage v1.0 AI存儲基準測試成績
MLPerf?是影響力最廣的國際AI性能基準評測,由圖靈獎得主大衛?帕特森(David Patterson)聯合頂尖學術機構發起成立。2023年推出MLPerf? 存儲基準性能測試,旨在以架構中立、具有代表性和可重復的方式衡量機器學習(ML)工作負載的存儲系統性能。該測試通過準確建模ML工作負載所產生的I/O模式來幫助解決存算平衡問題,為不同存儲系統和不同加速器類型的混合和匹配提供了靈活性,為ML/AI模型開發者選擇存儲解決方案提供權威的參考依據。
本次MLPerf? 存儲基準評測(v1.0)吸引了全球13家領先存儲廠商和研究機構參與。該評測圍繞醫學影像分割、圖像分類、宇宙學參數預測三大AI存儲應用場景,采用主流的3D-Unet、ResNet50、CosmoFlow三類模型,在GPU利用率高達90%或70%的條件下,以帶寬和支持的模擬 GPU (模擬加速器)數量為關鍵性能指標,評估單客戶端或集群模式下存儲系統的性能表現。
本次測試,浪潮信息采用3臺AS13000G7搭建分布式存儲集群,搭載ICFS自研分布式文件系統,在3D-UNet和CosmoFlow兩大評測任務中共獲得五項最佳成績。其中,在圖像分割3D-UNet多客戶端2評測任務中,服務于10個客戶端264個加速器,集群聚合帶寬達到360GB/s,單個存儲節點的帶寬高達120GB/s;在宇宙學分析CosmoFlow單客戶端2和多客戶端2評測任務中,分別提供了18 GB/s和52 GB/s的帶寬最佳成績。
近年來,浪潮信息基于存算協同的理念,持續加大存儲研發投入,從整體架構到各技術棧持續創新,優化升級存力,提升了GPU算力整體性能表現,實現了模型訓練數據處理的即時性,消除了GPU資源閑置(即"饑餓GPU"現象),全面提升大模型訓練效率。
架構層面,采用全新數控分離架構。數據面和控制面完全解耦,控制面實現數據管理和訪問,數據面讀寫操作直通到盤,達到120 GB/s的單存儲節點的超高性能,單存儲節點支撐5臺8卡計算節點規模,同時計算集群GPU利用率90%以上;
軟件層面,通過多路并發透傳技術,有效減少I/O操作中頻繁的上下文切換,降低單次I/O時延50%,同時達到高并發下時延穩定性。本次測試中1430個高并發讀線程支撐下,保證每個線程單次I/O的時延均在0.005秒,AI端到端訓練中I/O占比低于10%。此外,通過元數據VRANK技術,達到單個元數據進程多單元并發處理,提供高性能元數據服務;
軟硬協同層面,通過內核親和力調度,I/O請求動態調整,增強文件系統與計算節點親和性,確保負載均衡,將數據移動與多核CPU之間的訪問效率提升400%。
浪潮信息是全球領先的存儲供應商,存儲裝機容量連續3年穩居全球前三、中國第一,是承載中國用戶數據最多、數據存力貢獻最大的存儲廠商。近年來,浪潮信息積極擁抱AI生態,專注于構建面向人工智能的存儲平臺,通過精準優化存算資源配置與持續強化技術創新,全面推進AI產業化和產業AI化進程,力爭打造AI存儲的理想之選。
審核編輯 黃宇
-
存儲
+關注
關注
13文章
4533瀏覽量
87466 -
浪潮
+關注
關注
1文章
475瀏覽量
24699 -
AI
+關注
關注
88文章
35164瀏覽量
280006
發布評論請先 登錄
飛利信與浪潮信息達成戰略合作
1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現卓越
華為榮獲GTI Awards 2025五項大獎
浪潮信息存儲SATA SSD:技術創新引領數據存儲新時代
浪潮信息存儲SATA SSD:以技術創新,開啟數據存儲新篇章
浪潮信息存儲中標運營商備份一體機項目
浪潮信息剖析智能時代數據存儲領域面臨的挑戰與機遇
MLCommons推出AI基準測試0.5版
浪潮信息分布式存儲平臺AS13000G7的優越性能

浪潮信息:元腦企智EPAI助力金融大模型快速落地

33家元腦區域伙伴與浪潮信息簽署戰略合作協議
谷歌針對Android和iOS版Chrome發布五項更新
長擎安全操作系統24與浪潮信息HF/AS存儲系列成功兼容
澎湃認證:浪潮信息集中式存儲攜手長擎安全操作系統24完成兼容性認證

評論