當前,AI大模型的迅猛發展帶來了大量的智算需求。然而,大模型的復雜架構與海量參數對算力要求極高,在實際應用場景中,即便組建超大規模智算集群,如何優化算力使用和提升集群計算效率,依然是一項極具挑戰性的任務;其次,大模型部署的組件兼容性差、協同工作難度大,在不同環境下遷移與優化的門檻很高;另外,大模型與各行各業的結合日益成熟,大模型在微調和推理部署任務需求日益增加。為解決以上問題,玄武智算云平臺應運而生。該平臺依托昇騰系列硬件,適配多種主流大模型,實現了大模型的微調、推理、優化部署等任務的端到端落地,極大提升集群的AI支持能力;同時,玄武平臺具備強大的算力加速和算力池化能力,可精準調配資源,實現高效的算力集群管理,完美攻克算力“用不了,不好用”的難題,為智能計算保駕護航。
01平臺概述
玄武智算云平臺是基于昇騰原生打造的智算平臺,它支持昇騰全系列硬件的納管、調度和AI模型支持,可實現高效、精細的算力集群運營管理,旨在打破模型部署困境,解決集群利用率低、硬件適配性差、運營效率低等核心痛點問題,為用戶提供高效、經濟、便捷的智能計算服務。
02核心功能
適配、加速、算力池化
在適配方面,平臺能夠針對不同架構類型的計算模型實現高精度匹配,這為后續推理、訓練框架優化加速功能的有效發揮,提供了堅實的前提條件。在加速方面,平臺的推理、訓練框架優化功能協同發力,能夠大幅縮短推理決策時長,快速輸出精準結果,顯著加快模型迭代,全方位提升工作效率。在算力池化方面,平臺依托統一通信、精細任務切分與多級混合策略,遇復雜任務時能有條不紊地調配資源,實現多任務并行高效推進,保障用戶的使用體驗。
算力集群管理
在對算力集群的管理方面,玄武智算云平臺具備高度專業性與系統性。
首先,在硬件納管與監測方面,平臺硬件納管功能能夠精準把控硬件,確保集群運行有條不紊。硬件監測功能能夠緊盯硬件狀態,精準、實時探測潛在隱患,為保障平臺能夠平穩、順暢的運轉,筑牢堅實的根基;
其次,在資源調配方面,平臺能夠深入剖析任務特性的差異,以科學、精細的方式分配算力,避免出現算力冗余閑置的狀況,確保算力資源得到最優化的配置;
最后,在資源提效方面,平臺采網絡虛擬化、存儲虛擬化等協同技術,匯聚算力,優化傳輸與存儲,降低成本,為平臺性能提供支撐,確保用戶可享受到穩定、高效、可靠的服務。
運營管理
計費模式創新實用。平臺采用token式計費與按量計費相結合的模式,為用戶開辟靈活自主的資源成本管控路徑,用戶可依業務需求選計費模式,確保資源投入契合業務發展節奏,避免浪費。
安全防護堅實可靠。平臺的服務鑒權功能能夠全方位監測和攔截未經授權的訪問及操作企圖,精準識別并拒外部惡意入侵和內部違規操作于門外,保障信息安全與用戶隱私。
運營流程優化升級。平臺的SLO管理與產品管理模塊緊密協同,以及精細化管理產品全生命周期,優化運營環節,確保服務質量與產品功能迭代。
數據回溯助力運維。平臺服務的日志功能可以完整記錄用戶操作軌跡,為用戶回溯操作記錄提供便利,也為運維團隊排查故障、分析數據提供支撐,助力平臺自我優化升級。
03優勢亮點
支持海量主流模型適配
玄武智算云平臺能夠支持海量廣泛、不同規模范圍的大模型。它支持Deepseek、Baichuan、Llama、Qwen、ChatGLM等多種模型,能夠滿足不同行業對各種模型的需求,并確保模型在平臺上高效運行。
支持混合推理
玄武智算云平臺具備卓越的靈活性,能夠支持多種型號的昇騰硬件,實現統一推理任務的高效處理。此外,平臺具備多級分布式算力組合功能,結合模型任務的自適應切分,使得各類算力資源都得以高效整合與利用。這種智能化的算力調配不僅提升了推理的精準度和效率,還確保了平臺能夠靈活應對多樣化的業務需求,為用戶提供了強大的技術支持。
支持大模型訓練微調、推理部署一站式服務
玄武智算云平臺的核心優勢在體現在對大模型訓練微調和推理部署的全面支持。在訓練微調方面,平臺支持的微調方法涵蓋了業界領先的SFT技術,能夠為用戶提供靈活多樣的模型優化選項,確保模型能夠精確適應特定任務需求。在推理部署方面,平臺支持文本生成、對話系統和文本分類等多樣化的推理任務。致力于提供高效穩定的推理服務,確保用戶在處理大規模語言模型時,能夠獲得快速響應和高性能輸出。
支持即時部署,立享澎湃算力
玄武智算云平臺通過用戶友好的操作界面和簡易的流程設計,為用戶帶來了前所未有的便捷體驗。用戶無需進行繁瑣的配置和調試,即可迅速接入并使用平臺提供的算力資源。這種設計不僅節省了用戶的寶貴時間,也降低了使用高性能計算資源的技術門檻。
支持昇騰生態,聯合實現共贏
玄武智算云平臺通過對Atlas 300I Pro、Atlas 300I Duo、Atlas 900 PoD、Atlas 800T A2等昇騰全系列硬件的高效整合,能夠根據不同任務需求精準調配硬件資源,大幅提升計算效能。在此基礎上,玄武智算云平臺與昇騰硬件的結合,能夠帶來以下顯著的業務優勢:
全面覆蓋需求:平臺能夠精準滿足90%以上的RAG需求,提供全面的模型服務和算力調度,并確保模型運行的高效率和穩定性。
性能提升:平臺接入了適配昇騰系列硬件的MLGuider-Ascend大模型訓練和推理引擎,支持多種AI加速技術,顯著提高處理效率,能夠輕松應對海量并發請求。
算子優化:平臺基于昇騰常用算子進行了優化,在Atlas 900 PoD集群上能夠釋放出卓越的性能,使計算過程更加高效和迅速。
自主創新:“昇騰+玄武智算云”聯合方案實現了軟硬件的自主創新,能夠實現技術主權和保障數據安全,并以其高性價比的解決方案,為各行業的數字化轉型提供堅實的支持,推動了數智化的發展。
展望未來,昇騰與清昴的合作將邁向新的發展高度。雙方將進一步整合資源,攜手攻克技術難題,將先進的智能計算技術應用于更多行業領域,努力為客戶創造更大的價值,為推動數智化發展做出更大的貢獻!
-
華為
+關注
關注
216文章
34576瀏覽量
253377 -
AI
+關注
關注
87文章
31982瀏覽量
270799 -
云平臺
+關注
關注
1文章
1338瀏覽量
39231
原文標題:昇騰原生丨玄武智算云平臺正式發布,領航智能計算新時代
文章出處:【微信號:HWS_yunfuwu,微信公眾號:華為數字中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
安科瑞蓄電池在線監控系統為鐵塔基站的穩定運行保駕護航

無人機電力巡檢系統為電網安全保駕護航
無人機光伏巡檢系統為光伏發電保駕護航
低溫自動加熱型激光雪深傳感器:為交通出行保駕護航
工業專用直流濾波器:為工業生產保駕護航
無人機智能巡檢系統為光伏電站保駕護航

瑞隆源產品符合性檢驗中心PCIC--為浪涌產品質量保駕護航

防爆智能手機如何助力電氣行業保駕護航?

小米SU7重磅發布,NGI為夢想之車保駕護航

評論