華為技術(shù)有限公司宣布旗下 ModelEngine AI 平臺(tái)全面支持 DeepSeek 大模型 R1&V3 和蒸餾系列模型的本地部署與優(yōu)化,在 AI 領(lǐng)域引發(fā)廣泛關(guān)注。
華為 ModelEngine 是大模型訓(xùn)練、推理和應(yīng)用開(kāi)發(fā)的 AI 平臺(tái),提供從數(shù)據(jù)預(yù)處理到模型訓(xùn)練、優(yōu)化及部署的一站式服務(wù)。此次基于昇騰 AI 芯片,ModelEngine 通過(guò)推理框架優(yōu)化和 MoE 存算協(xié)同,提供動(dòng)態(tài)換入換出和全局統(tǒng)一緩存,實(shí)現(xiàn)推理高并發(fā)和低時(shí)延,讓用戶(hù)能更好地體驗(yàn) DeepSeek 的推理能力。
對(duì)于開(kāi)發(fā)者而言,這一支持意義重大。ModelEngine 全面兼容 DeepSeek 系列模型 R1&V3 671B 以及蒸餾系列模型,開(kāi)發(fā)者借助它可實(shí)現(xiàn) “一鍵部署”,免去硬件選型、兼容性驗(yàn)證和環(huán)境配置等繁瑣流程,極大降低企業(yè) AI 應(yīng)用門(mén)檻。并且,ModelEngine 高度的開(kāi)放性和模塊化設(shè)計(jì),大幅縮短了 DeepSeek 的本地部署時(shí)間。
在實(shí)際操作上,以 DeepSeek-R1 為例,開(kāi)發(fā)者登錄 ModelEngine 模型管理頁(yè)面,上傳 DeepSeek-R1 FP8 權(quán)重并進(jìn)行格式轉(zhuǎn)換,在模型服務(wù)頁(yè)面選擇 BF16 精度的模型權(quán)重版本下發(fā)推理服務(wù)、啟動(dòng)任務(wù)部署,隨后 ModelEngine 使用 MindIE 推理框架啟動(dòng) DeepSeek-R1 推理服務(wù),支持 OpenAI API 調(diào)用風(fēng)格的推理服務(wù)接口和訪問(wèn)方式,用戶(hù)便可將該 API 集成到對(duì)話、RAG 以及 Agent 應(yīng)用中。
不僅如此,ModelEngine 還提供負(fù)載均衡、模型安全接入、多用戶(hù)配額管理等高階特性,支持大規(guī)模生產(chǎn)環(huán)境下的穩(wěn)定運(yùn)行。某證券公司引入 DCS AI 全棧解決方案后,運(yùn)維成本降低 42%,便是有力證明。
-
華為
+關(guān)注
關(guān)注
216文章
34849瀏覽量
254395 -
AI
+關(guān)注
關(guān)注
87文章
33258瀏覽量
273528 -
DeepSeek
+關(guān)注
關(guān)注
1文章
730瀏覽量
833
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
依托raksmart服務(wù)器在多種系統(tǒng)上本地部署deepseek注意事項(xiàng)
RK3588開(kāi)發(fā)板上部署DeepSeek-R1大模型的完整指南
添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略
曙光云全系列產(chǎn)品支持DeepSeek
曙光云全面支持DeepSeek大模型
訊飛開(kāi)放平臺(tái)支持DeepSeek
誠(chéng)邁信創(chuàng)電腦實(shí)現(xiàn)DeepSeek平臺(tái)本地部署
飛騰CPU成功支持DeepSeek全系列大模型
DeepSeek-R1本地部署指南,開(kāi)啟你的AI探索之旅

“兆瀚”算力產(chǎn)品強(qiáng)力支持DeepSeek,共筑國(guó)產(chǎn)AI新生態(tài)!

誠(chéng)邁信創(chuàng)電腦實(shí)現(xiàn)本地部署DeepSeek,開(kāi)啟智慧辦公新體驗(yàn)

華為ModelEngine助力DeepSeek全系列本地部署
華為ModelEngine AI平臺(tái)全面支持DeepSeek

評(píng)論