隨著深度求索(DeepSeek)大模型的發(fā)布引發(fā)行業(yè)熱議,研華科技基于昇騰Atlas平臺(tái)邊緣AI Box MIC-ATL3S正式發(fā)布與Deepseek R1模型的部署流程。該平臺(tái)依托昇騰芯片的強(qiáng)大異構(gòu)計(jì)算能力,結(jié)合研華邊緣AI Box高可靠特點(diǎn),通過(guò)模型輕量化、算子適配等技術(shù)實(shí)現(xiàn)大模型邊緣端部署。
硬件部署/
CPU:Atlas 310P
10個(gè)DaVinciV200 AI core,主頻最高達(dá)1.08GHz
16個(gè)64位TaishanV200M處理器核,核主頻最高1.9GHz
8個(gè)DaVinciV200 Vector core,主頻最高達(dá)1GHz
AI算力:176TOPS INT8
操作系統(tǒng):OpenEuler
模型:DeepSeek-R1
推理模型/
根據(jù)MIC-ATL3S硬件規(guī)格,我們選取了DeepSeek-R1-Distill-Qwen-1.5B這個(gè)精度和對(duì)硬件配置要求相對(duì)平衡的蒸餾模型進(jìn)行適配和部署。
部署步驟/
昇騰310P + openEuler22.03部署deepseek-R1
1. 安裝驅(qū)動(dòng)包以及CANN
前往昇騰社區(qū)獲當(dāng)前芯片版本的驅(qū)動(dòng)、FW、以及CANN(昇騰異構(gòu)計(jì)算架構(gòu))
driver:Ascend-hdk-310p-npu-driver_xxxxx_linux-aarch64_chip-enable.run Firmware:Ascend-hdk-310p-npu-firmware_xxxxx_chip-enable.run CANN:Ascend-cann-toolkit_xxxxx_linux-aarch64.run
2. 安裝依賴(lài)組件
4. DeepSeek-R1模型拉取
拉取模型指令,以1.5B為例
yum install git-lfs -y git lfs install git clone https://ai.gitee.com/hf-models/DeepSeek-R1-Distill-Qwen-1.5B
克隆完成示例如下,包含HF完整的倉(cāng)庫(kù):
5. 模型轉(zhuǎn)換
下載后的模型為safetensors格式,還不能直接使用,先用transformers轉(zhuǎn)換為ONNX格式,再使用atc轉(zhuǎn)換為OM(昇騰)格式才能使用。
創(chuàng)建python腳本將safetensors格式轉(zhuǎn)換為ONNX格式,最終轉(zhuǎn)換為OM格式。
執(zhí)行腳本后會(huì)生成對(duì)應(yīng)模型文件,生成對(duì)應(yīng)格式模型文件 執(zhí)行:
Python3 convert.py ./convert.sh
最后,需要用一個(gè)簡(jiǎn)單的python腳本去做互動(dòng)窗口,運(yùn)行指令:python3 deepseek_r1.py
示例:
總結(jié):目前研華進(jìn)行MIC-ATL3S適配更多Deepseek模型,以及與生態(tài)伙伴展開(kāi)具體應(yīng)用場(chǎng)景測(cè)試,后續(xù)我們會(huì)持續(xù)公布研華邊緣AI平臺(tái)產(chǎn)品的部署&測(cè)試內(nèi)容,敬請(qǐng)關(guān)注。
研華昇騰310系列邊緣AI平臺(tái)
研華基于昇騰Atlas 310系列平臺(tái)開(kāi)發(fā)出三款不同形態(tài)的邊緣AI產(chǎn)品:工業(yè)標(biāo)準(zhǔn)化AI模組、邊緣AI開(kāi)發(fā)套件以及邊緣AI盒子。此系列產(chǎn)品算力高達(dá)176 Tops,專(zhuān)注于工業(yè)場(chǎng)景下的細(xì)分應(yīng)用。同時(shí),在軟件方面,研華聚焦底層開(kāi)發(fā),定期更新SDK套件以滿(mǎn)足客戶(hù)的開(kāi)發(fā)需求,并自主研發(fā)工業(yè)領(lǐng)域遠(yuǎn)程部署和管理工具。
-
AI
+關(guān)注
關(guān)注
87文章
31834瀏覽量
270610 -
研華
+關(guān)注
關(guān)注
0文章
375瀏覽量
38771 -
昇騰
+關(guān)注
關(guān)注
1文章
139瀏覽量
6667 -
DeepSeek
+關(guān)注
關(guān)注
1文章
309瀏覽量
106
原文標(biāo)題:研華正式發(fā)布國(guó)產(chǎn)化昇騰AI Box與Deepseek R1模型部署全流程!
文章出處:【微信號(hào):研華智能地球,微信公眾號(hào):研華智能地球】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略
IBM在watsonx.ai平臺(tái)推出DeepSeek R1蒸餾模型
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
日海智能AI模組接入DeepSeek R1模型
DeepSeek模型成功部署,物通博聯(lián)在 AI 賦能工業(yè)上持續(xù)探索、不斷前行
Deepseek R1大模型離線(xiàn)部署教程
![<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>離線(xiàn)<b class='flag-5'>部署</b>教程](https://file1.elecfans.com/web3/M00/07/F9/wKgZO2er_XqAeLgsAAAwwBdPv4k681.png)
Gitee AI 聯(lián)合沐曦首發(fā)全套 DeepSeek R1 千問(wèn)蒸餾模型,全免費(fèi)體驗(yàn)!
![Gitee <b class='flag-5'>AI</b> 聯(lián)合沐曦首發(fā)全套 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 千問(wèn)蒸餾<b class='flag-5'>模型</b>,全免費(fèi)體驗(yàn)!](https://file1.elecfans.com//web3/M00/07/9E/wKgZPGepXOOAUDYmAA45t-baKr0306.png)
部署DeepSeek R1于AX650N與AX630C平臺(tái)
![<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>于AX650N與AX630C平臺(tái)](https://file1.elecfans.com/web3/M00/07/93/wKgZPGeoBhiAbFSOAAAYmyujFsI606.jpg)
壁仞科技順利部署DeepSeek R1千問(wèn)蒸餾模型
扣子平臺(tái)支持DeepSeek R1與V3模型
deepin UOS AI接入DeepSeek-R1模型
鯤云科技AI芯片CAISA 430成功適配DeepSeek R1模型
![鯤云科技<b class='flag-5'>AI</b>芯片CAISA 430成功適配<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>](https://file1.elecfans.com/web3/M00/07/68/wKgZO2elaQ-ASXGbAAAWO4rFvF0412.png)
云天勵(lì)飛上線(xiàn)DeepSeek R1系列模型
![云天勵(lì)飛上線(xiàn)<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b>](https://file1.elecfans.com/web3/M00/07/40/wKgZPGekIduALExKAAANc3crHk8806.png)
研華發(fā)布高性能工業(yè)邊緣 AI 算力方案 攜手昇騰引領(lǐng)邊緣 AI 革新
![<b class='flag-5'>研</b>華發(fā)布高性能工業(yè)<b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 算力方案 攜手昇騰引領(lǐng)<b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 革新](https://file1.elecfans.com//web2/M00/08/EC/wKgaomb0FIOAanGQAAEMD9kbwcM178.jpg)
評(píng)論