幾B都有！BM1684X一鍵適配全系列Qwen3

Qwen3發布，大小尺寸通吃

Qwen3一發布，登頂開源大模型排行榜！235B、32B、8B、4B、1.7B云邊端全尺寸模型，BF16和FP8兩種精度，一次性發布，無論云端大卡還是邊緣AI設備，都可體驗最新的大模型能力。

來看下Qwen3各個模型的benchmark得分：

這些年看多了大模型的迭代，各家都在玩參數競賽和架構魔術，但阿里這次Qwen3的設計有點意思——它搞了個"混合模式"的機制，讓模型能自己決定什么時候該"慢慢想"，什么時候該"快速答"。這玩意兒本質上是在延遲和精度之間做動態權衡，技術上不算新鮮（OpenAI的o3就玩過這套），但阿里的實現方式更像個老會計——給你個"思考預算"的開關，讓用戶自己把控成本。

BM1684X，Qwen3部署性價比之王

這種設計背后是典型的工程思維：既然大模型的推理成本居高不下，不如把選擇權交給用戶。就像當年CPU的動態調頻技術，與其無腦跑滿頻，不如讓系統根據負載靈活調節，但這種模式切換要在硬件層面做好流水線調度，否則切換時的上下文保存就能吃掉那點省下來的算力。

現在的大模型就像過度教育的孩子，解得了奧數題但算不清買菜賬。Qwen3給"孩子"裝了個手動擋，讓用戶自己決定什么時候該掛高檔位沖刺，什么時候該低檔省油，這種策略下每瓦特的性價比自然就上去了，而邊緣和端側的設備對成本更是敏感，那作為邊緣大模型部署的性價比之王，BM1684X表現如何？

4B運行demo（SOC模式950Mhz 16.4tokens/s）

1.7B運行demo(SOC模式950Mhz 30.3 tokens/s)

一行代碼適配，解鎖全系模型

BM1684X 單芯配置16GB內存，20B以下的都可以在一顆芯片跑，32B用2顆就可以(32B dense模型性能約5 tokens/s)。

更詳細的適配流程參考：https://github.com/sophgo/LLM-TPU/tree/main/models/Qwen3，拉取最新的tpu-mlir代碼后，只需要一行代碼即可轉出bmodel，不用再通過onnx中介。

bmodel轉好之后，可以用python或者cpp來跑：

限制我們適配新模型速度的不是工具鏈，而是模型下載速度，歡迎關注算能產品，解鎖更多大模型部署方案，手中有BM1684X的同學可以玩起來了！

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

邊緣AI

邊緣AI

+關注

關注
0

文章
164

瀏覽量
5461
大模型

大模型

+關注

關注
2

文章
3146

瀏覽量
4071

算能開發者社區
企業號

63 內容 8.7w 閱讀 6 粉絲

我要咨詢關注

Hot 重塑翻譯與識別技術：開源語音識別模型Whisper的編譯優化與部署
Hot 探索ChatGLM2在算能BM1684X上INT8量化部署，加速大模型商業落地
New ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升，RISC-V + AI 新紀元！代碼已經開源，一起來試試！
New SC11 FP300 MLA算子融合與優化

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現實

腦極體
8小時前

245 閱讀

RKDC2025 | 視美泰亮相瑞芯微2025開發者大會，共探AIoT新藍海

視美泰
13小時前

294 閱讀

老化測試效率提升，高壓干簧繼電器究竟做對了什么？

斯丹麥德電子
14小時前

333 閱讀

光儲邊緣智能的核心演進方向:MCU + AFE + 通信 + AI 一體化設計

eeDesigner
15小時前

484 閱讀

線性穩壓器和開關穩壓器、串聯穩壓器的區別

東芝半導體
15小時前

413 閱讀

云計算小指南

junyi201212
328 KB

免費

0下載

虛擬儀器課程和實驗室案例集錦

zaojinguo
5.36 MB

免費

0下載

晶體管收音機中的新技術_王新成

lillas
8.97 MB

免費

0下載

FontAwesome完美的圖標字體

張敏
13.51 MB

免費

0下載

高精度低噪聲 2A LDO 穩壓器PCD3931數據手冊

pc16211
0.83 MB

免費

0下載

省錢+環保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

186 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

421 閱讀

【RA-Eco-RA6M4開發板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

389 閱讀

【VisionFive 2單板計算機試用體驗】2、打造復古游戲機（Batocera鏡像+FBNeo虛擬機，多款游戲ROM分享）

左岸cpx
2天前

406 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+兩種開發板間的比較

jinglixixi
2天前

361 閱讀

推薦企業號
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

幾B都有！BM1684X一鍵適配全系列Qwen3

Qwen3發布，大小尺寸通吃

BM1684X，Qwen3部署性價比之王

一行代碼適配，解鎖全系模型

評論