4月29日,阿里巴巴通義千問發布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發布后數小時內,壁仞科技完成全系列支持,并率先在壁仞科技開發者云平臺上線。
性能卓越,Qwen3部署成本大幅下降
Qwen3包括兩款混合專家(MoE)模型Qwen3-235B-A22B和Qwen3-30B-A3B;同時還包括六個密集(Dense)模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。從官方披露的數據來看,旗艦模型Qwen3-235B-A22B在代碼、數學、通用能力等基準測試中,與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比,表現出極具競爭力的結果。此外,小型MoE模型Qwen3-30B-A3B的激活參數數量是QwQ-32B的10%,表現更勝一籌。
基于廣泛的訓練,Qwen3在推理、指令跟隨、Agent能力和多語言支持方面取得了突破性的進展,不僅是國內首個“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,大大節省算力消耗;部署成本大也幅下降,顯存占用僅為性能相近模型的三分之一。
極速響應,數小時全系列適配
壁仞科技依托自研的壁礪系列通用GPU架構與深度優化的軟件棧,在Qwen3正式發布后,僅用數小時完成Qwen3全系列模型的適配工作,并成功上線開發者云平臺。
與此同時,壁仞科技快速響應,推出基于壁礪系列一體機,包括便捷4卡機、通用8卡機、高密16卡機,全面支持Qwen3全系列模型。
Qwen3開源更重要的行業意義在于推動大模型技術的普惠和應用的落地。據相關媒體報道,Qwen3顯著降低了設備適配的技術門檻以及部署成本,可滿足海量中小企業和AI開發者的需求,從而加速AI推理應用落地。
用戶訪問以下鏈接或點擊閱讀全文即可體驗部分模型:
https://sgc.birentech.com:5000/
-
阿里巴巴
+關注
關注
7文章
1637瀏覽量
48114 -
壁仞科技
+關注
關注
1文章
67瀏覽量
3101 -
大模型
+關注
關注
2文章
3060瀏覽量
3894 -
通義千問
+關注
關注
1文章
35瀏覽量
419
原文標題:即刻適配!壁仞科技完成Qwen3全系列模型支持
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Intel OpenVINO? Day0 實現阿里通義 Qwen3 快速部署

評論