在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

幾B都有!BM1684X一鍵適配全系列Qwen3

算能開發者社區 ? 2025-04-30 18:37 ? 次閱讀

Qwen3發布,大小尺寸通吃

Qwen3一發布,登頂開源大模型排行榜!235B、32B、8B、4B、1.7B云邊端全尺寸模型,BF16和FP8兩種精度,一次性發布,無論云端大卡還是邊緣AI設備,都可體驗最新的大模型能力。

來看下Qwen3各個模型的benchmark得分:

2df9d8c0-25af-11f0-9434-92fbcf53809c.png

2e1a6928-25af-11f0-9434-92fbcf53809c.png

這些年看多了大模型的迭代,各家都在玩參數競賽和架構魔術,但阿里這次Qwen3的設計有點意思——它搞了個"混合模式"的機制,讓模型能自己決定什么時候該"慢慢想",什么時候該"快速答"。這玩意兒本質上是在延遲和精度之間做動態權衡,技術上不算新鮮(OpenAI的o3就玩過這套),但阿里的實現方式更像個老會計——給你個"思考預算"的開關,讓用戶自己把控成本。

2e316574-25af-11f0-9434-92fbcf53809c.png

BM1684X,Qwen3部署性價比之王

這種設計背后是典型的工程思維:既然大模型的推理成本居高不下,不如把選擇權交給用戶。就像當年CPU的動態調頻技術,與其無腦跑滿頻,不如讓系統根據負載靈活調節,但這種模式切換要在硬件層面做好流水線調度,否則切換時的上下文保存就能吃掉那點省下來的算力。

現在的大模型就像過度教育的孩子,解得了奧數題但算不清買菜賬。Qwen3給"孩子"裝了個手動擋,讓用戶自己決定什么時候該掛高檔位沖刺,什么時候該低檔省油,這種策略下每瓦特的性價比自然就上去了,而邊緣和端側的設備對成本更是敏感,那作為邊緣大模型部署的性價比之王,BM1684X表現如何?

4B運行demo(SOC模式950Mhz 16.4tokens/s)

2e48630a-25af-11f0-9434-92fbcf53809c.gif

1.7B運行demo(SOC模式950Mhz 30.3 tokens/s)

2e6838ec-25af-11f0-9434-92fbcf53809c.gif

一行代碼適配,解鎖全系模型

BM1684X 單芯配置16GB內存,20B以下的都可以在一顆芯片跑,32B用2顆就可以(32B dense模型性能約5 tokens/s)。

更詳細的適配流程參考:https://github.com/sophgo/LLM-TPU/tree/main/models/Qwen3,拉取最新的tpu-mlir代碼后,只需要一行代碼即可轉出bmodel,不用再通過onnx中介。

2e88a9a6-25af-11f0-9434-92fbcf53809c.png

bmodel轉好之后,可以用python或者cpp來跑:

2e9ca49c-25af-11f0-9434-92fbcf53809c.png

限制我們適配新模型速度的不是工具鏈,而是模型下載速度,歡迎關注算能產品,解鎖更多大模型部署方案,手中有BM1684X的同學可以玩起來了!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 邊緣AI
    +關注

    關注

    0

    文章

    134

    瀏覽量

    5274
  • 大模型
    +關注

    關注

    2

    文章

    2953

    瀏覽量

    3691
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    中科曙光DeepAI深算智能引擎全面支持Qwen3

    日前,Qwen3正式發布并全部開源8款混合推理模型。作為Qwen系列中的最新代大型語言模型,Qwen3在推理、指令遵循、工具調用、多語言能
    的頭像 發表于 05-06 15:17 ?142次閱讀

    上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5

    似乎國內外AI競爭日趨白熱化,就在阿里巴巴發布Qwen3(通義千問3)之后,引發業界廣泛關注;很多大廠在跟進,大模型不斷上新: 阿里巴巴開源新代通義千問模型Qwen3 4月29日凌晨
    的頭像 發表于 04-30 16:08 ?554次閱讀

    壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持

    4月29日,阿里巴巴通義千問發布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發布后數小時內,壁仞科技完成全系列
    的頭像 發表于 04-30 15:19 ?392次閱讀

    開關柜一鍵順控在一鍵停電、一鍵送電中的作用

    蜀瑞創新為大家科普,開關柜一鍵順控技術在一鍵停電和一鍵送電中發揮了快速響應、減少人為錯誤、提高安全性、簡化操作流程、降低操作風險、提高送電成功率等綜合優勢,對于提升電力系統的運行效率、安全性以及自動化水平具有重要意義。
    的頭像 發表于 02-27 09:13 ?376次閱讀

    景嘉微JM11 GPU已流片,JM、景宏系列完成DeepSeek R1系列模型適配

    了DeepSeek-R1-Distill-Qwen-1.5B模型和DeepSeek-R1-Distill-Qwen-7B模型的適配。 ? ? 同時,景宏系列已全面兼容并
    發表于 02-15 00:01 ?1484次閱讀
    景嘉微JM11 GPU已流片,JM、景宏<b class='flag-5'>系列</b>完成DeepSeek R1<b class='flag-5'>系列</b>模型<b class='flag-5'>適配</b>

    天數智芯加速DeepSeek全系列模型適配

    R1-Distill-Qwen系列模型,包括1.5B、7B、14B和32B等不同參數版本,以及
    的頭像 發表于 02-10 15:30 ?741次閱讀

    云天勵飛上線DeepSeek R1系列模型

    大模型、DeepSeek V3/R1 671B MoE大模型也在有序適配中。適配完成后,DeepEdge10芯片平臺將在端、邊、云全面支持DeepSeek
    的頭像 發表于 02-06 10:39 ?525次閱讀
    云天勵飛上線DeepSeek R1<b class='flag-5'>系列</b>模型

    阿里通義千問代碼模型全系列開源

    近日,阿里云通義大模型團隊宣布了項重大決策:將通義千問代碼模型全系列正式開源。此次開源的模型系列共包含6款Qwen2.5-Coder模型,分別為0.5
    的頭像 發表于 11-14 15:26 ?803次閱讀

    阿里云開源Qwen2.5-Coder代碼模型系列

    近日,阿里云通義大模型團隊宣布開源其通義千問代碼模型全系列,共包含6款Qwen2.5-Coder模型。這舉措展示了阿里云在推動AI技術開放與共享方面的決心。 此次發布的旗艦模型
    的頭像 發表于 11-14 11:28 ?713次閱讀

    一鍵斷電開關的種類有哪些

    一鍵斷電開關的種類主要可以從其功能和實現方式上進行分類。以下是些常見的一鍵斷電開關種類: 1. 繼電器式一鍵斷電開關 定義 :這種開關通過繼電器或接觸器控制電路的通斷,實現
    的頭像 發表于 09-13 16:45 ?2367次閱讀

    阿里Qwen2-Math系列震撼發布,數學推理能力領跑全球

    阿里巴巴近期震撼發布了Qwen2-Math系列模型,這一系列模型基于其強大的Qwen2 LLM構建,專為數學解題而生,展現了前所未有的數學推理能力。
    的頭像 發表于 08-12 15:19 ?1016次閱讀

    變電站一鍵順控系統和開關柜一鍵順控有區別嗎?

    變電站一鍵順控系統和開關柜一鍵順控技術雖然都涉及到“一鍵順控”的概念,但它們在應用范圍和具體實現上有所不同,因此變電站一鍵順控系統和開關柜一鍵
    的頭像 發表于 07-31 13:34 ?969次閱讀
    變電站<b class='flag-5'>一鍵</b>順控系統和開關柜<b class='flag-5'>一鍵</b>順控有區別嗎?

    【算能RADXA微服務器試用體驗】+ GPT語音與視覺交互:2,圖像識別

    圖像識別也屬于是AI的個非?;镜慕浀鋺谩T谥鞔駻I功能的BM1684X上自然也是得到了廣泛的支持。 算能官方提供了個叫做Radxa-Model-Zoo的倉庫,這個倉庫里包含了許多AI方面
    發表于 07-14 23:36

    Qwen2強勢來襲,AIBOX支持本地化部署

    AIBOX-1684X適配Qwen2系列模型,并已集成在FireflyChat對話應用中,開機即可體驗。模型基礎更新預訓練和指令微調模型Qwen
    的頭像 發表于 06-27 08:02 ?1307次閱讀
    <b class='flag-5'>Qwen</b>2強勢來襲,AIBOX支持本地化部署

    bm1684運行demo報錯怎么解決?

    ../models/BM1684X/yolov5s_v6.1_3output_fp32_1b.bmodel[BMRT][bmcpu_setup:406] INFO:cpu_lib \'libcpuop.so
    發表于 05-20 07:24
    主站蜘蛛池模板: 国产成人影院在线观看 | 日日摸夜夜爽 | 色视频在线观看免费 | 手机看福利片 | 欧美城天堂网 | 国产偷窥女洗浴在线观看亚洲 | 欧美三级免费看 | 男人天堂资源站 | 午夜资源站 | 久操福利 | 五月伊人婷婷 | 婷婷丁香色综合狠狠色 | 91av视频 | 国产亚洲精品久久久久久久软件 | 久久新视频 | 日本特级黄录像片 | 日本黄色免费大片 | 最近2018年中文字幕大全一 | 欧美人与性另类 | 男女在线视频 | 激情五月视频 | 久久国产精品免费专区 | 欧美日韩精品乱国产 | 国产在线观看色 | 国产精品久久久久久影院 | 一区二区在线免费观看 | 亚洲香蕉视频 | 五月婷婷色综合 | 韩国中文字幕在线观看 | 国产精品午夜免费观看网站 | 不卡无毒免费毛片视频观看 | 永久免费观看午夜视频在线 | 四虎精品永久在线网址 | 天天爱天天插 | 日本亚洲免费 | 丁香婷婷综合五月综合色啪 | 色综合成人丁香 | 台湾一级毛片 | 夜夜爽爽爽 | 美国69bj| 欧美综合在线视频 |