在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Say Hi to ERNIE!Imagination GPU率先完成文心大模型的端側(cè)部署

穎脈Imgtec ? 2025-07-01 08:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Imagination Technologies 宣布率先完成百度文心大模型(ERNIE 4.5 開源版)在其 GPU 硬件上的端側(cè)部署。適配完成后,開發(fā)者可在搭載 Imagination GPU 的設(shè)備上實(shí)現(xiàn)高效本地 AI 推理,同時(shí)大幅降低推理成本,這一成果也標(biāo)志著 Imagination GPU 在端側(cè) AI 推理場(chǎng)景中的技術(shù)領(lǐng)先性。


Imagination高度優(yōu)化軟件棧實(shí)現(xiàn)高效本地AI推理、降低成本

本次適配的文心4.5模型為開源版本,具備強(qiáng)大的智能問答、文本生成、語(yǔ)義理解和知識(shí)推理能力,廣泛適用于移動(dòng)設(shè)備、語(yǔ)音助手、IoT和教育硬件等資源受限終端。在飛槳框架支持下,Imagination GPU平臺(tái)展現(xiàn)出出色的推理性能。

Imagination基于現(xiàn)有的GPU硬件順利完成了本次文心大模型系列開源模型部署軟件棧,并得到實(shí)際網(wǎng)絡(luò)驗(yàn)證。同時(shí),Imagination高度優(yōu)化的計(jì)算軟件棧對(duì)AI本地推理性能進(jìn)行優(yōu)化,該軟件棧包含OpenCL計(jì)算庫(kù),編譯器工具鏈,主流編程框架的參考開發(fā)套件(Reference Kits)。

其中參考開發(fā)套件可協(xié)助開發(fā)者通過TVM將主流AI框架中的代碼遷移至Imagination的軟件棧。該套件基于Imagination優(yōu)化的OpenCL計(jì)算庫(kù)和圖編譯器,使用專屬API調(diào)用,提供全面的文檔說明和組件集成參考,便于客戶將其高效融入自身開發(fā)流程。


Imagination與百度協(xié)同創(chuàng)新,加速大模型端側(cè)普及

適配過程中,Imagination與百度團(tuán)隊(duì)緊密合作,針對(duì)文心4.5的特點(diǎn)進(jìn)行了優(yōu)化。推理方面,百度文心提出了多專家并行協(xié)同量化方法和卷積編碼量化算法,實(shí)現(xiàn)了效果接近無損的4-bit量化和2-bit量化。此外,還實(shí)現(xiàn)了動(dòng)態(tài)角色轉(zhuǎn)換的預(yù)填充、解碼分離部署技術(shù),可以更充分地利用資源,提升文心4.5 MoE模型的推理性能。基于飛槳框架,文心4.5在Imagination GPU硬件平臺(tái)上表現(xiàn)出優(yōu)異的推理性能。

Imagination在今年5月推出了面向邊緣AI的E 系列 GPU,具備高性能、低功耗和靈活可編程的特點(diǎn),適用于自然語(yǔ)言處理、工業(yè)計(jì)算機(jī)視覺、自動(dòng)駕駛等應(yīng)用。此次與文心模型的成功適配,也為未來客戶在采用E系列GPU構(gòu)建本地AI應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。

早在此前,Imagination加由入百度飛槳發(fā)起的 “硬件生態(tài)共創(chuàng)計(jì)劃”將飛槳的先進(jìn)算法和靈活性與 Imagination IP 技術(shù)相結(jié)合,為端側(cè)開發(fā)者提供強(qiáng)大支持。隨著邊緣計(jì)算需求的快速增長(zhǎng),Imagination將繼續(xù)與百度深入合作,推動(dòng)大模型在端側(cè)設(shè)備的普及與落地,共同打造更高效、智能的本地AI體驗(yàn)。

bc3ad94a-5610-11f0-986f-92fbcf53809c.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4928

    瀏覽量

    130965
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34839

    瀏覽量

    277368
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    599

    瀏覽量

    62129
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3094

    瀏覽量

    3984
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    兆芯率先展開文心系列模型深度技術(shù)合作

    6月30日,百度正式開源文模型4.5系列等10款模型,并實(shí)現(xiàn)預(yù)訓(xùn)練權(quán)重和推理代碼的完全開源,兆芯率先與文心系列模型展開深度技術(shù)合作。 兆
    的頭像 發(fā)表于 07-01 10:49 ?207次閱讀

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    的深度融合展開合作。雙方將結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向 AI 行業(yè)應(yīng)用的計(jì)算解決方案,推動(dòng)國(guó)產(chǎn)計(jì)算生態(tài)
    發(fā)表于 05-21 09:40 ?979次閱讀

    MediaTek天璣9400率先完成阿里Qwen3模型部署

    通義大模型團(tuán)隊(duì)在天璣 9400 旗艦移動(dòng)平臺(tái)上率先完成 Qwen3(千問 3)的側(cè)部署。未來,搭載天璣 9400 移動(dòng)平臺(tái)的設(shè)備可充分發(fā)揮
    的頭像 發(fā)表于 05-08 10:11 ?437次閱讀

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團(tuán)隊(duì)在模型發(fā)布當(dāng)天,率先完成了Qwen3全系列模型在全功能
    的頭像 發(fā)表于 05-07 15:24 ?416次閱讀

    AI側(cè)部署案例(SC171開發(fā)套件V3)

    AI側(cè)部署案例(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 初學(xué)者入門手寫數(shù)字識(shí)別案例 20分02秒 https://t.elecfans.com
    發(fā)表于 04-16 18:33

    AI側(cè)部署開發(fā)(SC171開發(fā)套件V3)

    AI側(cè)部署開發(fā)(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長(zhǎng) 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南------Docker Desktop環(huán)境操作
    發(fā)表于 04-16 18:30

    AI大模型側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大模型解決方案,激活場(chǎng)景智能新范式

    在AI技術(shù)飛速發(fā)展的當(dāng)下,AI大模型的應(yīng)用正從云端向側(cè)加速滲透。 作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,移遠(yuǎn)通信憑借深厚的技術(shù)積累與前瞻性的戰(zhàn)略布局,在AI大模型
    發(fā)表于 03-27 11:26 ?225次閱讀
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)部署</b>正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式

    AI大模型側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大模型解決方案,激活場(chǎng)景智能新范式

    在AI技術(shù)飛速發(fā)展的當(dāng)下,AI大模型的應(yīng)用正從云端向側(cè)加速滲透。作為全球領(lǐng)先的物聯(lián)網(wǎng)整體解決方案供應(yīng)商,移遠(yuǎn)通信憑借深厚的技術(shù)積累與前瞻性的戰(zhàn)略布局,在AI大模型
    的頭像 發(fā)表于 03-26 19:05 ?430次閱讀
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)部署</b>正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大<b class='flag-5'>模型</b>解決方案,激活場(chǎng)景智能新范式

    暢享DeepSeek自由,憶聯(lián)高性能CSSD為側(cè)大模型加速

    解決。然而,隨著用戶訪問量的激增,服務(wù)器無響應(yīng)、等待時(shí)間長(zhǎng)等問題也屢見不鮮。一時(shí)間,能夠離線運(yùn)行,且更具隱私性的DeepSeek側(cè)部署也成為新風(fēng)向。 本地部署雖具備諸多優(yōu)點(diǎn),但對(duì)電腦的硬件配置卻有一定的要求。大
    的頭像 發(fā)表于 03-13 15:35 ?236次閱讀
    暢享DeepSeek自由,憶聯(lián)高性能CSSD為<b class='flag-5'>端</b>側(cè)大<b class='flag-5'>模型</b>加速

    紹興數(shù)據(jù)局率先實(shí)現(xiàn)政務(wù)環(huán)境下的DeepSeek模型部署

    2月14日,紹興數(shù)據(jù)局率先基于華為昇騰服務(wù)器,成功部署上線DeepSeek全尺寸大模型,在全省率先實(shí)現(xiàn)政務(wù)環(huán)境下的DeepSeek模型
    的頭像 發(fā)表于 02-20 11:22 ?1430次閱讀
    紹興數(shù)據(jù)局<b class='flag-5'>率先</b>實(shí)現(xiàn)政務(wù)環(huán)境下的DeepSeek<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    百度下一代文模型正式開源

    隨著文模型的迭代升級(jí)和成本不斷下降,文一言將于4月1日0時(shí)起全面免費(fèi),所有PC和APP用戶均可體驗(yàn)文心系列最新
    的頭像 發(fā)表于 02-17 13:44 ?503次閱讀

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測(cè)試,開啟這場(chǎng)充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開發(fā)板:AI 性能擔(dān)當(dāng) RK3588 開發(fā)板基于先進(jìn)的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,在 AI
    發(fā)表于 02-14 17:42

    Imagination DXS GPU榮獲ASIL-B官方認(rèn)證

    全球硅知識(shí)產(chǎn)權(quán)(IP)領(lǐng)域的佼佼者Imagination Technologies宣布了一項(xiàng)重要成就:其專為汽車領(lǐng)域打造的Imagination DXS GPU IP,已成功通過SGS-TüV Saar的全面審核與評(píng)估,正式獲得
    的頭像 發(fā)表于 11-14 16:37 ?845次閱讀

    Imagination推出性能最高且具有高等級(jí)功能安全性的汽車GPU IP

    Imagination DXS GPU 進(jìn)一步擴(kuò)大其在汽車領(lǐng)域的領(lǐng)先地位
    的頭像 發(fā)表于 09-14 17:41 ?624次閱讀

    基于AX650N/AX630C部署側(cè)大語(yǔ)言模型Qwen2

    本文將分享如何將最新的側(cè)大語(yǔ)言模型部署到超高性價(jià)比SoC上,向業(yè)界對(duì)側(cè)大模型部署的開發(fā)者提供
    的頭像 發(fā)表于 07-06 17:43 ?4532次閱讀
    基于AX650N/AX630C<b class='flag-5'>部署</b><b class='flag-5'>端</b>側(cè)大語(yǔ)言<b class='flag-5'>模型</b>Qwen2
    主站蜘蛛池模板: 国产成人v爽在线免播放观看 | 国产三级日本三级日产三 | 一区二区3区免费视频 | 日韩性xxx | 22eee在线播放成人免费视频 | 性夜黄a爽影免费看 | 天天干中文字幕 | 中文字幕亚洲综合久久2 | 亚洲香蕉网久久综合影院3p | 欧美性video精品 | 天天爽夜夜爽一区二区三区 | 国产精品夜色一区二区三区 | 日本加勒比在线精品视频 | 国内自拍2021 | 性欧美大战久久久久久久久 | 99草在线观看 | 精品国产免费久久久久久婷婷 | 亚洲伊人久久综合影院2021 | 成人a毛片视频免费看 | 天堂在线观看视频观看www | 人人莫| 亚洲性色成人 | 日本免费不卡视频 | 亚洲午夜精品久久久久久成年 | 久久久久国产精品四虎 | 两性毛片 | 国产毛片久久久久久国产毛片 | 免费观看色 | 性欧美久久 | 天天干天天色综合 | 奇米影视亚洲狠狠色777不卡 | 羞羞色男人的天堂伊人久久 | 在线永久免费观看黄网站 | 美女视频黄视大全视频免费网址 | 狠狠色丁香婷婷综合 | 天天摸日日 | 男人透女人超爽视频免费 | 5x性区m免费毛片视频看看 | 激情亚洲综合网 | 一区视频在线播放 | 色综合亚洲天天综合网站 |