欢乐颂第二季,完美世界国际版下载,好看的小说完本推荐

Say Hi to ERNIE！Imagination GPU率先完成文心大模型的端側(cè)部署

Imagination Technologies 宣布率先完成百度文心大模型（ERNIE 4.5 開源版）在其 GPU 硬件上的端側(cè)部署。適配完成后，開發(fā)者可在搭載 Imagination GPU 的設(shè)備上實(shí)現(xiàn)高效本地 AI 推理，同時(shí)大幅降低推理成本，這一成果也標(biāo)志著 Imagination GPU 在端側(cè) AI 推理場(chǎng)景中的技術(shù)領(lǐng)先性。

Imagination高度優(yōu)化軟件棧實(shí)現(xiàn)高效本地AI推理、降低成本

本次適配的文心4.5模型為開源版本，具備強(qiáng)大的智能問答、文本生成、語(yǔ)義理解和知識(shí)推理能力，廣泛適用于移動(dòng)設(shè)備、語(yǔ)音助手、IoT和教育硬件等資源受限終端。在飛槳框架支持下，Imagination GPU平臺(tái)展現(xiàn)出出色的推理性能。

Imagination基于現(xiàn)有的GPU硬件順利完成了本次文心大模型系列開源模型部署軟件棧，并得到實(shí)際網(wǎng)絡(luò)驗(yàn)證。同時(shí)，Imagination高度優(yōu)化的計(jì)算軟件棧對(duì)AI本地推理性能進(jìn)行優(yōu)化，該軟件棧包含OpenCL計(jì)算庫(kù)，編譯器工具鏈，主流編程框架的參考開發(fā)套件（Reference Kits）。

其中參考開發(fā)套件可協(xié)助開發(fā)者通過TVM將主流AI框架中的代碼遷移至Imagination的軟件棧。該套件基于Imagination優(yōu)化的OpenCL計(jì)算庫(kù)和圖編譯器，使用專屬API調(diào)用，提供全面的文檔說明和組件集成參考，便于客戶將其高效融入自身開發(fā)流程。

Imagination與百度協(xié)同創(chuàng)新，加速大模型端側(cè)普及

適配過程中，Imagination與百度團(tuán)隊(duì)緊密合作，針對(duì)文心4.5的特點(diǎn)進(jìn)行了優(yōu)化。推理方面，百度文心提出了多專家并行協(xié)同量化方法和卷積編碼量化算法，實(shí)現(xiàn)了效果接近無損的4-bit量化和2-bit量化。此外，還實(shí)現(xiàn)了動(dòng)態(tài)角色轉(zhuǎn)換的預(yù)填充、解碼分離部署技術(shù)，可以更充分地利用資源，提升文心4.5 MoE模型的推理性能。基于飛槳框架，文心4.5在Imagination GPU硬件平臺(tái)上表現(xiàn)出優(yōu)異的推理性能。

Imagination在今年5月推出了面向邊緣AI的E 系列 GPU，具備高性能、低功耗和靈活可編程的特點(diǎn)，適用于自然語(yǔ)言處理、工業(yè)計(jì)算機(jī)視覺、自動(dòng)駕駛等應(yīng)用。此次與文心模型的成功適配，也為未來客戶在采用E系列GPU構(gòu)建本地AI應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。

早在此前，Imagination加由入百度飛槳發(fā)起的 “硬件生態(tài)共創(chuàng)計(jì)劃”，將飛槳的先進(jìn)算法和靈活性與 Imagination IP 技術(shù)相結(jié)合，為端側(cè)開發(fā)者提供強(qiáng)大支持。隨著邊緣計(jì)算需求的快速增長(zhǎng)，Imagination將繼續(xù)與百度深入合作，推動(dòng)大模型在端側(cè)設(shè)備的普及與落地，共同打造更高效、智能的本地AI體驗(yàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴