91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

安富利:FPGA加速AI推理加速成功應(yīng)用案例

454398 ? 來源:安富利 ? 作者:安富利 ? 2020-09-29 10:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如今,基于深度學(xué)習(xí)(DL)的人工智能AI)應(yīng)用越來越廣泛,不論是在與個(gè)人消費(fèi)者相關(guān)的智能家居智能駕駛等領(lǐng)域,還是在視頻監(jiān)控、智慧城市等公共管理領(lǐng)域,我們都能看到其身影。

眾所周知,實(shí)施一個(gè)完整的AI應(yīng)用需要經(jīng)歷訓(xùn)練和推理兩個(gè)過程。所謂“訓(xùn)練”,就是我們要將大量的數(shù)據(jù)代入到神經(jīng)網(wǎng)絡(luò)模型中運(yùn)算并反復(fù)迭代,“教會(huì)”算法模型如何正確的工作,訓(xùn)練出一個(gè)DL模型。而接下來,我們就可以利用訓(xùn)練出來的模型來在線響應(yīng)用戶的需求,根據(jù)輸入的新數(shù)據(jù)做出正確而及時(shí)的決策判斷,這個(gè)過程就是“推理”。

通常來講,一個(gè)AI應(yīng)用中“訓(xùn)練”只需要做一次——有時(shí)這個(gè)工作會(huì)交給第三方專業(yè)的且有充沛算力資源的團(tuán)隊(duì)去做,而應(yīng)用開發(fā)工程師要做的則是將訓(xùn)練好的模型部署到特定的硬件平臺(tái)上,滿足目標(biāo)應(yīng)用場(chǎng)景中推理過程的需要。由于推理過程會(huì)直接聯(lián)系最終用戶,推理的準(zhǔn)確性和速度也會(huì)直接影響到用戶體驗(yàn)的好壞,因此如何有效地為AI推理做加速,也就成了當(dāng)下開發(fā)者普遍關(guān)心的一個(gè)熱門的話題。

AI推理加速,FPGA勝出!

從硬件架構(gòu)來看,可以支持AI推理加速的有四個(gè)可選方案,它們分別是:CPUGPU、FPGA和ASIC,如果對(duì)這幾類器件的特性進(jìn)行比較,會(huì)發(fā)現(xiàn)按照從左到右的順序,器件的靈活性/適應(yīng)性是遞減的,而處理能力和性能功耗比則是遞增的。

CPU是基于馮?諾依曼架構(gòu),雖然其很靈活,但由于存儲(chǔ)器訪問往往要耗費(fèi)幾個(gè)時(shí)鐘周期才能執(zhí)行一個(gè)簡(jiǎn)單的任務(wù),延遲會(huì)很長(zhǎng),應(yīng)對(duì)神經(jīng)網(wǎng)絡(luò)(NN)這種計(jì)算密集型的任務(wù),功耗也會(huì)比較大,顯然最不適合做AI推理。

GPU具有強(qiáng)大的數(shù)據(jù)并行處理能力,在做海量數(shù)據(jù)訓(xùn)練方面優(yōu)勢(shì)明顯,而推理計(jì)算通常一次只對(duì)一個(gè)輸入項(xiàng)進(jìn)行處理的應(yīng)用,GPU并行計(jì)算的優(yōu)勢(shì)發(fā)揮不出來,再加上其功耗相對(duì)較大,所以在AI推理方面也不是最優(yōu)選擇。

從高性能和低功耗的角度來看,定制的ASIC似乎是一種理想的解決方案,但其開發(fā)周期長(zhǎng)、費(fèi)用高,對(duì)于總是處于快速演進(jìn)和迭代中的DL和NN算法來說,靈活性嚴(yán)重受限,風(fēng)險(xiǎn)太大,在AI推理中人們通常不會(huì)考慮它。

所以我們的名單上只剩下FPGA了。這些年來大家對(duì)于FPGA快速、靈活和高效的優(yōu)點(diǎn)認(rèn)識(shí)越來越深入,硬件可編程的特性使其能夠針對(duì)DL和NN處理的需要做針對(duì)性的優(yōu)化,提供充足的算力,而同時(shí)又保持了足夠的靈活性。今天基于FPGA的異構(gòu)計(jì)算平臺(tái),除了可編程邏輯,還會(huì)集成多個(gè)Arm處理器內(nèi)核、DSP、片上存儲(chǔ)器等資源,DL所需的處理能力可以很好地映射到這些FPGA資源上,而且所有這些資源都可以并行工作 ,即每個(gè)時(shí)鐘周期可觸發(fā)多達(dá)數(shù)百萬個(gè)同時(shí)的操作,這對(duì)于AI推理是再合適不過了。

與CPU和GPU相比,F(xiàn)PGA在AI推理應(yīng)用方面的優(yōu)勢(shì)還表現(xiàn)在:

  • 不受數(shù)據(jù)類型的限制,比如它可以處理非標(biāo)準(zhǔn)的低精度數(shù)據(jù),從而提高數(shù)據(jù)處理的吞吐量。

v功耗更低,針對(duì)相同的NN計(jì)算,F(xiàn)PGA與CPU/GPU相比平均功耗低5~10倍。

  • 可通過重新編程以適應(yīng)不同任務(wù)的需要,這種靈活性對(duì)于適應(yīng)持續(xù)發(fā)展中的DL和NN算法尤為關(guān)鍵。
  • 應(yīng)用范圍廣,從云端到邊緣端的AI推理工作,都可勝任。

總之一句話,在AI推理計(jì)算的競(jìng)爭(zhēng)中,F(xiàn)PGA的勝出沒有懸念。

GPU無縫對(duì)接,F(xiàn)PGA即插即用

不過,雖然FPGA看上去“真香”,但是很多AI應(yīng)用的開發(fā)者還是對(duì)其“敬而遠(yuǎn)之”,究其原因最重要的一點(diǎn)就是——FPGA上手使用太難了!

難點(diǎn)主要體現(xiàn)在兩個(gè)方面:

  • 首先,對(duì)FPGA進(jìn)行編程需要特定的技能和知識(shí),要熟悉專門的硬件編程語言,還要熟練使用FPGA的特定工具,才能通過綜合、布局和布線等復(fù)雜的步驟來編譯設(shè)計(jì)。這對(duì)于很多嵌入式工程師來說,完全是一套他們所不熟悉的“語言”。
  • 再有,因?yàn)楹芏郉L模型是在GPU等計(jì)算架構(gòu)上訓(xùn)練出來的,這些訓(xùn)練好的模型移植、部署到FPGA上時(shí),很可能會(huì)遇到需要重新訓(xùn)練和調(diào)整參數(shù)等問題,這要求開發(fā)者有專門的AI相關(guān)的知識(shí)和技能。

如何能夠降低大家在AI推理中使用FPGA的門檻?在這方面,Mipsology公司給我們帶來了一個(gè)“驚喜”——該公司開發(fā)了一種基于FPGA的深度學(xué)習(xí)推理引擎Zebra,可以讓開發(fā)者在“零努力(Zero Effort)”的情況下,對(duì)GPU訓(xùn)練的模型代碼進(jìn)行轉(zhuǎn)換,使其能夠在FPGA上運(yùn)行,而無需改寫任何代碼或者進(jìn)行重新訓(xùn)練。

這也就意味著,調(diào)整NN參數(shù)甚至改變神經(jīng)網(wǎng)絡(luò)并不需要強(qiáng)制重新編譯FPGA,而這些重新編譯工作可能需要花費(fèi)數(shù)小時(shí)、數(shù)天,甚至更長(zhǎng)時(shí)間。可以說,Zebra讓FPGA對(duì)于開發(fā)者成了“透明”的,他們可以在NN模型訓(xùn)練好之后,無縫地從CPU或GPU切換到FPGA進(jìn)行推理,而無需花費(fèi)更多的時(shí)間!

目前,Zebra可以支持Caffe、Caffe2、MXNet和TensorFlow等主流NN框架。在硬件方面,Zebra已經(jīng)可以完美地支持Xilinx的系列加速卡,如Alveo U200、Alveo U250和Alveo U50等。對(duì)于開發(fā)者來說,“一旦將FPGA板插入PC,只需一個(gè)Linux命令”,F(xiàn)PGA就能夠代替CPU或GPU立即進(jìn)行無縫的推斷,可以在更低的功耗下將計(jì)算速度提高一個(gè)數(shù)量級(jí)。對(duì)用戶來說,這無疑是一種即插即用的體驗(yàn)。

圖1,Zebra可適應(yīng)由GPU加速器訓(xùn)練的NN,并無縫地在FPGA上部署

強(qiáng)強(qiáng)聯(lián)手,全生態(tài)支持

更好的消息是:為了能夠加速更多AI應(yīng)用的落地,安富利亞洲和 Mipsology 達(dá)成了合作協(xié)議,將向其亞太區(qū)客戶推廣和銷售 Mipsology 這一獨(dú)特的 FPGA 深度學(xué)習(xí)推理加速軟件 —— Zebra。

這對(duì)于合作的雙方無疑是一個(gè)雙贏的局面:對(duì)于Mipsology來說,可以讓Zebra這個(gè)創(chuàng)新的工具以更快的速度覆蓋和惠及更多的開發(fā)者;對(duì)安富利來說,此舉也進(jìn)一步擴(kuò)展了自身強(qiáng)大的物聯(lián)網(wǎng)生態(tài)系統(tǒng),為客戶帶來更大的價(jià)值,為希望部署DL的客戶提供一整套全面的服務(wù),包括硬件、軟件、系統(tǒng)集成、應(yīng)用開發(fā)、設(shè)計(jì)鏈和專業(yè)技術(shù)。

安富利推理加速成功應(yīng)用案例:智能網(wǎng)絡(luò)監(jiān)控平臺(tái)AI Bluebox

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22036

    瀏覽量

    618085
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103528
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4938

    瀏覽量

    131192
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279310
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122772
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    榮獲Bourns三項(xiàng)大獎(jiǎng)

    近日,憑借卓越表現(xiàn)榮膺由Bourns公司頒發(fā)的三項(xiàng)大獎(jiǎng)——“2024年度最佳分銷商”、 “2024年度最佳生意增長(zhǎng)” 及“2024年度最佳設(shè)計(jì)獎(jiǎng)”。以上榮譽(yù)不僅是對(duì)
    的頭像 發(fā)表于 05-17 13:58 ?993次閱讀

    攜手Nordic、TDK聯(lián)合在線直播

    隨著AI大模型推動(dòng)物聯(lián)網(wǎng)(IoT)向邊緣端加速滲透,如何在資源受限的終端設(shè)備上高效部署AI成為各個(gè)行業(yè)的核心挑戰(zhàn)。本次直播將深度解析
    的頭像 發(fā)表于 05-09 14:22 ?438次閱讀

    亮相第十八屆中國(guó)電子信息年會(huì)

    此前,2025年4月17日至21日,在成都舉辦的第十八屆中國(guó)電子信息年會(huì)上,中國(guó)區(qū)團(tuán)隊(duì)攜手AMD以及戰(zhàn)略合作伙伴共同亮相,帶來多款展品,聚焦人工智能、邊緣計(jì)算、FPGA開發(fā)等領(lǐng)域
    的頭像 發(fā)表于 05-08 16:51 ?669次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>富</b><b class='flag-5'>利</b>亮相第十八屆中國(guó)電子信息年會(huì)

    【米爾MYC-YM90X路飛龍DR1開發(fā)板】路科技 SALDRAGON開發(fā)板介紹

    。 Demo程序:預(yù)置工業(yè)相機(jī)圖像采集Demo、機(jī)器人運(yùn)動(dòng)控制Demo及邊緣AI推理Demo,加速項(xiàng)目啟動(dòng)。 SALDRAGON系列是路科技在高端
    發(fā)表于 04-28 17:57

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫(kù)與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的
    的頭像 發(fā)表于 03-21 12:01 ?692次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫(kù)加速并擴(kuò)展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴(kuò)展 AI 工廠中的 AI
    的頭像 發(fā)表于 03-20 15:03 ?641次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首次實(shí)現(xiàn)集成,以幫助全球企業(yè)組織
    發(fā)表于 03-19 15:24 ?355次閱讀
    Oracle 與 NVIDIA 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    最新研究解讀AI應(yīng)用的核心趨勢(shì)與挑戰(zhàn),助力中國(guó)工程師把握AI機(jī)遇

    最新發(fā)布的年度研究報(bào)告顯示 ,包括中國(guó)工程師在內(nèi)的全球工程師普遍認(rèn)為AI具有廣泛的應(yīng)用潛力,但目前難以確定AI將對(duì)哪個(gè)具體領(lǐng)域產(chǎn)生最大
    發(fā)表于 03-03 17:42 ?208次閱讀
    <b class='flag-5'>安</b><b class='flag-5'>富</b><b class='flag-5'>利</b>最新研究解讀<b class='flag-5'>AI</b>應(yīng)用的核心趨勢(shì)與挑戰(zhàn),助力中國(guó)工程師把握<b class='flag-5'>AI</b>機(jī)遇

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    。? AI加速器的開發(fā):FPGA被廣泛用于開發(fā)專為AI算法優(yōu)化的加速器,例如深度學(xué)習(xí)推理
    發(fā)表于 03-03 11:21

    當(dāng)我問DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    資源浪費(fèi)。例如,在深度學(xué)習(xí)模型推理階段,FPGA可以針對(duì)特定的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行硬件加速,提高推理速度。 3.支持邊緣計(jì)算與實(shí)時(shí)應(yīng)用 ? 邊緣計(jì)算:隨著物聯(lián)網(wǎng)的發(fā)展,越來越多的
    發(fā)表于 02-19 13:55

    存儲(chǔ)需要Passion!德明PCIe Gen5 SSD加速AI應(yīng)用落地

    存儲(chǔ)需要Passion!德明PCIe Gen5 SSD加速AI應(yīng)用落地
    的頭像 發(fā)表于 01-21 16:33 ?680次閱讀
    存儲(chǔ)需要Passion!德明<b class='flag-5'>利</b>PCIe Gen5 SSD<b class='flag-5'>加速</b><b class='flag-5'>AI</b>應(yīng)用落地

    FPGA和ASIC在大模型推理加速中的應(yīng)用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGA和ASIC進(jìn)行推理加速的研究也越來越多,從目前的市場(chǎng)來說,有些公司已經(jīng)有了專門做推理的ASIC,像Gro
    的頭像 發(fā)表于 10-29 14:12 ?2003次閱讀
    <b class='flag-5'>FPGA</b>和ASIC在大模型<b class='flag-5'>推理</b><b class='flag-5'>加速</b>中的應(yīng)用

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速解決方案。無論是在復(fù)雜的
    的頭像 發(fā)表于 10-27 10:03 ?810次閱讀
    NVIDIA助力麗蟾科技打造<b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    推出新品牌Tria?以整合嵌入式計(jì)算選項(xiàng)

    宣布推出新品牌Tria ” 宣布推出新品牌Tria和名為Tria Technolog
    的頭像 發(fā)表于 09-03 18:45 ?952次閱讀

    LLM大模型推理加速的關(guān)鍵技術(shù)

    LLM(大型語言模型)大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),旨在提高模型在處理復(fù)雜任務(wù)時(shí)的效率和響應(yīng)速度。以下是對(duì)LLM大模型推理加速關(guān)鍵技術(shù)的詳細(xì)探討,內(nèi)容將涵蓋模型壓縮、
    的頭像 發(fā)表于 07-24 11:38 ?1796次閱讀
    主站蜘蛛池模板: 国产女人视频 | 你懂的视频在线看 | 你懂得国产 | 国产伦子系列视频6 | 五月综合激情视频在线观看 | 俺也来国产精品欧美在线观看 | 日本高清视频色 | 中文字幕在线观看第一页 | 全免费a级毛片免费看不卡 全日本爽视频在线 | 国产人成午夜免视频网站 | 日本三级最新中文字幕电影 | 欧美熟夫| 亚洲成人网在线播放 | 污污视频在线免费看 | 色视频免费看 | 夜夜艹| 成人夜色| 小毛片在线观看 | 国产精品久久国产三级国不卡顿 | 久操青青 | 亚洲免费一级片 | 午夜影院免费观看视频 | 黄色网址网站在线观看 | 88xx成人永久免费观看 | 亚洲一区二区免费在线观看 | 欧美a区| 美女屁屁免费视频网站 | 国产精品一区二区三 | 欧美一区二区高清 | 亚洲系列_1页_mmyy11 | 性福利视频| 午夜视频精品 | 丰满寡妇一级毛片 | 久久天天躁狠狠躁狠狠躁 | 四只虎免费永久观看 | 日本不卡毛片一二三四 | 一区免费视频 | 人人澡人人澡碰人人看软件 | 久久婷婷丁香七月色综合 | 欧美三级大片在线观看 | 成人拍拍视频 |