在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何選擇高效的深度學習硬件?剖析GPU、FPGA、ASIC和DSP

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-11-19 10:20 ? 次閱讀

深度學習最近取得的成功勢不可擋:從圖像分類和語音識別到圖片標注、理解視覺場景、視頻概述、語言翻譯、繪畫,甚至是生成圖像、語音、聲音和音樂!隨著我們的家變得越來越智能,你會發現許多設備都會需要連續地使用深度學習應用、收集和處理數據。

所以我們需要新的硬件,一個比 Intel Xeon 所驅動的服務器更加高效的硬件。一個英特爾服務器 CPU 可能會消耗 100-150 瓦功率并需要一個有著冷卻裝置的超大系統來支持其性能的正常發揮。

還有哪些其它的選擇?

圖形處理器GPU 現場可編程的邏輯器件、FPGA(現場可編程門陣列/Field-Programmable Gate Array) 定制芯片、特殊應用型集成電路ASIC、[**芯片**](http://pubads.g.doubleclick.net/gampad/clk?id=132505090&iu=/122049170/TEXT_AD)系統或 [**SoC**](http://pubads.g.doubleclick.net/gampad/clk?id=132505090&iu=/122049170/TEXT_AD) 數字信號處理器、DSP 未來的、外星人發明的、由新的物理定律所發展出的技術

GPU

GPU 最早是為生成基于多邊形網絡的計算機圖形而設計的。在最近幾年,由于近來計算機游戲和圖形引擎領域的需求和復雜度需要,GPU 積累了強大的處理性能。英偉達是 GPU 領域的領軍者,能生產有數千個內核的處理器,這些內核的設計工作效率可以達到 100%。實際上這些處理器也非常適用于運行神經網絡和矩陣乘法方面的計算。注意,矩陣向量的乘法運算被認為是「尷尬的并行(embarrassingly parallel)」,因為它可以通過簡單的算法擴展被并行化(它們缺少分支因而可以避免緩存信息丟失)。

Titan X 是訓練深度學習模型的一個最得力的助手。它擁有 3500 多個內核,每秒能夠執行超過 11 萬億次浮點運算。更多測試性能方面的信息請參考這里(https://github.com/soumith/convnet-benchmarks)。

由于 GPU 的超多核(~3500 個,對比 Intel Xeon 的 16 個/ Xeon Phi 的 32 個),英特爾的 CPU 和英偉達的 GPU 之間的競爭助長了后者的發展,使其 GPU 比 CPU 在時鐘頻率快 2~3 倍。GPU 核是更為復雜(分支預測和流程)的 CPU 核的流線型版本,但是前者許多都支持更高級別的并行運算,因而擁有更好的性能。

這種 GPU 很擅長訓練深度學習系統——卷積神經網絡或者循環神經網絡。它們可以在僅僅幾毫秒之內就運行一批 128 或 256 張圖像。但是它們同時也會消耗大約 250 瓦的功率并且需要一個完整的計算機來支持運行,這又消耗了額外的 150 瓦的功率。一個高性能的 GPU 系統至少需要消耗 400 瓦的功率。

這并不適用于增強現實眼鏡、無人機手機、移動設備和小型機器人。甚至對于未來的消費級自動駕駛汽車來說也是不可接受的。

英偉達正在致力于開發效率更高的器件,比如 Tegra TX1、TX2(深度神經網絡需要 12 瓦的能耗和每秒 ~100 千兆次浮點運算的性能,TX2 需要的更多)和更強大的 Drive PX(250 瓦,與一個 Titan X 的消耗量差不多)。

這里還要注意,在自動駕駛汽車和智能攝像機中,直播視頻是必要的而圖像批處理是不可能實現的,因為視頻需要針對及時響應進行實時處理。

一般 GPU 的水平大約是 5 G-flops/s per W。如果我們想在移動系統中部署深度學習解決方案,那我們還需要更好的方法!

FPGA

Xilinx 等公司的現代 FPGA 器件就是電子元器件中的樂高。我們可以使用其電路作為模塊來構建出整個定制微處理器和復雜的異構系統。而在最近幾年,FPGA 開始生產出越來越多的乘累加計算模塊。這些 DSP 模塊正如其名,能夠執行乘法運算并可以被排列到一起來進行一定量的并行運算。

我們將 FPGA 應用于神經網絡的研究歷史已有 10 年時間。我們的工作始于來自紐約大學的 Yann LeCun 的開創性工作,尤其是 Clement Farabet。我們的協同合作制造出了 NeuFlow,它是一個復雜的、用于運行神經網絡的數據流處理器。

從 2011 年到 2015 年早期,我們完善了一個全新的設計——nn-X。這項工作是由 Berin Martini 和 Vinayak Gokhale(來自我們的辦公室)領導的。這套系統可以在 4 瓦的功率電力預算下實現 200 G-ops/s 的速度,也即 50 G-ops/s/W,這個結果幾乎是 GPU 性能的 10 倍。

但是 nn-X 有兩個很大的問題:

當固定的卷積引擎(convolutional engine)未被使用時其利用率會很低

高內存帶寬

第一個問題是由于 nn-X 采用了固定的 10x10 卷積引擎,而當它在執行 3x3 卷積時,只有 9% 的 DSP 單元得到了有效利用。這一點后來是通過將一個 12x12 的網格分為 4x4 單元的 3x3 卷積器而得以解決。不幸的是該系統還需要高內存帶寬,因為它并沒有使用數據緩存且需要從內存中讀取輸入并直接將結果保存在內存中。像這樣的 nn-X 不能進行擴展,且其 DPS 單元的利用率永遠不會超過 75–80%。

設計方面有類似限制的系統也會有性能方面的限制。

我們所需的是一個帶有數據緩存的系統,它可以使用任意組 DPS 單元來有效地(近乎 100% 地)利用資源。這種系統有 Microsoft Catapult 和我們的 SnowFlake 加速器,后者的利用率幾乎可以達到 100%(更多內容即將呈現)。

微軟使用 Altera 器件來實現創紀錄的深度神經網絡處理性能。不幸的是它并不是一個商業化的系統,而是一項微軟的數據中心資產,因而還未對公眾開放。中國的科技巨頭企業百度也加入了這一隊列。

定制 SoC

高通AMDARM、英特爾和英偉達都在致力于將定制化芯片整合進它們的現有解決方案中。Nervana 和 Movidius(目前都在英特爾旗下)已經或者說正在開發集合方案。SoC 在同一技術節點上所能提供的性能大約是 FPGA 系統的 10 倍,在特定結構中還要更高。由于 SoC 和處理器所需的功率變得越來越低,其區別將來自于新的集合內存系統和帶寬對外部存儲器的有效利用。在這一領域,整合為 systems-on-a-package(SOP)的 3D memory 至少可以節約 10 倍的功率。

DSP

DSP 已經存在了很長一段時間,它最初是用來執行矩陣算法的。但到目前為止,DSP 并沒能真正提供任何有用的性能或是可以與 GPU 相匹敵的器件。為什么會這樣呢?其主要原因就是核數量。DSP 主要用于電信系統,且無需擁有 16 個或 32 個以上的核。其工作負載并不需要這么多。相反,GPU 負載在近 10~15 年間一直在增加,因此它需要更多的核。最終,大約從 2006 年開始,英偉達的 GPU 在性能上就超過了 DSP。

Texas Instruments 公司還在開發 DSP,但是我們從中并沒有看到任何有競爭力的性能。且許多 DSP 也已經被 FPGA 取代了。

Qualcomm 在它們的 SoC 中使用 DSP,并且其性能會有所加速,但是目前還沒有足夠多的信息來將它與其它的解決方案進行比較。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1644

    文章

    21993

    瀏覽量

    615336
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11054

    瀏覽量

    216264
  • 深度學習
    +關注

    關注

    73

    文章

    5557

    瀏覽量

    122579

原文標題:剖析GPU、FPGA、ASIC和DSP,如何選擇高效的深度學習硬件?

文章出處:【微信號:FPGAer_Club,微信公眾號:FPGAer俱樂部】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    相比GPU和GPP,FPGA深度學習的未來?

    相比GPU和GPP,FPGA在滿足深度學習硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和
    發表于 07-28 12:16 ?7551次閱讀

    到底什么是ASICFPGA

    ASICFPGA的區別,還有它們和CPU、GPU之間的區別。 ASICFPGA,本質上都是芯片。AISC是全定制芯片,功能寫死,沒辦法
    發表于 01-23 19:08

    FPGA深度學習應用中或將取代GPU

    ,這使得它比一般處理器更高效。但是,很難對 FPGA 進行編程,Larzul 希望通過自己公司開發的新平臺解決這個問題。 專業的人工智能硬件已經成為了一個獨立的產業,但對于什么是深度
    發表于 03-21 15:19

    FPGA深度學習能走多遠?

    FPGA 也需要不斷適應和改進。研究人員和開發者將致力于針對 FPGA 的特點對深度學習算法進行優化,例如探索更高效的模型壓縮方法、量化技
    發表于 09-27 20:53

    FPGA 超越 GPU,問鼎下一代深度學習主引擎

    的合著者之一,說:“深度學習是AI中最令人興奮的領域,因為我們已經看到了深度學習帶來的巨大進步和大量應用。雖然AI 和DNN 研究傾向于使用 GPU
    發表于 04-27 14:10

    【詳解】FPGA深度學習的未來?

    學習硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和高效的能耗,FPGA將在一般的深度
    發表于 08-13 09:33

    軟件無線電設計中選擇ASICFPGADSP需要考慮哪些因素?

    ASICFPGADSP的應用領域呈現相互覆蓋的趨勢,使設計人員必須在軟件無線電結構設計中重新考慮器件選擇策略問題。從可編程性、集成度、開發周期、性能和功率五個方面探究,你會發現軟件
    發表于 08-16 07:51

    軟件無線電設計中ASICFPGADSP該怎么選擇

    ASICFPGADSP的應用領域呈現相互覆蓋的趨勢,使設計人員必須在軟件無線電結構設計中重新考慮器件選擇策略問題。
    發表于 09-02 07:58

    DSPFPGA有哪些異同

    硬件DSP:是ASIC,如同CPU/GPU一樣,適合量產,降低成本,缺點是(硬件)設計一旦確定,便不易于修改。
    發表于 07-28 09:06

    FPGAASIC/GPU NN實現進行定性的比較

    的快速發展以及新一代設備的不斷出現也時刻改變著競爭格局。二、為什么選擇FPGA?如圖所示神經網絡實現的硬件架構范例。GPU是具有高靈活性的通用硬件
    發表于 02-08 15:26

    什么是深度學習?使用FPGA進行深度學習的好處?

    深度學習計算而優化的 ASIC 被推向市場,GPU 配備了專門用于深度學習的電路。基于這些,不
    發表于 02-17 16:56

    FPGAASIC將在機器學習領域崛起

    盡管GPU仍是當前的機器學習市場的主流,但有產業觀察家已經預見了FPGAASIC在機器學習領域的崛起。Deloitte Global分析指
    的頭像 發表于 01-06 10:01 ?5244次閱讀

    深度學習方案ASICFPGAGPU比較 哪種更有潛力

    幾乎所有深度學習的研究者都在使用GPU,但是對比深度學習硬鑒方案,ASIC
    發表于 02-02 15:21 ?1.1w次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>方案<b class='flag-5'>ASIC</b>、<b class='flag-5'>FPGA</b>、<b class='flag-5'>GPU</b>比較 哪種更有潛力

    GPU和GPP相比誰才是深度學習的未來

    相比GPU和GPP,FPGA在滿足深度學習硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計算的能力和
    發表于 10-18 15:48 ?1615次閱讀

    FPGA深度學習領域的未來會有怎樣的發展

    近十年來,人工智能又到了一個快速發展的階段。深度學習在其發展中起到了中流砥柱的作用,盡管擁有強大的模擬預測能力,深度學習還面臨著超大計算量的問題。在
    發表于 10-22 15:26 ?1181次閱讀
    主站蜘蛛池模板: 91日本在线观看亚洲精品 | 香蕉久久夜色精品国产2020 | 激情综合色综合啪啪开心 | avtt香蕉 | 亚洲精品一线二线三线 | 日本高清一区二区三区不卡免费 | 男人的天堂色偷偷 | 国产九色在线 | 狠狠色丁香婷婷第六色孕妇 | 久久久国产精品免费 | 日本.www| 亚洲最大毛片 | 日本xxxx色视频在线观看 | 久久黄色精品视频 | 国模私拍福利一区二区 | 李老汉和小花的性生生活 | 三级黄色在线视频中文 | 日本黄色网址视频 | 色老头网站久久网 | 日本黄色录像视频 | 五月婷久久 | 四虎成人免费影院网址 | 免费国产成人α片 | 国产精品福利在线观看免费不卡 | 成人夜色视频网站在线观看 | 新版天堂资源中文在线 | 精品在线一区二区三区 | 在线看av网址 | 一级一级18女人毛片 | 看视频免费网址 | 日本一区二区三区在线 视频观看免费 | 午夜啪视频 | 图片区网友自拍另类图区 | 国产精品www夜色影视 | 美女一级毛片毛片在线播放 | 美女扒开尿口给男人爽的视频 | 国产一级毛片国语版 | 久久久久国产精品免费免费 | 久久深夜福利 | 丝袜美腿视频一区二区三区 | 免费公开视频人人人人人人人 |