91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

最新一代深度神經網絡推理裝置xDNN的部分規格參數

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-08-31 09:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繼年初發布新一代FPGA框架后,FPGA巨頭賽靈思在Hot Chips大會揭露了最新一代深度神經網絡推理裝置xDNN的部分規格參數。隨著更多定制芯片的發展,現如今AI芯片的戰火已經蔓延到推理領域。賽靈思的xDNN可配置、可復寫,進行多任務處理,還配有Tensor內存。

目前來看,FPGA可能沒有像一些人預期的那樣在深度學習的訓練空間中占據一席之地,但AI推理的低功耗、高頻率需求非常適合可重復編程硬件的性能曲線。

然而,現在人們越來越專注于推理與訓練的新體系架構,FPGA也在努力在定制化硬件領域保持領先,而這要靠一些高級編程工具來降低編程的復雜度。

目前,要判斷通用CPUGPU、FPGA及定制芯片如何才能吸引最廣泛的用戶群還為時尚早,但基于云的FPGA以及不斷發展的高級FPGA集,越來越多地作為實驗工具使用,讓FPGA在面向推理的任務中占據了一席之地。

考慮到所有這些因素,FPGA制造商Xilinx近日在Hot Chips大會上發布了Xilinx深度神經網絡推理(xDNN)設備的一些參數細節,公司將在接下來10月1日舉行的開發者大會上發布更多信息和性能基準。

就在幾年前,神經網絡訓練處理器還是架構展上的耀眼明星,但最近,GPU已經在與定制化、專門化的ASIC芯片和其他通用硬件展開激烈競爭,眼下戰火又蔓延到了推理任務領域。

Xilinx的數據中心和IP總監Rahul Nimaiyar上周在Hot Chips大會上表示,用FPGA執行推理任務具備堅實的硬件基礎。FPGA的數據處理并行的,并且支持數據重用、數據壓縮,能夠應對數據稀疏。

xDNN處理器的2D二維MAC陣列,靈活的高帶寬片載存儲器,支持多種方式訪問,讓數據的傳輸和轉移更加高效。此外,xDNN還支持靈活的數據類型(FP32 / FP16及INT 16/8/4/2等)。

xDNN是一個可配置、可復寫的處理器,可以映射到FPGA上而無需重新編程。Xilinx還提供了深度神經網絡特定指令集(如卷積,最大池化等),可適用于任何網絡和任何大小的圖像,還可以編譯和運行新網絡。也就是說,xDNN可以與TensorFlow一起使用,無需重新編程或更改FPGA。

Virtex硬件可以用于幾種類型的存儲器;從位于DSP模塊旁邊的分布式基礎RAM到UltraRAM,再到高帶寬內存和外部DDR4內存都可以,從而實現計算效率的優化和性能提升。

上圖是一個通道并行脈動陣列(channel parallel systolic arrays)的放大示意圖,圖中所示為分布式加權緩沖區。處理元件被加權映射到DSP塊上,具體權重保存在處理旁邊分布式RAM中,該RAM容量很小,速度很快。換句話說,這些分布式RAM就是權重緩存。

xDNN的“Tensor內存”位于脈動陣列的旁邊,并存儲輸入和輸出的特征映射。該部分也是并行通道,因此該陣列中的每個行都與一行內存相關聯。也就是說,xDNN可以進行多任務處理,在陣列上進行計算,同時還可以根據需要引入新的網絡層。

與其他面向推理任務的芯片一樣,xDNN也在芯片內壓縮了盡量多的內置存儲器,以保持芯片的活性。這是一種比較艱難的平衡做法,目的是為了保證計算效率,從下面的基準測試結果來看,Xilinx的配置似乎是有效的。

除了硬件之外,提升易用性也是關鍵問題,無論是對于那些使用F1進行深度學習的人,還是用FPGA編程實現更精細的點的人來說,編譯器和運行時間都是關鍵指標。

上圖是關于Xilinx為用戶開發的機器學習工具套件的更多信息,實際上,這是一個允許用戶連接至框架的API,可以更容易地在Tensorflow中獲得經過訓練的模型和權重,例如,將其轉換為一個Xilinx圖,在它到達編譯器之前通過一些優化,生成所有必要的指令集,以便在xDNN上運行該網絡。

Xilinx還提供了一個量化器,可以將經過訓練的權重數據輸入到一些校準集中,以找到范圍并快速獲得這些權重的量化結果。

Nimaiyar表示,Xilinx已經抽取出了產生有效推理的其他元素,包括操作的融合(一旦訪問被激活,這些操作直接作為流程運算符執行,而不再返回Tensor Memory),當特征映射大小超過片載存儲器空間時,會進行指令級的并行化處理,和自動將映射在層內平鋪,這意味著xDNN可以處理任何規模的特征映射。

上圖的稀疏基準測試是Xilinx在其開發者論壇上發布的結果,到目前為止,60-80%的跨框架高效數據表現已經足夠令人期待。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103656
  • AI芯片
    +關注

    關注

    17

    文章

    1983

    瀏覽量

    35917

原文標題:【AI芯展開推理戰】賽靈思最新深度神經網絡推理器xDNN參數曝光

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大模型推理顯存和計算量估計方法研究

    (如全連接層、卷積層等)確定所需的顯存大小; (3)將各層顯存大小相加,得到模型總的顯存需求。 基于神經網絡剪枝的顯存估計 神經網絡剪枝是種減少模型參數數量的技術,可以降低顯存需求。
    發表于 07-03 19:43

    BP神經網絡與卷積神經網絡的比較

    BP神經網絡與卷積神經網絡在多個方面存在顯著差異,以下是對兩者的比較: 、結構特點 BP神經網絡 : BP神經網絡
    的頭像 發表于 02-12 15:53 ?673次閱讀

    BP神經網絡的優缺點分析

    BP神經網絡(Back Propagation Neural Network)作為種常用的機器學習模型,具有顯著的優點,同時也存在些不容忽視的缺點。以下是對BP神經網絡優缺點的分析
    的頭像 發表于 02-12 15:36 ?926次閱讀

    BP神經網絡深度學習的關系

    BP神經網絡深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 、BP神經網絡的基本概念 BP神經網絡,即反向傳播
    的頭像 發表于 02-12 15:15 ?863次閱讀

    深度學習入門:簡單神經網絡的構建與實現

    深度學習中,神經網絡是核心模型。今天我們用 Python 和 NumPy 構建個簡單的神經網絡神經網絡由多個
    的頭像 發表于 01-23 13:52 ?532次閱讀

    人工神經網絡的原理和多種神經網絡架構方法

    在上篇文章中,我們介紹了傳統機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經網絡的原理和多種神經網絡架構方法,供各位老師選擇。 01 人工神經網絡 ? 人工
    的頭像 發表于 01-09 10:24 ?1209次閱讀
    人工<b class='flag-5'>神經網絡</b>的原理和多種<b class='flag-5'>神經網絡</b>架構方法

    卷積神經網絡與傳統神經網絡的比較

    神經網絡,也稱為全連接神經網絡(Fully Connected Neural Networks,FCNs),其特點是每層的每個神經元都與下
    的頭像 發表于 11-15 14:53 ?1878次閱讀

    深度學習中的卷積神經網絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經網絡作為深度學習的個分支,因其在圖像處理任務中的卓越性能而受到廣泛關注。 卷積
    的頭像 發表于 11-15 14:52 ?847次閱讀

    RNN模型與傳統神經網絡的區別

    神經網絡是機器學習領域中的種強大工具,它們能夠模擬人腦處理信息的方式。隨著技術的發展,神經網絡的類型也在不斷增加,其中循環神經網絡(RNN)和傳統
    的頭像 發表于 11-15 09:42 ?1133次閱讀

    LSTM神經網絡的結構與工作機制

    的結構與工作機制的介紹: 、LSTM神經網絡的結構 LSTM神經網絡的結構主要包括以下幾個部分: 記憶單元(Memory Cell) : 記憶單元是LSTM
    的頭像 發表于 11-13 10:05 ?1632次閱讀

    LSTM神經網絡與傳統RNN的區別

    深度學習領域,循環神經網絡(RNN)因其能夠處理序列數據而受到廣泛關注。然而,傳統RNN在處理長序列時存在梯度消失或梯度爆炸的問題。為了解決這問題,LSTM(長短期記憶)神經網絡
    的頭像 發表于 11-13 09:58 ?1218次閱讀

    Moku人工神經網絡101

    不熟悉神經網絡的基礎知識,或者想了解神經網絡如何優化加速實驗研究,請繼續閱讀,探索基于深度學習的現代智能化實驗的廣闊應用前景。什么是神經網絡?“人工
    的頭像 發表于 11-01 08:06 ?667次閱讀
    Moku人工<b class='flag-5'>神經網絡</b>101

    國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

    是面向單片機的超輕量級的神經網絡推理庫,即 TinyML 推理庫,可以讓你在任意單片機上運行輕量級深度學習模型~ 開源地址:https://github.com/sipeed/Tin
    發表于 08-09 18:26

    國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

    D9360國產開發板)的TinyMaxi輕量級的神經網絡推理庫方案測試。 算力測試 TinyMaix 是面向單片機的超輕量級的神經網絡推理庫,即 TinyML
    發表于 08-07 18:06

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的深度
    的頭像 發表于 07-24 10:42 ?1209次閱讀
    主站蜘蛛池模板: 黄蓉吕文德欲乱系列小说 | 亚洲色五月 | 奇米米奇777 | 91视频污污版 | 色视频网站在线观看 | 免费在线亚洲 | 欧美黑人5o厘米全进去 | 丁香花在线观看免费观看 | 噜噜噜色噜噜噜久久 | www.欧美成 | 精品伊人久久大线蕉地址 | 窝窝午夜看片免费视频 | 午夜影院a | 国产成人乱码一区二区三区 | 天天色天天色 | 天堂中文资源网 | 天堂网www中文在线资源 | 亚洲小视频在线播放 | 玖玖激情| eeuss秋霞成人影院 | 欧美 亚洲 国产 丝袜 在线 | 久久综合社区 | 开心色xxxx | 1515hh四虎免费观38com | 在线视频 亚洲 | 免费一级在线 | 日本欧美一区二区免费视 | 天天干天天色天天 | 国产福利不卡一区二区三区 | 好硬好湿好爽再深一点h视频 | 亚洲影院手机版777点击进入影院 | 婷婷综合久久中文字幕蜜桃三 | 日本不卡视频一区二区三区 | 成人网中文字幕色 | 三级毛片在线看 | 亚洲一区欧美日韩 | 日韩写真在线 | 丁香花在线电影小说观看 | 免费看黄的视频网站 | 黄色网址 在线播放 | 噜噜噜狠狠夜夜躁 |