在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Achronix Speedster7t FPGA芯片中2D NoC的設計細節

Achronix ? 來源:Achronix ? 作者:Achronix ? 2022-04-21 09:27 ? 次閱讀

摘要

隨著旨在解決現代算法加速工作負載的設備越來越多,就必須能夠在高速接口之間和整個器件中有效地移動高帶寬數據流。Achronix的Speedster7t獨立FPGA芯片可以通過集成全新的、高度創新的二維片上網絡(2D NoC)來處理這些高帶寬數據流。Achronix的FPGA中特有的2D NoC實現是一種創新,它與用可編程邏輯資源來實現2D NoC的傳統方法相比,有哪些創新和價值呢?本白皮書討論了這兩種實現2D NoC的方法,并提供了一個示例設計,以展示與軟2D NoC實現相比,Achronix 2D NoC是如何去提高性能、減少面積并縮短設計時間。

介紹

Achronix為其Speedster7t系列FPGA完全重新設計了片上通信架構,通過集成創新的2D NoC來適應高帶寬數據流的需求。在該FPGA器件的外圍,這個2D NoC連接到所有高速接口:包括多個400G以太網、PCIe Gen5、GDDR6和DDR4/5端口。在該FPGA內的可編程邏輯陣列上部署了一系列高速行和列通道,它們分別向FPGA可編程邏輯陣列的水平和垂直方向分配網絡流量。除了這些行和列之外,在NoC的每一行和每一列交叉的位置還有發送點和目標NoC訪問節點(NAP)。這些NAP充當NoC和位于可編程邏輯陣列中的資源之間的源或目的地。

為了將Achronix FPGA中內置的2D NoC,與使用傳統方法在可編程邏輯陣列中創建的NoC進行比較,為此我們評估了幾種軟NoC設計;最后,基于同行評審和FPGA結構的可移植性,我們選擇了米蘭理工學院的軟2D NoC(https://github.com/agalimberti/NoCRouter,2017)設計。這種軟NoC在單向網狀網絡(mesh)中實現了蟲洞前瞻預測切換。在實施時,它需要每個mesh節點上的多個存儲器來存儲和轉發流控制單元(flit)。

為了量化片上2D NoC實現模式和使用邏輯陣列資源的軟實現模式之間的差異,首先創建了一個實例化AlexNet 2D卷積的19個實例設計,然后在完整的2D NoC設計之間比較了三個主要指標:所需資源、設計性能和設計時間(創建設計的時間以及在工具中編譯設計的時間)。其結果是在所有三種情況下,集成Achronix 2D NoC的性能都明顯優于軟實現。

2D NoC減少使用的資源

為了比較兩種不同的2D NoC設計,兩種2D NoC都與現有的2D卷積(conv2d)設計相結合。conv2d設計對輸入圖像執行AlexNet 2D卷積。此conv2d設計需要一個或兩個AXI-4連接:一個用于從內存讀取,一個用于寫入內存,或者一個共享的AXI-4執行讀取和寫入。為了實現與軟NoC的最佳集成,選擇了單個共享AXI-4接口,conv2d模塊的實例位于每個mesh節點。然后,軟NoC啟用了GDDR6存儲接口的數據入口和出口——在軟NoC中,內存接口連接到第20個mesh節點上;而在內置式NoC中,這種連接已經存在。在整個設計中,從GDDR6到每個conv2d節點都存在節點到節點通信,但conv2d節點之間不通信。

Achronix 2D NoC的設計細節

該設計有19個conv2d模塊實例,每個實例都訪問GDDR6存儲器。第20個實例是空閑的,因為GDDR6接口直接連接到集成的2D NoC。80個可用的NoC接入點(NAP)中有38個用于連接到conv2d實例。每個conv2d實例使用64個機器學習處理器(MLP),它在垂直方向覆蓋兩個NAP。由于這種部署是針對內置2D NoC,所以采用雙AXI-4方法連接conv2d模塊。下表列出了本設計中使用的資源。

表1:Achronix 2D NoC使用的資源

5d7288fa-c107-11ec-bce3-dac502259ad0.png

使用Achronix FPGA集成的2D NoC,可為設計布局產生了一種不凌亂的、可重復的結構,并且只消耗了不到一半的器件資源。下面是AC7t1500器件中資源使用的平面圖。

5d828e26-c107-11ec-bce3-dac502259ad0.png

圖1:在AC7t1500中使用Achronix 2D NoC布局實例

軟2D NoC的設計細節

該設計被配置為5 × 4規模mesh,具有19個conv2d模塊實例,每個實例都連接到一個軟NoC節點。其第20 mesh節點是為GDDR6接口預留的。因此,需要更多的邏輯資源來管理軟2D NoC結構。此實現還需要每個節點上的存儲,以便存儲flit并將其轉發到下一個節點。結果是顯著提高了資源的使用量,以及在器件上的不規則布局。下表列出了使用的資源;下圖為AC7t1500所用資源的平面圖。

表2:軟2D NoC使用的資源

5db13e6a-c107-11ec-bce3-dac502259ad0.png

5dcaadd2-c107-11ec-bce3-dac502259ad0.jpg

圖2:使用軟2D NoC布局實例

2D NoC提高性能

如前所述,通過使用Achronix 2D NoC,conv2d設計產生了規則的資源布局,從而形成規則的布線。減少了邏輯資源使用就減少了擁塞,因為需要布線的邏輯更少。該解決方案實現了最高565 MHz的頻率,關鍵路徑包含在conv2d實例邏輯中。隨著更多conv2d節點添加到設計中,最大頻率不會降低。

下圖顯示了使用Achronix 2D NoC時產生的布線

5df57dc8-c107-11ec-bce3-dac502259ad0.jpg

圖3:使用Achronix 2D NoC的cnv2d設計布線

使用軟2D NoC解決方案會導致復雜且不規則的布線,同時時序也受到影響,因為需要深度LUT邏輯來選擇軟2D NoC中的適當路徑。

此外,性能會隨著mesh網絡大小的增加而降低。使用2 × 3 mesh的設計可以達到94 MHz,而5 × 4 mesh只能達到82 MHz。關鍵路徑包含在軟NoC mesh網絡中,而不是在conv2d邏輯中。如果花更多時間優化設計以提高性能,則可以進一步優化軟2D NoC的時序。

下圖顯示了使用軟2D NoC設計時生成的布線。

5e165732-c107-11ec-bce3-dac502259ad0.jpg

圖4:使用軟2D NoC時的cnv2d設計布線

2D NoC改善了帶寬

Achronix的2D NoC使用運行速度在2 GHz的256位雙向總線,每個conv2d實例連接到兩個NAP,從而在一個節點上與GDDR6接口之間的連接可實現的最大帶寬為512 Gbps。下面的框圖顯示了2D NoC和一個連接到本地conv2d實例的NAP的細節。

5e3e990e-c107-11ec-bce3-dac502259ad0.png

圖5:Achronix的2D NoC和NAP

軟2D NoC使用五路交叉開關(crossbar switch),其中一個端口與本地conv2d實例通信,而其他端口與網格中的下一個節點通信。該解決方案可以實現節點到節點連接的頻率為82 MHz,從而在一個節點上形成最高為21 Gbps的GDDR6接口帶寬。下面的框圖顯示了軟2D NoC mesh中的一個交叉開關。

5e5be860-c107-11ec-bce3-dac502259ad0.png

圖6:軟2D NoC交叉開關

2D NoC縮短了設計時間和工具運行時間

Achronix的2D NoC采用AXI-4標準與NAP通信,這是許多FPGA設計人員已經熟悉的接口標準。此外,2D NoC包括內置功能,例如跨時鐘域邏輯、流量控制和地址解碼等,這些功能不再需要包含在用戶邏輯中。Achronix的2D NoC的全功能實現為用戶省去了大量的設計工作,使設計人員能夠專注于連接到2D NoC的加速器。

除了縮短設計時間外,使用Achronix片上2D NoC的設計比使用軟2D NoC的設計使用更少的資源。結果是需要布局和布線的邏輯更少,從而使得工具的編譯時間更短。例如,與使用軟2D NoC的實現相比,使用Achronix片上2D NoC的設計布局和布線所需的時間不到一半。

結論

集成2D NoC的Speedster7t器件創新地帶來了FPGA設計過程的根本轉變。Achronix是第一家集成2D NoC的FPGA公司,它連接所有系統接口和FPGA邏輯陣列。這種新架構使Achronix FPGA器件特別適用于高帶寬應用,同時顯著提高了設計人員的工作效率。由于2D NoC管理著從設計在FPGA邏輯陣列中的數據加速器到高速數據接口之間的所有網絡功能,因此設計人員只需設計他們的數據加速器并將它們連接到NAP接入點。與使用軟2D NoC相比,設計人員可以受益于以下優點:

● 降低邏輯資源占有率并提高FPGA的整體性能

● 增加帶寬

● 減少對存儲器的需求

● 更快的設計時間和更短的工具編譯時間

表3:Speedster7t 2D NoC與Soft 2D NoC的總結比較

5e6e40b4-c107-11ec-bce3-dac502259ad0.png

如希望進一步了解Achronix Speedster7t FPGA芯片及其2D NoC可以發揮的巨大效用。

原文標題:Achronix在其先進FPGA中集成2D NoC以支持高帶寬設計(WP028)

文章出處:【微信公眾號:Achronix】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1643

    文章

    21985

    瀏覽量

    615080
  • 芯片
    +關注

    關注

    459

    文章

    52282

    瀏覽量

    437474
  • NoC
    NoC
    +關注

    關注

    0

    文章

    39

    瀏覽量

    11902
  • Achronix
    +關注

    關注

    1

    文章

    76

    瀏覽量

    22727

原文標題:Achronix在其先進FPGA中集成2D NoC以支持高帶寬設計(WP028)

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    TechWiz LCD 2D應用:不同結構下的VT曲線

    :550nm 電壓條件:Pixel:0~8V,1V(步長); Com:0V 4. 生成結果 3.1 結構 3.2 T-V 2D圖表
    發表于 06-13 08:44

    HT 可視化監控頁面的 2D 與 3D 連線效果

    HT 是一個靈活多變的前端組件庫,具備豐富的功能和效果,滿足多種開發需求。讓我們將其效果化整為零,逐一拆解具體案例,幫助你更好地理解其實現方案。 此篇文章中,讓我們一起深入探討 2D 與 3D
    的頭像 發表于 04-09 11:28 ?399次閱讀
    HT 可視化監控頁面的 <b class='flag-5'>2D</b> 與 3<b class='flag-5'>D</b> 連線效果

    TechWiz LCD 2D應用:半透反射式顯示模式仿真

    根據具體條件需求,在TechWiz LCD 2D中創建堆棧結構,修改模擬條件和各層屬性 3. 生成結果 3.1 半透反射式2D結構 3.2亮度圖表
    發表于 04-08 08:49

    STM8/STM32 products有2D marking和沒有2D marking的工藝有差別嗎?

    請教下,STM8/STM32 products 有2D marking 和沒有2D marking的工藝有差別嗎?同一程序在使用時有2D標識的不能用。
    發表于 03-07 07:21

    TechWiz LCD 2D應用:不同結構下的VT曲線

    :550nm 電壓條件:Pixel:0~8V,1V(步長); Com:0V 4. 生成結果 3.1 結構 3.2 T-V 2D圖表
    發表于 02-06 10:18

    Achronix與BigCat Wireless建立戰略合作伙伴關系

    Speedster7t FPGA上的創新機器學習處理器(MLP)來滿足無線應用中先進的信號處理要求,以及支撐未來的6G標準。此次合作旨在通過基于Achronix FPGA
    的頭像 發表于 11-21 10:58 ?649次閱讀

    Achronix Speedcore eFPGA的特性和功能

    Speedcore嵌入式FPGA(embedded FPGA,eFPGA)知識產權(IP)產品是Achronix公司于2016年推出的顛覆性技術,并于當年開始向最終客戶交付,目前出貨量
    的頭像 發表于 11-15 14:28 ?966次閱讀
    <b class='flag-5'>Achronix</b> Speedcore e<b class='flag-5'>FPGA</b>的特性和功能

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司聯合BittWare公司(Molex旗下的領先企業級FPGA加速器產品供應商)推出的一類全新的、面向高性能計算和數據加速應用的F
    的頭像 發表于 11-14 11:19 ?758次閱讀

    TAS5805的I2C地址配置的是7b:2D,8b:5A怎么出來是7b:2F,8b:5E?這個是什么原因?

    我們5805的I2C地址配置的是7b:2D,8b:5A,怎么出來是7b:2F,8b:5E?這個是什么原因? DVDD: 1.8V
    發表于 10-18 07:41

    Allegro推出2D霍爾效應速度和方向鎖存器

    對于天窗頂電機位置,升降門電機,車窗升降電機和電子駐車制動(EPB)系統等應用,透過使用單個2D磁性速度和方向傳感器,可以簡化系統設計和生產,減少BOM,并提高系統安全性。APS12625和APS12626系列2D霍爾效應2D
    的頭像 發表于 09-27 09:58 ?726次閱讀

    Achronix Speedster7t FPGA與GPU解決方案的比較

    這篇針對大模型推理跟GPU對比分析,雖然以Llama2為例,也適用于最新的Llama3,模型的日新月易也更進一步說明硬件平臺的可編程可擴展的重要性,FPGA是其中一個不錯的選擇。
    的頭像 發表于 09-18 16:19 ?702次閱讀
    <b class='flag-5'>Achronix</b> <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>與GPU解決方案的比較

    Primemas選擇Achronix eFPGA技術用于Chiplet平臺

    高性能 FPGA 和嵌入式FPGA (eFPGA) IP 的領導者 Achronix Semiconductor Corporation 和使用Chiplet 技術開發創新 SoC H
    的頭像 發表于 09-18 16:16 ?879次閱讀

    基于Achronix Speedster7t FPGA器件的AI基準測試

    Achronix半導體公司推出了為AI優化的Speedster7t系列FPGA芯片,該系列包含專門針對AI工作負載的強化計算引擎。隨著AI在各個領域變得普遍,在
    的頭像 發表于 09-18 16:10 ?961次閱讀
    基于<b class='flag-5'>Achronix</b> <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>器件的AI基準測試

    TMAG511x 2D鎖扣的優點

    電子發燒友網站提供《TMAG511x 2D鎖扣的優點.pdf》資料免費下載
    發表于 09-13 09:53 ?0次下載
    TMAG511x <b class='flag-5'>2D</b>鎖扣的優點

    采用創新的FPGA 器件來實現更經濟且更高能效的大模型推理解決方案

    本文根據完整的基準測試,將Achronix Semiconductor公司推出的Speedster7t FPGA與GPU解決方案進行比較,在運行同一個Llama2 70B參數模型時,該
    的頭像 發表于 06-19 15:53 ?559次閱讀
    采用創新的<b class='flag-5'>FPGA</b> 器件來實現更經濟且更高能效的大模型推理解決方案
    主站蜘蛛池模板: 免费啪视频在线观看 | 特黄特色三级在线观看 | 免费一级特黄特色黄大任片 | 国产成人mv 在线播放 | 在线天堂bt种子资源 | 久草毛片 | 大桥未久加勒比女热大陆在线 | 国内一级特黄女人精品毛片 | 香港澳门a级三级三级全黄 香港经典a毛片免费观看爽爽影院 | 欧美3d成人动画在线 | 国产午夜在线视频 | 日本黄视频在线播放 | 天天爱天天做色综合 | 成人在线视频网 | 香蕉视频色版在线观看 | 欧美性白人极品1819hd | 国内一国产农村妇女一级毛片 | 天堂视频免费在线观看 | 久久手机视频 | 天天噜夜夜操 | 午夜日韩视频 | 欧美一区二区三区在线观看 | 亚洲视频第一页 | 免费一级毛片私人影院a行 免费一级毛片无毒不卡 | 国产人成精品免费视频 | 天天色色网 | 手机看片自拍自自拍日韩免费 | 亚洲w码欧洲s码免费 | 国产性videostv另类极品 | 日本三级午夜 | 激情久久久久久久久久久 | 四虎成人在线视频 | 亚洲免费在线观看 | 婷婷网址| 久久草在线看 | 夜夜夜操 | 欧美性视频一区二区三区 | 在线你懂得 | 精品久久中文网址 | 色在线播放 | 四虎永久免费网站 |