在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

超高數據流通量FPGA新品類中的Block RAM級聯架構

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-13 17:24 ? 次閱讀

概述

隨著數據中心人工智能自動駕駛、5G、計算存儲和先進測試等應用的數據量和數據流量不斷增大,不僅需要引入高性能、高密度FPGA來發揮其并行計算和可編程硬件加速功能,而且還對大量數據在FPGA芯片內外流動提出了更高的要求。于是,在FPGA芯片中集成包括片上二維網絡(2D NoC)和各種最新高速接口的新品類FPGA芯片應運而生,成為FPGA產業和相關應用的新熱點。

拉開這場FPGA芯片創新大幕的是全球最大的獨立FPGA技術和產品提供商Achronix半導體公司,其采用7nm工藝打造的Achronix Speedster7t FPGA不僅擁有諸多高性能外圍Hard IP,而且是全球首次在FPGA的邏輯陣列上集成了2D NoC,一經推出就在市場得到了積極的響應,并引來競爭對手的模仿和跟隨。

Speedster7t這款專門針對人工智能/機器學習AI / ML)和高帶寬應用進行優化的高性能、高密度FPGA,包括了革命性的二維片上網絡(2D NoC)、新型機器學習處理器(MLP)、400G以太網和PCIe Gen5端口,以及高帶寬GDDR6和DDR4/5存儲控制器。Speedster7t FPGA架構如圖1所示。

1657089879405201.png

圖1 Speedster7t FPGA結構圖

Achronix Speedster7t FPGA除了在外圍Hard IP上都采用目前業內領先的大帶寬高速率IP,在內部的可編程邏輯的架構中也做了大量的優化去進一步提高內部可編程邏輯的性能,從而適配外圍IP超高帶寬需求。本文首先談談Speedster7t FPGA的片上SRAM,也就是Block RAM針對傳統的結構所做出的一些優化。

Speedster7t FPGA中可編程邏輯的架構

Speedster7t FPGA中內部的可編程資源是按列排布,包括LUT、FF、ALU、MUX、MLP、Block RAM、Logic RAM。如圖2所示。

1657089875958025.png

圖2 Speedster7t FPGA可編程邏輯結構

其中MLP、Block RAM、Logic RAM是集成在一起,他們之間的連接用的是專有的走線,不占用可編程邏輯走線資源,這樣做的目的主要是為了提高性能,同時也可以節省可編程邏輯走線資源,這個架構對于AI,還有需要用到MLP的一些復雜算法的性能優化是非常明顯的,在我們的MLP系列文章中會詳細講到,這里我們只重點說一下Block RAM。

Speedster7t FPGA的Block RAM特點

Speedster7t FPGA內部的Block RAM是一個容量為72k bit的簡單雙端口RAM,有一個讀端口,一個寫端口。兩個端口的時鐘完全獨立,并且可以完全獨立的配置讀寫位寬。它可以靈活的配置成簡單雙端口RAM或者ROM。

Block RAM的主要特性如表1所示。

表1 Block RAM的關鍵特性

1657089871438834.png

Block RAM框圖如圖3所示。

1657089865325548.png

圖3 Block RAM內部結構

Speedster7t FPGA的Block RAM級聯結構

Speedster7t FPGA的Block RAM最大的特點是增加了Block RAM間的級聯走線,級聯走線是BRAM間專有的連線,不占用可編程邏輯的走線資源,可以極大的提升多個Block RAM級聯的性能。圖4顯示了Block RAM間級聯走線的架構。

1657089856243927.png

圖4 Block RAM級聯結構

由圖4可以看出,讀寫地址線和數據線都有專有的級聯線連接。這樣的架構在一些場景中都會有應用,比如:需要從外部端口接收數據或者從GDDR6讀數據去初始化大量Block RAM的場景,AI的神經網絡就是一個典型的應用,在每一層的卷積算法中,系統都會從GDDR6讀出圖像數據和權重數據放入每個引擎的Block RAM中,引擎計算完畢以后再存入到GDDR6中供下一次運算使用。

有了這樣的級聯架構,我們在寫入數據去初始化大量Block RAM的時候不需要外部數據有很大的扇出,直接通過同一列Block RAM的級聯線就可以輕松完成,具體實現可以參考Achronix MLP_Conv2D參考設計。另外一個例子就是在需要多個Block RAM去構成更大容量的RAM的時候,如果利用級聯線可以大大提升系統的性能。我們針對這個專門做了一個工程比較一下,生成一個位寬64bit,深度16384的一個簡單雙端口RAM,需要用到16個Block RAM。我們分別用專有級聯線和內部可編程邏輯去拼深度兩種方法來對比??梢钥吹接脤S械募壜摼€資源更省,而且性能有了很大的提高。

使用專有的級聯線資源占用和性能:

1657089847479587.jpg

使用可編程邏輯資源占用和性能:

1657089840385167.jpg

后面我們會繼續深入了解Speedster7t FPGA可編程邏輯的各種特性,并且會用一些例子來說明如何更高效的利用這些特性,以將Speedster7t這款業界首創的高數據帶寬FPGA芯片與更多的創新智能化應用結合起來。

此外,Achronix也提供Speedcore嵌入式FPGA硅知識產權(IP)產品,用來幫助用戶在應用規模進一步擴大后,去開發帶有eFPGA邏輯陣列的ASIC或者SoC產品,它們由Achronix的ACE FPGA開發工具提供支持,從而可以重用FPGA開發成果,這是Achronix在率先引入2D NoC和MLP之外,另一個層面上的創新。

責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1643

    文章

    21984

    瀏覽量

    614998
  • 嵌入式
    +關注

    關注

    5143

    文章

    19567

    瀏覽量

    315609
  • 數據
    +關注

    關注

    8

    文章

    7246

    瀏覽量

    91266
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    FPGABlock RAM級聯架構給AI/ML帶來超高數據流通量

    隨著數據中心、人工智能、自動駕駛、5G、計算存儲和先進測試等應用的數據量和數據流量不斷增大,不僅需要引入高性能、高密度FPGA來發揮其并行計算和可編程硬件加速功能,而且還對大量
    發表于 07-06 15:48 ?1241次閱讀
    <b class='flag-5'>FPGA</b>的<b class='flag-5'>Block</b> <b class='flag-5'>RAM</b><b class='flag-5'>級聯</b><b class='flag-5'>架構</b>給AI/ML帶來<b class='flag-5'>超高</b><b class='flag-5'>數據流通量</b>

    FPGARAM的分布和特性

    在選擇FPGA時,關注LUT(Look-Up Table)和BRAM(Block RAM)是非常重要的,因為它們是FPGA架構
    的頭像 發表于 11-21 15:03 ?3709次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>中</b>塊<b class='flag-5'>RAM</b>的分布和特性

    ?Achronix定制單元塊大幅提升Speedcore eFPGA性能

    【導讀】為了滿足人工智能、機器學習、無人駕駛、ADAS等應用提出的越來越高的特殊計算需求,Achronix宣布為其eFPGA IP解決方案推出Speedcore定制單元塊,這是一種可以將功耗和面積降至最低、同時將數據流通量最大化的解決方案。
    發表于 10-19 11:28 ?1191次閱讀

    請問9K Block RAM設計那些2 9K Block RAM在哪里?

    嗨,我想為我的設計使用比特流加密,我遇到了一個關于9K Block RAM的問題,在答案記錄39999描述了r然后我決定在我的設計刪除所有9k
    發表于 06-06 07:23

    RAM數據流不起作用

    的6個原型運行良好。當我連接到FPGA上的參考電壓IO時,其中2個變為不同的電阻值,因此RAM數據流不起作用。我手動手動測試參考電壓引腳以排除出售的問題。在我的工作板上,我在參考電壓
    發表于 06-20 15:21

    FPGA 內部詳細架構 精選資料分享

    互連線資源(Interconnect)4.嵌入式塊 RAM(BRAM)(Block RAM)5.底層內嵌功能單元6.內嵌專用硬核7.致謝FPGA 芯片整體
    發表于 07-30 08:10

    基于FPGA芯片的數據流結構分析

    Virtex 型FPGA 芯片是Xilinx 公司芯片系列的一種,Virtex 系列的數據流及配置邏輯與XC4000 的數據流及配置邏輯有顯著不同,但卻與Xilinx 的
    發表于 11-18 11:37 ?2631次閱讀

    如何用FPGABlock RAM性能實現HDTV視頻增強算法灰度直方圖統計

    本文介紹了如何在FPGA 利用Block RAM 的特殊結構實現HDTV視頻增強算法灰度直方圖統計。
    的頭像 發表于 07-10 08:10 ?3116次閱讀

    如何使用Block RAM及利用其功能和性能優勢

    了解新的Block RAM級聯功能,如何使用它,以及如何利用其功能和性能優勢。
    的頭像 發表于 11-23 06:56 ?5222次閱讀

    xilinx 7系列FPGA里面的Block RAM

    些大材小用,因此xilinx公司在其FPGA內部專門集成了很多存儲器模塊,稱作Block RAM,其猶如slice海洋當中的一顆顆明珠,專門實現數據暫存功能,且每個時鐘區域都布置了若干
    的頭像 發表于 11-23 14:08 ?8638次閱讀
    xilinx 7系列<b class='flag-5'>FPGA</b>里面的<b class='flag-5'>Block</b> <b class='flag-5'>RAM</b>

    FPGARAM存儲資源詳細資料說明

    本文檔的主要內容詳細介紹的是FPGARAM存儲資源詳細資料說明包括了:1、 FPGA存儲資源簡介,2、 不同廠家的 Block RAM
    發表于 12-09 15:31 ?10次下載
    <b class='flag-5'>FPGA</b>的<b class='flag-5'>RAM</b>存儲資源詳細資料說明

    FPGAblock ram的特殊用法列舉

    FPGAblock ram是很常見的硬核資源,合理的利用這些硬件資源一定程度上可以優化整個設計,節約資源利用率,充分開發FPGA芯片中的
    的頭像 發表于 12-24 14:28 ?1557次閱讀

    使用FPGA調用RAM資源的詳細說明

    RAM),其中BRAM是block ram,是存在FPGA的大容量的RAM,DRAM是
    發表于 12-30 16:27 ?9次下載

    FPGA在一個時鐘周期可以讀取多個RAM數據嗎?

    設計都涉及到對RAM的讀寫操作。在FPGA芯片中,RAM也叫做存儲塊(Block RAM),可以存儲大量的
    的頭像 發表于 10-18 15:28 ?1654次閱讀

    可信數據流通網絡(TDN)白皮書

    二是明晰 TDN 的可信數據流通關鍵技術范疇。從保障數據隱私安全、流通過程可控可信、跨節點跨平臺跨技術互聯互通等角度歸納、分析實現數據可信流通
    的頭像 發表于 11-06 16:50 ?2031次閱讀
    可信<b class='flag-5'>數據流通</b>網絡(TDN)白皮書
    主站蜘蛛池模板: 色免费观看 | 国产黄色小视频在线观看 | 男男h全肉耽污 | 男人的天堂免费网站 | 视频黄色在线 | 国产在线理论片免费播放 | 99热热热| 国产精品女人在线观看 | 天天色综合天天 | 亚洲综合五月天 | 色视频在线观看在线播放 | 日本一区二区三区四区视频 | 老师下面很湿很爽很紧 | 欧美日韩国产在线一区 | 欧美午夜网站 | 好男人社区在线观看www | 天天干中文字幕 | 日韩欧美亚洲综合久久影院d3 | 亚洲综合涩 | 中文字幕av一区二区三区 | 亚洲天堂最新地址 | 一区二区视频 | 性做久久久久久久免费观看 | 欧美综合精品一区二区三区 | 天天色播 | 国产性色视频 | 成人免费无毒在线观看网站 | 国产色婷婷精品综合在线手机播放 | 亚洲精品你懂的 | 成人在线一区二区 | 亚洲一区在线免费观看 | 日本a级片免费 | 国产精品资源 | 91综合网| 奇米影色777四色在线首页 | 国产欧美综合在线 | 高清性欧美xxx | 国产激情三级 | 四虎精品久久 | 午夜影院在线视频 | 黄色三级录像 |