在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RapidStream:FPGA HLS設計的并行物理實現

SSDFans ? 來源:SSDFans ? 作者: EVE ? 2022-05-25 09:50 ? 次閱讀

FPGA的布局布線軟件向來跑得很慢。事實上,FPGA供應商已經花了很大的精力使其設計軟件在多核處理器上運行得更快。

最近,在ACM的FPGA 2022會議上發表了一篇題為“RapidStream: FPGA HLS設計的并行物理實現”的論文,論文中描述了一種非常有趣的方法,通過FPGA設計軟件推動HLS設計更快地運行在多核處理器上。

這篇論文由UCLA、AMD-Xilinx、根特大學和康奈爾大學的研究團隊撰寫,描述了RapidStream自動分區算法,將數據流設計分割成多個“island”,在劃分的island之間插入“anchor regions”,然后通過anchor regions中的寄存器將每個island的信號連起來整合到整個設計中。

所有這些劃分和拼接背后的目的是將HLS設計分割成小塊,交付給現代服務器中的多個核心。這種策略已經有悠久的歷史,現在被用于加速FPGA的開發。

這個過程有三個主要的HLS級約束:

1、非重疊分區——并行化不同island的物理實現;

2、流水線化的island間連接——每個island間連接都流水線化,以滿足時序要求;

3、直接連接——每個island只能與相鄰的island直接連接。當并行化設計布局布線時,這個約束是至關重要的。

(注意:這些約束與用于控制邏輯綜合的各種約束完全不同,它處于一個更高的層次。)

RapidStream的開發者將數據流設計定義為一組并行處理元素(processing element,簡稱PE)和一組根據設計的數據流需求將PE連接起來的FIFO。PE內部可以很復雜,但只能通過FIFO接口與其他PE進行數據通信

如上所述,RapidStream將FPGA fabric劃分為兩種region:大小相同的region和在相鄰region之間以窄列和行放置的anchor region。有趣的是,RapidStream似乎是專門為AMD-Xilinx Virtex UltraScale+ FPGA構建的,這是由FPGAchiplet(AMD-Xilinx語言中的超級邏輯區域,簡稱SLR)制成的2.5D器件。

a247143c-dbbf-11ec-ba43-dac502259ad0.png

這篇論文包含了幾個描述RapidStream工作性能的圖表。下圖顯示了在分區后,六種不同的數據流設計與沒有分區的流水線/非流水線版本時鐘速率的比較。

a2b9d65c-dbbf-11ec-ba43-dac502259ad0.png

從上圖可以看出,RapidStream比所有非流水線版本的時鐘速率更高。這是意料之中的,因為流水線是FPGA時鐘速度改進的核心。然而,六種情況中,有五種情況RapidStream的結果比相同設計的流水線RTL版本要好,這個結果要引起我們的注意。

下面是布局布線的時間結果對比:

a33394ce-dbbf-11ec-ba43-dac502259ad0.png

RapidStream的布局布線運行時間比未分區設計的結果要好得多。這是因為RapidStream可以將每個分區送給不同的處理器核心來布局布線。

雖然FPGA供應商試圖讓布局布線算法在多核處理器上工作得更快,但RapidStream的開發人員根據經驗發現,如果FPGA設計沒有分區,在超過兩個處理器核心上運行AMD-Xilinx Vivado設計工具時并沒有太大改善。

如果有讀者正在用FPGA開發HLS設計——特別是AMD-Xilinx FPGA,那么應該會對RapidStream感興趣。更細節的內容可以在GitHub上找到。

原文標題:HLS分區加速FPGA布局布線!

文章出處:【微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21798

    瀏覽量

    606065
  • Xilinx
    +關注

    關注

    71

    文章

    2171

    瀏覽量

    122153
  • 布局布線
    +關注

    關注

    1

    文章

    88

    瀏覽量

    15198
  • HLS
    HLS
    +關注

    關注

    1

    文章

    130

    瀏覽量

    24208

原文標題:HLS分區加速FPGA布局布線!

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于FPGA實現圖像直方圖設計

    簡單,單采用FPGA實現直方圖的統計就稍顯麻煩。若使用Xilinx和Altera的FPGA芯片,可以使用HLS來進行圖像的加速處理。但這暫時不是我的重點。 用C語言
    的頭像 發表于 12-24 10:24 ?227次閱讀
    基于<b class='flag-5'>FPGA</b><b class='flag-5'>實現</b>圖像直方圖設計

    助力AIoT應用:在米爾FPGA開發板上實現Tiny YOLO V4

    受限的設備上運行,尤其在低功耗、實時檢測的邊緣計算設備中表現出色。相比傳統 GPU,FPGA 能在小面積和低功耗下實現類似的推理性能,非常契合 AIoT 應用。像米爾 ZU3EG 這樣的 FPGA
    發表于 12-06 17:18

    如何在FPGA實現按鍵消抖

    FPGA(現場可編程門陣列)中實現按鍵消抖是一個重要的設計環節,特別是在處理用戶輸入時,由于物理按鍵的機械特性和電氣特性,按鍵在按下和釋放的瞬間會產生抖動現象,這種抖動可能導致系統錯誤地識別為多次
    的頭像 發表于 08-19 18:15 ?2230次閱讀

    優化 FPGA HLS 設計

    減少錯誤并更容易調試。然而,經常出現的問題是性能權衡。在高度復雜的 FPGA 設計中實現高性能需要手動優化 RTL 代碼,而這對于HLS開發環境生成的 RTL 代碼來說是不可能的。然而,存在一些解決方案
    發表于 08-16 19:56

    FPGA在人工智能中的應用有哪些?

    以承擔機器人路徑規劃、環境感知、運動控制等任務,結合外部傳感器的反饋信息,實現高效、準確的機器人控制系統。 四、優勢總結 高并行性:FPGA的高并行性使其在處理大規模
    發表于 07-29 17:05

    在多FPGA集群上實現高級并行編程

    今天我們看的這篇論文介紹了在多FPGA集群上實現高級并行編程的研究,其主要目標是為非FPGA專家提供一個成熟且易于使用的環境,以便在多個并行
    的頭像 發表于 07-24 14:54 ?1398次閱讀

    基于FPGA的圖像采集與顯示系統設計

    源和固有的并行處理能力,在數字信號處理、硬件加速、汽車電子等領域得到了廣泛應用。在圖像采集與顯示系統中,FPGA能夠實現高速、并行的數據處理,顯著提高系統的實時性和性能。本文設計了一個
    的頭像 發表于 07-17 10:58 ?2080次閱讀

    一種在HLS中插入HDL代碼的方式

    很多人都比較反感用C/C++開發(HLSFPGA,大家第一拒絕的理由就是耗費資源太多。但是HLS也有自己的優點,除了快速構建算法外,還有一個就是接口的生成,尤其對于AXI類接口,按照標準語法就可以很方便地生成相關接口。
    的頭像 發表于 07-16 18:01 ?829次閱讀
    一種在<b class='flag-5'>HLS</b>中插入HDL代碼的方式

    請問如何使用fx3芯片來對FPGA進行并行配置?

    我閱讀過AN84868,了解到fx3可以對連接的FPGA芯片進行串行配置;但是我的項目中,希望能盡量縮短FPGA配置的時間,因此希望能夠了解是否有辦法使用fx3芯片對外接的FPGA芯片進行并行
    發表于 05-28 08:30

    基于FPGA的網絡加速設計實現

    首先是FPGA硬件的變化太多,各個模塊可配參數的變化(比如卷積模塊并行數的變化),另外一個是網絡模型多種多樣以及開源的網絡模型平臺也很多(tensorflow,pytorch等)。網絡壓縮也有很多種算法,這些算法基本上都會導致網絡模型精度的降低。
    發表于 04-08 09:48 ?1102次閱讀
    基于<b class='flag-5'>FPGA</b>的網絡加速設計<b class='flag-5'>實現</b>

    # FPGA 編程如何工作?

    FPGA 在提高智能電網的可擴展性和性能方面非常有用,同時仍保持低功耗。 =#3。= 航空航天和國防 飛機有時會飛過惡劣的環境。因此,制造公司生產抗輻射和抗輻射 FPGA,與傳統 ASIC 實現
    發表于 03-30 11:50

    為何高端FPGA都非常重視軟件

    和Achronix在其設備架構中都采取了一些新穎的架構步驟,以幫助實現當今大型復雜設計的時序收斂。 但是,賽靈思在FPGA領域也領導了高級綜合(HLS)領域,而且Vivado HLS
    發表于 03-23 16:48

    fpga雙口ram的使用

    FPGA雙口RAM的使用主要涉及配置和使用雙端口RAM模塊。雙端口RAM的特點是有兩組獨立的端口,可以對同一存儲塊進行讀寫操作,從而實現并行訪問。
    的頭像 發表于 03-15 13:58 ?1113次閱讀

    fpga芯片的主要特點包括 fpga芯片上市公司

    FPGA芯片的主要特點包括以下幾個方面: 高性能和實時性:FPGA芯片由數百萬個邏輯單元組成,因此具有并行處理能力,其運行速度遠超單片機和DSP。這種并行計算能力使得
    的頭像 發表于 03-14 16:46 ?1259次閱讀

    如何使用FPGA驅動并行ADC和并行DAC芯片?

    ADC和DAC是FPGA與外部信號的接口,從數據接口類型的角度劃分,有低速的串行接口和高速的并行接口。
    的頭像 發表于 02-22 16:15 ?4088次閱讀
    如何使用<b class='flag-5'>FPGA</b>驅動<b class='flag-5'>并行</b>ADC和<b class='flag-5'>并行</b>DAC芯片?
    主站蜘蛛池模板: 色偷偷免费视频 | 奇米影视亚洲春色77777 | 七月婷婷精品视频在线观看 | 久久国内视频 | 亚洲国产午夜精品理论片的软件 | 丁香花在线影院观看在线播放 | 九色在线观看视频 | 亚洲成人网在线 | 色第一页 | 五月婷婷激情五月 | 中国一级特黄真人毛片免费看 | 久久99精品久久久久久园产越南 | 91久操| 免费看国产一级特黄aa大片 | 国产色妞妞在线视频免费播放 | 亚洲免费网站 | 亚洲精品香蕉婷婷在线观看 | 中国china体内裑精亚洲毛片 | 欧美成人性动漫在线观看 | 日韩精品免费一级视频 | 男操女免费视频 | 亚洲天堂成人在线 | 成年人一级毛片 | 一区二区三区伦理 | 亚州视频一区二区 | 天天av天天翘天天综合网 | 国产黄色大片又色又爽 | 夜夜骑日日射 | 99久久99久久 | 一级a爱片久久毛片 | 国产剧情麻豆三级在线观看 | 午夜神马福利免费官方 | 日本成人资源 | 久久影视免费体验区午夜啪啪 | 亚洲成人网在线观看 | 91日韩精品天海翼在线观看 | 夜色爽爽| 老司机精品免费视频 | 四虎国产精品永久在线 | 免费在线观看的视频 | 99热这里只有精品一区二区三区 |