在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

寫RTL代碼時,盡可能地做到代碼風格與硬件結構相匹配

FPGA技術驛站 ? 來源:Lauren的FPGA ? 作者:Lauren的FPGA ? 2020-09-24 14:02 ? 次閱讀

兩個數相加,三個數相加有什么不同 接下來,我們考慮4個32-bit有符號數相加該如何實現,其中目標時鐘頻率仍為400MHz。以UltraScale Plus系列芯片為目標芯片。 第一種方案:四個數直接相加此方案對應的電路圖如下圖所示。這里不難看出關鍵路徑是三個加法器所在路徑,這將是時序收斂的瓶頸。

此電路對應的SystemVerilog代碼如下圖所示。

從綜合后的結果來看,邏輯級數最高為7。

第二種方案:加法樹

加法樹的結構如下圖所示,兩兩相加。與第一種方案相比,可以有效降低邏輯級數。

此電路對應的SystemVerilog代碼如下圖所示。

從綜合后的結果來看,邏輯級數最高為6。 第三種方案:加法鏈之所以選用加法鏈的結構是因為DSP48本身就是這種鏈式結構。對應的電路如下圖所示。其中a0和a1端口有一級寄存器,a2端口有兩級寄存器,a3端口有三級寄存器。

此電路對應的SystemVerilog代碼如下圖所示。

接下來,我們對這三種方案進行比較,如下圖所示。不難看出,第一種方案邏輯級數最高,消耗的LUT也最多,時序結果也是最差的(盡管達到了收斂的目的)。后兩種方案不相上下。

如果將這三種方案通過綜合屬性USE_DSP使其映射到DSP48上,結果如何呢?如下圖所示。不難看出,第一種方案只消耗了兩個DSP,資源利用率最低,但時序也是最糟糕的。后兩種方案都用了三個DSP,但第三種方案由于可以很好地匹配硬件結構,故時序最好。

對比下來不難得出這樣的結論:寫RTL代碼時,盡可能地做到代碼風格與硬件結構相匹配,可達到更好的性能。

Tcl之$$a 80%的概率...... AI Engine到底是什么?

ACAP不可不知的幾個基本概念

嵌套的for循環,到底對哪個執行pipeline更好

HLS中循環的并行性(2)

HLS中循環的并行性(1)

HLS優化方法DATAFLOW你用了嗎

HLS中如何控制流水程度

Vivado HLS學習資料有哪些

如何查看可綜合C代碼的中間結果

如何在C代碼中插入移位寄存器

HLS IP Library? HLS Math Library:csim ?C/RTL co-sim(2) HLS Math Library:csim ?C/RTL co-sim(1) 加法運算很簡單? AXI-4 Lite與AXI-4 Memory Mapped有什么區別? 深入理解AXI-4 Memory Mapped 接口協議 AXI是Interface還是Bus? 如何閱讀時序報告 時序報告要看哪些指標 如何使set_max_delay不被覆蓋 一些小巧的IP IP是用DCP還是XCI? 如果使用第三方綜合工具,Xilinx IP… IP生成文件知多少 IP的約束需要處理嗎? IP為什么被Locked? copy_ip你用過嗎? IP是XCI還是XCIX 如何降低OSERDES/CLK和CLKDIV的Clock Skew 如何獲取Device DNA 談談設計復用 過約束到底怎么做 時序收斂之Baseline 什么情況下要用OOC綜合方式 異步跨時鐘域電路該怎么約束 如何復用關鍵路徑的布局布線信息 Vivado學習資料有哪些? 異步跨時鐘域電路怎么設計 ECO都有哪些應用 FPGA中的CLOCK REGION和SLR是什么含義 FPGA中的BEL, SITE, TILE是什么含義 約束文件有哪些 如何高效復用Block的位置信息? 如何復用關鍵寄存器的位置信息 部分可重配置都生成哪些.bit文件 VIO你用對了嗎 Device視圖下能看到什么 Schematic視圖下能看到什么 都是pin,有什么區別 都是net,有什么區別 如何快速查找目標cell 學習筆記:深度學習與INT8 學習筆記:多層感知器 學習筆記:單層感知器的局限性 學習筆記:單層感知器基礎知識 學習筆記:神經網絡學習算法 學習筆記:神經網絡模型 學習筆記:ReLU的各種變形函數 學習筆記:神經元模型(2) 學習筆記:神經元模型(1) 學習筆記:深度學習之“深” 學習筆記:深度學習之“學習” 學習筆記:人工智能機器學習和深度學習 2019文章匯總

原文標題:加法樹還是加法鏈?

文章出處:【微信公眾號:Lauren的FPGA】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 電路圖
    +關注

    關注

    10404

    文章

    10735

    瀏覽量

    541467
  • 32-bit
    +關注

    關注

    0

    文章

    7

    瀏覽量

    6462

原文標題:加法樹還是加法鏈?

文章出處:【微信號:Lauren_FPGA,微信公眾號:FPGA技術驛站】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    分析C語言代碼結構的設計問題

    來分析一個C語言代碼結構的設計問題。 這段代碼,使用了兩次malloc,分別給 p1 和 p2 申請了內存。用完后,內存釋放,防止內存泄漏。 大家覺得,這樣的代碼設計有沒有問題。
    的頭像 發表于 02-11 09:31 ?331次閱讀

    什么樣的代碼會被編譯器優化

    現在的編譯器有多智能,可能你辛辛苦苦代碼,在編譯器看來就是幾句廢話,直接被刪除掉。
    的頭像 發表于 01-16 16:38 ?527次閱讀

    如何寫出穩定的單片機代碼

    這篇文章分享怎么寫出穩定的單片機代碼。? ?? 我對優秀代碼的理解,大體分為兩個部分:高效和穩定。 ? 兩者都能做到很好的,如果靠自己摸索,沒有刻意去練習,可能需要花10年,甚至更久
    的頭像 發表于 11-15 16:40 ?766次閱讀
    如何寫出穩定的單片機<b class='flag-5'>代碼</b>

    汽車異構硬件平臺開發如何進行靜態代碼分析

    隨著汽車軟件開發復雜度的提升,異構硬件平臺的應用已成為必然趨勢。多編譯器環境的引入不僅是技術發展的自然產物,更是解決日益增長的功能需求和技術挑戰的有效途徑。在此背景下,Helix QAC 作為一款
    的頭像 發表于 10-09 16:15 ?801次閱讀
    汽車異構<b class='flag-5'>硬件</b>平臺開發如何進行靜態<b class='flag-5'>代碼</b>分析

    Verilog 如何做到心中有電路?

    :要在 Verilog 代碼做到心中有電路,可以嘗試以下方法: 深入學習數字電路基礎知識:包括各種邏輯門、組合邏輯電路、時序邏輯電路的原理和結構,理解它們的工作方式和功能。 分解復
    發表于 09-26 20:30

    ida反編譯出來代碼能直接用嗎

    一些有助于人類閱讀但不影響機器執行的元信息,如注釋、文檔字符串以及某些編譯時優化的細節。因此,反編譯出來的代碼可能無法完全還原原始代碼的意圖和結構。 二、依賴性問題 即使反編譯出來的
    的頭像 發表于 09-02 10:55 ?1352次閱讀

    hex文件如何查看原c語言代碼

    直接將 .hex 文件轉換回原始的 C 語言代碼是不可能的,因為 .hex 文件是二進制文件,它包含了單片機程序編譯后的機器碼,這些機器碼與原始的 C 語言代碼結構和表達上存在巨大的
    的頭像 發表于 09-02 10:37 ?4612次閱讀

    低噪聲放大器的第一級放大電路要盡可能的放大,為什么?

    為什么低噪聲放大器的第一級放大電路要盡可能的放大?
    發表于 08-30 07:40

    為了盡可能的消除模擬開關的影響,xtr105的電壓至少需要多少伏?

    開關,那么RZ,Rg應該怎么確定阻值,模擬開關應該算進線路電阻中嗎?。為了盡可能的消除模擬開關的影響,xtr105的電壓至少需要多少伏?Q1選擇除了datasheet中給的三個選項有可以替代的嗎,三個三極管好像都是比較老的產品了。最后,xtr105的輸出可以直接連到ADC上嗎?
    發表于 08-26 06:27

    請問怎樣修改電路使帶寬盡可能加寬到200MHz以上,增益不要有太大的波動?

    在此電路中輸入為100mV,但是在50MHz到100MHz才能進行五倍的增益,超過這個頻率就會迅速衰減,我想請問怎樣修改電路使帶寬盡可能加寬到200MHz以上,增益不要有太大的波動謝謝。
    發表于 08-23 07:04

    軟件設計哲學:新“代碼整潔之道”

    ”、“方法長度最多不要超過 5 行”和“優秀的代碼都是自解釋的,很少會有注釋”等等觀點奉為圭臬,但是由于其成書較早,其中的一些觀點顯然已經不再使用當前業務開發環境了。就拿前兩點來說,看上去能讓每個小方法盡可能
    的頭像 發表于 07-22 12:18 ?455次閱讀
    軟件設計哲學:新“<b class='flag-5'>代碼</b>整潔之道”

    請問stm32f103VCT6的spi1的兩處接口可以混用嗎?

    我在設計硬件時spi連岔了線,為了盡可能少改動已有的線,我發現spi1在stm32f103vct6上有兩處。我想用PB5作為MOSI,用PA5PA6作為SCK和MISO,但是在cubemx設置發現不能同時設置,如果不用cubemx而是靠標準庫
    發表于 07-22 07:32

    電路的阻抗如何匹配

    電路的阻抗匹配是指調整電路組件(包括源和負載)之間的阻抗,使電源能盡可能多地傳遞能量,而不是產生反射。當源、傳輸線以及負載的阻抗都相等時,可以達到最佳的阻抗匹配,從而最大限度地減少信號的反射和損耗
    的頭像 發表于 06-28 08:29 ?3503次閱讀
    電路的阻抗如何<b class='flag-5'>匹配</b>

    該如何提高代碼容錯率、降低代碼耦合度?

    提高RT-Thread代碼的容錯率和降低耦合度是確保代碼質量和可維護性的關鍵,下面列舉了幾種在編寫代碼時,提高代碼容錯率和降低耦合度的思路。讓我們一起來看看吧~一、提高
    的頭像 發表于 06-26 08:10 ?1105次閱讀
    該如何提高<b class='flag-5'>代碼</b>容錯率、降低<b class='flag-5'>代碼</b>耦合度?

    ESP32在不使用WiFi或藍牙時如何裁剪代碼以縮小編譯出的固件大小?

    ESP32在不使用WiFi或藍牙時如何裁剪代碼以縮小編譯出的固件大小? 作為對比,ESP32編譯出的bin文件大小為300KB(未使用WiFi和藍牙),原先使用STM32實現相同功能時的bin文件大小約100KB。 固件大小對OTA所花的時間有很大影響,因此希望能盡可能
    發表于 06-21 14:48
    主站蜘蛛池模板: 久久综合狠狠综合久久综合88 | 狠狠色丁香久久婷婷 | 性欧美一区| 如色网 | 天天综合天天看夜夜添狠狠玩 | 免费在线a视频 | 女人69xxx| 欧美日韩a级a | 欧美在线一区二区三区 | 国产三级自拍视频 | 欧美日韩a级a | 成人精品一区二区不卡视频 | 日本一级大片 | 巨臀中文字幕一区二区翘臀 | 色狠狠综合网 | 日本精品视频 | 男人j进入女人j在线视频 | 四虎国产精品视频免费看 | 四虎伊人 | 欧美另类丰满69xxxxx | 美女流白浆网站 | 欧美色伊人 | 新版天堂中文资源官网 | 特级毛片aaaa级毛片免费 | 在线不卡一区 | 日本特黄特色免费大片 | 在线视频一区二区 | 天天狠天天插 | 爱操成人网 | 日本三级hd高清电影 | 色一情一乱一乱91av | 亚洲区视频在线观看 | 美女扒开尿口让男人桶 | www.欧美色图 | 欧美不卡1卡2卡三卡老狼 | 在线天堂中文有限公司 | sihu国产午夜精品一区二区三区 | 天天狠狠 | 亚偷熟乱区视频在线观看 | 久久综合色婷婷 | 午夜剧场官网 |