在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么研究浮點加法運算,對FPGA實現方法很有必要?

FPGA設計論壇 ? 來源:未知 ? 2023-09-22 10:40 ? 次閱讀

e743e902-58f0-11ee-939d-92fbcf53809c.pnge754f292-58f0-11ee-939d-92fbcf53809c.png

點擊上方藍字關注我們

e75f6cc2-58f0-11ee-939d-92fbcf53809c.png

現代信號處理技術通常都需要進行大量高速浮點運算。由于浮點數系統操作比較復雜,需要專用硬件來完成相關的操作(在浮點運算中的浮點加法運算幾乎占到全部運算操作的一半以上),所以,浮點加法器是現代信號處理系統中最重要的部件之一。FPGA是當前數字電路研究開發的一種重要實現形式,它與全定制ASIC電路相比,具有開發周期短、成本低等優點。

但多數FPGA不支持浮點運算,這使FPGA在數值計算、數據分析和信號處理等方面受到了限制,由于FPGA中關于浮點數的運算只能自行設計,因此,研究浮點加法運算的FPGA實現方法很有必要。

1 IEEE 754單精度浮點數標準

浮點數可以在更大的動態范圍內提供更高的精度,通常,當定點數受其精度和動態范圍所限不能勝任時,浮點數標準則能夠提供良好的解決方案。

IEEE協會制定的二進制浮點數標準的基本格式是32位寬(單精度)和64位寬(雙精度),本文采用單精度格式。圖1所示是IEEE754單精度浮點數格式。圖中,用于單精度的32位二進制數可分為三個獨立的部分,其中第0位到22位構成尾數,第23位到第30位構成指數,第31位是符號位。

e7665398-58f0-11ee-939d-92fbcf53809c.jpg

實際上,上述格式的單精度浮點數的數值可表示為:

e773d4e6-58f0-11ee-939d-92fbcf53809c.jpg

上式中,當其為正數時,S為0;當其為負數時,S為1;(-1)s表示符號。指數E是ON255的變量,E減127可使指數在2-127到2128變化。尾數采用科學計算法表示:M=1.m22m21m20……m0。m22,m21,…,m0,mi為Mp的各位,設計時應注意尾數中隱含的整數部分1。0是一個特殊的數,0的指數位和尾數位均為0,符號位可以是1,也可以是0。

2電路的流水線結構

一般情況下,結構化設計是電路設計中最重要的設計方法之一,采用結構化設計方法可以將一個復雜的電路分割為獨立的功能子模塊,然后按一定的原則將各子模塊組合成完整的電路,這幾乎是電路設計的通用模式。這種設計方法便于設計人員分工合作、實現設計和功能測試,縮短上市時間、升級和二次開發,因而具有其它方法無法比擬的優勢。

結構化設計基本上可歸結為兩種方法:流水線(pipeline)和握手原則。其中握手原則適用于各功能子模塊內部運算比較復雜、數據運算時延(latency)不確定的設計。由于數據運算時延不確定,所以,各子模塊間的時序配合必須通過握手信號的交互才能完成。握手原則設計的電路一般采用復雜的有限狀態機(FSM)作為控制單元,工程設計難度大,故在設計時應慎重使用。流水線法適用于各功能子模塊內部運算簡單整齊、數據運算時延確定的設計。由于數據運算時延比較確定,各前后級功能子模塊不需要任何交互信號就能完成時序配合,故可方便地實現數據的串行流水運算。流水線控制比較簡單,一般不需要設計專門的有限狀態機,而且工程設計容易,設計時可優先選用。

3工程的FPGA實現

3.1開發環境和器件選擇

本工程開發可在FPGA集成開發環境QuartusII 8.0 spl中完成。OuartusⅡ是世界著名PLD設計生產廠商——Altera公司的綜合性PLD開發軟件,內嵌綜合器和仿真器,并有可與第三方工具協作的靈活接口,可以完成從設計輸入到硬件配置的完整PLD設計流程,而且運行速度快,界面統一,功能集中,易學易用。

本設計中的器件選用Stratix IIEP2S15F484C3。Stratix II是Altera公司的高性能FPGA Stratix系列的第二代產品,具有非常高的內核性能,在存儲能力、架構效率、低功耗和面市及時等方面均有優勢。

本系統的頂層框圖如圖2所示。為了顯示清楚,圖2被分成兩個部分顯示。本工程采用異步置位的同步電路設計方法,其中clk、reset、enab分別為系統時鐘、系統異步置位、系統使能信號。din_a、din_b分別為兩個輸入的單精度浮點數,data_out則是符合IEEE 754標準的兩輸入浮點數之和。

e78160fc-58f0-11ee-939d-92fbcf53809c.jpg

3.2浮點加法運算的實現

浮點加法運算可總結為比較、移位、相加、規范化等四個步驟,分別對應于compare、shift、sum、normalize四個模塊。

(1)compare模塊

本模塊主要完成兩輸入浮點數的比較,若din_a、din_b為兩個輸入單精度浮點數,則在一個時鐘周期內完成的運算結果如下:

◇大數指數b_exp這里的大數指絕對值的比較;

◇兩浮點數的指數差sube,正數;

◇大數尾數b_ma;

◇小數尾數s_ma,該尾數已加入隱含1;

◇和符號c_sgn,為確定輸出結果的符號;

◇加減選擇add_sub,兩輸入同符號時為0(相加)、異符號時為1(相減),sum模塊中使用實現加減選擇。

(2)shift模塊

shift模塊的作用主要是根據兩個輸入浮點數的指數差來執行小數尾數(已加入隱含1)向右移動相應的位數,以將輸入的兩個浮點數指數調整為相同的數(同大數),若b_exp、sube、b_ma、s_ma、c_sgn、add_sub為輸入信號(其含義見compare模塊),則可輸出如下運算結果(在一個時鐘周期內完成):

◇大數指數(sft_bexp),將b_exp信號用寄存器延遲一個周期,以實現時序同步;

◇小數尾數(sft_sma),已完成向右移動相應的sube位;

◇大數尾數(sft_bma),將b_ma信號用寄存器延遲一個周期,以實現時序同步;

◇和符號(sft_csgn),將c_sgn信號用寄存器延遲一個周期,以實現時序同步;

◇加減選擇(sft_addsub),將add_sub信號用寄存器延遲一個周期,以實現時序同步;

(3)sum模塊

本模塊可根據加減選擇(sft_addsub(信號完成兩輸入浮點數尾數(已加入隱含1)的加減,若sft_bexp、sft_sma、sft_bma、sft_csgn、sft_addsub為輸入信號(其含義見shift模塊),則可輸出如下運算結果(在一個時鐘周期內完成):

◇大數指數(sum_bexp),將sft_bexp信號用寄存器延遲一個周期,以實現時序同步;

◇尾數和(sum_ma),為大數尾數與移位后小數尾數的和,差(兩尾數已加入隱含1);

◇和符號(sum_csgn),將sft_csgn信號用寄存器延遲一個周期,以實現時序同步;

(4)normalize模塊

normalize模塊的作用主要是將前三個模塊的運算結果規范為IEEE 754單精度浮點數標準,若sum_bexp、sum_ma、sum_csgn為輸入信號(其含義見sum模塊),則其輸出的運算結果(在一個時鐘周期內完成)只有一個和輸出(data_out),也就是符合IEEE754浮點數標準的兩個輸入浮點數的和。

4系統綜合與仿真

由于本工程是由compare、shift、sum、normalize四個模塊組成的,而這四個模塊通過串行方式進行連接,每個模塊的操作都在一個時鐘周期內完成,因此,整個浮點數加法運算可在四個時鐘周期內完成。這使得工程不僅有確定的數據運算時延(latency),便于流水線實現,而且方便占用的時鐘周期盡可能減少,從而極大地提高了運算的實時性。

4.1工程綜合結果

經過Quartus II綜合可知,本設計使用的StratixⅡEP2S15F484C3芯片共使用了641個ALUT(高級查找表)、188個寄存器、0位內存和可達到80 MHz的時鐘頻率,因此可證明,本系統利用合理的資源實現了高速浮點數加法運算。

4.2工程仿真結果

本工程仿真可使用Quartus II 8.0內嵌式仿真工具來編寫Matlab程序,以生成大量隨機單精度浮點數(以便于提高仿真代碼覆蓋率,提高仿真的精確度),然后計算它們相加的結果,并以文本形式存放在磁盤文件中。編寫Matlab程序可產生作為仿真輸入的*.vec文件,然后通過時序仿真后生成*.tbl文件,再編寫Matlab程序提取其中有用的結果數據,并與先前磁盤文件中的結果相比較,以驗證設計的正確性。

圖3所示是其仿真的波形圖。

從圖3可以看出表1所列的各種運算關系。表2所列為其實際的測試數據。

e7a0208c-58f0-11ee-939d-92fbcf53809c.jpg

表中“A+B實數表示(M)”指Matlab計算的結果;“誤差”指浮點處理器計算結果與Matlab計算結果之差。

綜上所述,本工程設計的浮點加法器所得到的運算結果與Matlab結果的誤差在10-7左右,可見其精度完全能夠符合要求。

本工程設計完全符合IP核設計的規范流程,而且完成了Verilog HDL建模、功能仿真、綜合、時序仿真等IP核設計的整個過程,電路功能正確。實際上,本系統在布局布線后,其系統的最高時鐘頻率可達80MHz。雖然使用浮點數會導致舍入誤差,但這種誤差很小,可以忽略。實踐證明,本工程利用流水線結構,方便地實現了高速、連續、大數據量浮點數的加法運算,而且設計結構合理,性能優異,可以應用在高速信號處理系統中。

e7b4f340-58f0-11ee-939d-92fbcf53809c.png

有你想看的精彩 至芯科技FPGA就業培訓班——助你步入成功之路、9月23號北京中心開課、歡迎咨詢! CMOS圖像傳感器的FPGA邏輯設計解析 如何使用FPGA器件和USB通訊實現高速數據傳輸顯示系統的設計

e7c58d68-58f0-11ee-939d-92fbcf53809c.jpg

掃碼加微信邀請您加入FPGA學習交流群

e7d11ee4-58f0-11ee-939d-92fbcf53809c.jpge7dc7906-58f0-11ee-939d-92fbcf53809c.png

歡迎加入至芯科技FPGA微信學習交流群,這里有一群優秀的FPGA工程師、學生、老師、這里FPGA技術交流學習氛圍濃厚、相互分享、相互幫助、叫上小伙伴一起加入吧!

點個在看你最好看e7f0906c-58f0-11ee-939d-92fbcf53809c.png


原文標題:為什么研究浮點加法運算,對FPGA實現方法很有必要?

文章出處:【微信公眾號:FPGA設計論壇】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1643

    文章

    21968

    瀏覽量

    614299

原文標題:為什么研究浮點加法運算,對FPGA實現方法很有必要?

文章出處:【微信號:gh_9d70b445f494,微信公眾號:FPGA設計論壇】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    設計了一個基于浮點運算的協處理器,使用C語言編程時沒法輸入float型數據,請問有哪些部分需要修改?

    我設計了一個基于浮點運算的協處理器,使用C語言編程時沒法輸入float型數據,請問有哪些部分需要修改?SDK,EXU_decoder浮點寄存器都需要修改嗎,謝謝
    發表于 03-07 16:03

    【RA-Eco-RA4E2-64PIN-V1.0開發板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比

    , atan,等等基本操作。 當然為了測試出硬件浮點運算性能,這里很有必要在測試一下軟件浮點運算
    發表于 12-30 17:55

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+內容簡介

    設計的關系,芯片設計人員掌握算法知識的必要性,以及位寬確定、有符號數處理、浮點運算、溢出保護和四舍五入等算法的實現。第3~11章重點介紹各種典型基本算法的電路設計,其中包括任何數字芯
    發表于 11-21 17:14

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數點對齊等問題即可。在本文中,運用在前一節中描述的自定義浮點格式FPGA中數的表示方法(下),完成
    的頭像 發表于 11-16 12:51 ?816次閱讀
    <b class='flag-5'>FPGA</b>中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA浮點四則運算實現過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數點對齊等問題即可。在本文中,運用在前一節中描述的自定義浮點格式FPGA中數的表示方法(下),完成
    的頭像 發表于 11-16 11:19 ?1284次閱讀
    <b class='flag-5'>FPGA</b>中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的<b class='flag-5'>實現</b>過程

    【RA-Eco-RA2E1-48PIN-V1.0開發板試用】在M23內核上使用qfplib浮點運算庫進行浮點運算

    /M0+/M3內核的MCU上有提供了一種新的方法實現浮點運算。 言歸正傳,下面來介紹一下開源的qfplib浮點庫的移植和使用步驟。 首先創
    發表于 11-05 22:07

    【AG32開發板免費試用】+數據采集存儲系統(2)-串口輸出+浮點運算驗證

    本次學習下串口配置和輸出。 并驗證芯片的浮點運算能力。 下面直接上干貨哦。 VE 配置 SYSCLK 100 HSECLK 8 GPIO4_1 PIN_31 # LED4 GPIO4_2
    發表于 10-31 21:22

    BitEnergy AI公司開發出一種新AI處理方法

    BitEnergy AI公司,一家專注于人工智能(AI)推理技術的企業,其工程師團隊創新性地開發了一種名為線性復雜度乘法(L-Mul)的AI處理方法。該方法的核心在于,它用整數加法替代了傳統的
    的頭像 發表于 10-22 15:15 ?747次閱讀

    加法運放電路實驗報告數據分析

    加法運放電路實驗報告的數據分析主要包括對實驗結果的觀察、與理論值的對比以及誤差原因的分析。以下是一個基于常見加法運放電路實驗的數據分析示例: 一、實驗目的與原理 實驗目的 :了解加法器的模擬
    的頭像 發表于 09-03 10:03 ?1687次閱讀

    加法運放電路輸出電壓是多少

    加法運放電路(也稱為求和放大器)是一種使用運算放大器(Op-Amp)來將多個輸入信號相加并放大的電路。在理想情況下,運算放大器具有無限大的開環增益、無限大的輸入阻抗和零輸出阻抗。這使得運算
    的頭像 發表于 09-03 09:50 ?1012次閱讀
    <b class='flag-5'>加法</b>運放電路輸出電壓是多少

    請問AURIX TC3xx tricore架構下浮點運算和將浮點數小數點去掉變成整數來計算哪種方式更加節省算力?

    AURIX TC3xx tricore架構下浮點運算和將浮點數小數點去掉變成整數來計算哪種方式更加節省算力? 比如一個浮點數12.89V,如果將其寫成12890mV,再參與計算,哪種方
    發表于 08-26 06:54

    請問全差分運算放大器能像一般運算放大器一樣設計加法器嗎?

    全差分運算放大器能像一般運算放大器一樣設計加法器嗎?
    發表于 08-09 06:26

    FPGA教學實驗室建設必要性 解決方案概述

    FPGA教學實驗室建設必要性&解決方案概述
    的頭像 發表于 07-26 08:33 ?466次閱讀
    <b class='flag-5'>FPGA</b>教學實驗室建設<b class='flag-5'>必要</b>性 解決方案概述

    請問esp32 wroom 32u默認開啟硬件浮點運算單元了嗎?

    請問esp32 wroom 32u 默認開啟硬件浮點運算單元了嗎?感謝
    發表于 06-21 11:08

    FPGA設計經驗之圖像處理

    可以說是類似于CPU里面的Cache,但Cache不是你能完全控制的,但Block Ram是完全可控的,可以用它實現各種靈活的運算處理。這樣FPGA通過緩存若干行圖像數據就可以對圖像進行實時處理,數據
    發表于 06-12 16:26
    主站蜘蛛池模板: 97在线精品| 久久骚| 男人免费看片 | 精品国产柚木在线观看 | 日韩美女三级 | 天堂-bt种子| 亚洲午夜久久久 | 欧美黄色片免费看 | 最新国产在线播放 | 五月天丁香婷婷开心激情五月 | 国产资源在线观看 | 2021国产精品久久 | 黄色在线观看网址 | 美女教师一级毛片 | 日本一区二区三区不卡在线看 | 欧美色人阁 | 日韩三级 | 老师别揉我胸啊嗯上课呢视频 | 尻逼尻逼 | 亚欧美色| 97色资源| 欧美不卡视频在线观看 | 91大神在线精品网址 | 天天爱天天做久久天天狠狼 | 四虎永久免费网站免费观看 | 亚洲aa在线| 一级黄色片在线 | 午夜小福利 | 精品成人在线 | 九九热在线观看 | xxxx69日本hd| 嫩草影院久久国产精品 | 手机看高清特黄a大片 | 一级黄色片a | 狠狠色狠狠色综合日日不卡 | 加勒比啪啪 | 国产小视频免费 | 毛片毛片免费看 | 欧美一级高清免费播放 | 久久精品国产免费 | 一区二区三区四区无限乱码在线观看 |