背景:
快速傅里葉變換(FFT)在雷達(dá)、通信和電子對(duì)抗等領(lǐng)域有廣泛應(yīng)用。近年來隨著現(xiàn)場(chǎng)可編程門陣列(FPGA)的飛速發(fā)展,與DSP技術(shù)相比,由于其并行信號(hào)處理結(jié)構(gòu),使得FPGA能夠很好地適用于高速信號(hào)處理系統(tǒng),但是,由于Altera等公司研制的FFT IP核,價(jià)錢昂貴,不適合大規(guī)模應(yīng)用,在特定領(lǐng)域中,設(shè)計(jì)適合于自己領(lǐng)域需要的FFT處理器是較為實(shí)際的選擇,下面將關(guān)注一些關(guān)于流水級(jí)FFT處理器的一些最新發(fā)展。
SDF FFT Core → FPGA DSP slice:
近期,在IEEE VLSI系統(tǒng)專欄學(xué)報(bào)處有一篇12頁的題為“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新論文即將被發(fā)表(在IEEE Xplore可見)。而在這篇論文中作者就如何將一個(gè)SDF(single-path delay feedback單路延遲反饋)FFT核映射到Xilinx的全可編程芯片內(nèi)部的DSP48 slices的可編程邏輯及其他可用的存儲(chǔ)資源上進(jìn)行了深入周密的細(xì)節(jié)性討論。盡管這篇論文主要是針對(duì)Virtex-4和Virtex-6系列FPGA進(jìn)行討論的,但是作者也明確指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA與Virtex-6使用相同的slice 架構(gòu),所以這種映射其實(shí)很容易被推廣的。
在論文中,作者詳細(xì)闡述了Xilinx的產(chǎn)品,主要是從Virtex-4 FPGA開始到Xilinx后來的所有全可編程芯片等多代產(chǎn)品內(nèi)部的DSP48 slices的一個(gè)發(fā)展過程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;較新的7系列FPGA和Zynq-7000系列SoC則內(nèi)嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最強(qiáng)的UltraScale/UltraScale+系列FPGA則包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的發(fā)展中都有很多額外的改進(jìn),比如時(shí)鐘率具有較穩(wěn)定的提高,也正是這么多代產(chǎn)品的不斷迭代,才使得現(xiàn)在的DSP48E2 功能更加強(qiáng)大。下圖是論文中作者提到的關(guān)于DSP48E2 功能實(shí)現(xiàn)的細(xì)節(jié)。
圖1 DSP48E2 功能細(xì)節(jié)
同時(shí),在這片IEEE的論文中還討論了如何將此FFT核蝶形轉(zhuǎn)換到較少的LUT單元中,而如何有效轉(zhuǎn)換關(guān)系到是否可以實(shí)現(xiàn)DSP48 preadders的蝶形地址,在實(shí)現(xiàn)過程中,通過將有效的數(shù)據(jù)映射和轉(zhuǎn)換因子存儲(chǔ)到BRAM 及分布式存儲(chǔ)資源中,有效地完成 radix-2k算法轉(zhuǎn)換因子的共享,此外采用重新定時(shí)和流水的方式來縮短實(shí)現(xiàn)時(shí)間。
雖然這篇博客展示的任何技術(shù)都是來自于論文中,讀者也可以從IEEE論文網(wǎng)站得到,但是還是會(huì)給出論文中的一些結(jié)論(以便可以提起您去檢索并閱讀全文的興趣):“報(bào)告的實(shí)現(xiàn)結(jié)果表明,相比于之前的有關(guān)實(shí)現(xiàn)而言,通過利用Virtex-4和Virtex-6內(nèi)部的DSP48實(shí)現(xiàn)一個(gè)FFT核,可以使其性能分別提高350%到400%,同時(shí),還可以獲得一個(gè)更高的混合時(shí)鐘頻率,并且整個(gè)實(shí)現(xiàn)過程只需要更少的存儲(chǔ)資源。這也正好如以前發(fā)表過的最好的報(bào)告結(jié)果一樣,都是使用完全一樣的架構(gòu),使用同Virtex-4完全一樣的算法,也體現(xiàn)出這種轉(zhuǎn)換的優(yōu)勢(shì)十分明顯,所以,為提高性能,可以嘗試將架構(gòu)映射到FPGA硬件結(jié)構(gòu)中來實(shí)現(xiàn)。
總結(jié):
在目前的市場(chǎng)中,尤其是一些互聯(lián)網(wǎng)公司,都開始利用FPGA做硬件加速的實(shí)現(xiàn),不僅是因?yàn)镕PGA的可用性,更主要的是各大公司都看中了硬件實(shí)現(xiàn)軟件算法時(shí)對(duì)整個(gè)算法質(zhì)量的極大提升,這類市場(chǎng)也恰好是我們Xilinx未來競(jìng)爭的關(guān)鍵點(diǎn)所在。
-
Xilinx
+關(guān)注
關(guān)注
71文章
2168瀏覽量
121706 -
FFT
+關(guān)注
關(guān)注
15文章
436瀏覽量
59427
原文標(biāo)題:性能飛升350%~400%!Xilinx DSP slices 實(shí)現(xiàn) SDF 流水 FFT Core
文章出處:【微信號(hào):xilinx_inc,微信公眾號(hào):賽靈思】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
Vivado Xilinx FFT IP核v9.0使用說明
![Vivado <b class='flag-5'>Xilinx</b> <b class='flag-5'>FFT</b> IP核v9.0使用說明](https://file1.elecfans.com/web3/M00/05/35/wKgZPGd98sOAEtMwAAA25DgRlHU070.png)
EE-267:在SISD和SIMD SHARC處理器上實(shí)現(xiàn)就地FFT
![EE-267:在SISD和SIMD SHARC處理器上<b class='flag-5'>實(shí)現(xiàn)</b>就地<b class='flag-5'>FFT</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
dsp28035中用使用cla來進(jìn)行fft要怎么配置?
Vivado中FFT IP核的使用教程
![Vivado中<b class='flag-5'>FFT</b> IP核的使用教程](https://file1.elecfans.com/web2/M00/0A/EE/wKgZomcqzG2AdzZTAAA0gHnU57E261.png)
TMS320VC5505、TMS320C5505和TMS320C5515 DSP上的FFT實(shí)現(xiàn)
![TMS320VC5505、TMS320C5505和TMS320C5515 <b class='flag-5'>DSP</b>上的<b class='flag-5'>FFT</b><b class='flag-5'>實(shí)現(xiàn)</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
使用DSPLIB FFT實(shí)現(xiàn)實(shí)現(xiàn)實(shí)際輸入,無需數(shù)據(jù)縮放
![使用DSPLIB <b class='flag-5'>FFT</b><b class='flag-5'>實(shí)現(xiàn)實(shí)現(xiàn)</b>實(shí)際輸入,無需數(shù)據(jù)縮放](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
用STM32F4或者STM32L4自帶的DSP庫做FFT運(yùn)算是不是只能做基2的點(diǎn)數(shù)?
STM32的DSP庫函數(shù)FFTarm_fft_bin_example里面,為什么.arm_fft_bin_data.c的數(shù)據(jù)都是隔一個(gè)位置補(bǔ)0的?
請(qǐng)問DSP LIB中怎么沒有窗函數(shù)?
FPGA實(shí)現(xiàn)雙調(diào)排序方法詳解
![FPGA<b class='flag-5'>實(shí)現(xiàn)</b>雙調(diào)排序方法詳解](https://file1.elecfans.com/web2/M00/C6/0B/wKgZomYE2jeACYk2AAAkCdw5MNM807.jpg)
基于NVIDIA Megatron Core的MOE LLM實(shí)現(xiàn)和訓(xùn)練優(yōu)化
![基于NVIDIA Megatron <b class='flag-5'>Core</b>的MOE LLM<b class='flag-5'>實(shí)現(xiàn)</b>和訓(xùn)練優(yōu)化](https://file1.elecfans.com/web2/M00/C6/46/wKgaomX85HSAYXw6AAANlNSD8a0224.jpg)
示波器的 FFT 功能怎么調(diào)?
![示波器的 <b class='flag-5'>FFT</b> 功能怎么調(diào)?](https://file1.elecfans.com//web2/M00/C4/A2/wKgZomX1Zy2ABpENAAGxDAAIHPY083.jpg)
評(píng)論