背景:
快速傅里葉變換(FFT)在雷達(dá)、通信和電子對(duì)抗等領(lǐng)域有廣泛應(yīng)用。近年來(lái)隨著現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)的飛速發(fā)展,與DSP技術(shù)相比,由于其并行信號(hào)處理結(jié)構(gòu),使得FPGA能夠很好地適用于高速信號(hào)處理系統(tǒng),但是,由于Altera等公司研制的FFT IP核,價(jià)錢(qián)昂貴,不適合大規(guī)模應(yīng)用,在特定領(lǐng)域中,設(shè)計(jì)適合于自己領(lǐng)域需要的FFT處理器是較為實(shí)際的選擇,下面將關(guān)注一些關(guān)于流水級(jí)FFT處理器的一些最新發(fā)展。
SDF FFT Core → FPGA DSP slice:
近期,在IEEE VLSI系統(tǒng)專(zhuān)欄學(xué)報(bào)處有一篇12頁(yè)的題為“Efficient FPGA Mapping of Pipeline SDF FFT Cores”的新論文即將被發(fā)表(在IEEE Xplore可見(jiàn))。而在這篇論文中作者就如何將一個(gè)SDF(single-path delay feedback單路延遲反饋)FFT核映射到Xilinx的全可編程芯片內(nèi)部的DSP48 slices的可編程邏輯及其他可用的存儲(chǔ)資源上進(jìn)行了深入周密的細(xì)節(jié)性討論。盡管這篇論文主要是針對(duì)Virtex-4和Virtex-6系列FPGA進(jìn)行討論的,但是作者也明確指出,由于Xilinx 7系列和UltraScale/UltraScale+ 系列FPGA與Virtex-6使用相同的slice 架構(gòu),所以這種映射其實(shí)很容易被推廣的。
在論文中,作者詳細(xì)闡述了Xilinx的產(chǎn)品,主要是從Virtex-4 FPGA開(kāi)始到Xilinx后來(lái)的所有全可編程芯片等多代產(chǎn)品內(nèi)部的DSP48 slices的一個(gè)發(fā)展過(guò)程:首先,Virtex-4 FPGA系列包含一18X18bit乘法器和48bit累加器的XtremeDSP(DSP48);之后的Virtex-6系列FPGA加入了25x18bit乘法器和48bit累加器的DSP48 slices ;較新的7系列FPGA和Zynq-7000系列SoC則內(nèi)嵌了25x18bit乘法器和48bit累加器的DSP48 slices;而最強(qiáng)的UltraScale/UltraScale+系列FPGA則包括了27x18bit乘法器和48bit加法器的DSP48E2。除此之外,在Xilinx每一代FPGA的DSP48 slices的發(fā)展中都有很多額外的改進(jìn),比如時(shí)鐘率具有較穩(wěn)定的提高,也正是這么多代產(chǎn)品的不斷迭代,才使得現(xiàn)在的DSP48E2 功能更加強(qiáng)大。下圖是論文中作者提到的關(guān)于DSP48E2 功能實(shí)現(xiàn)的細(xì)節(jié)。
圖1 DSP48E2 功能細(xì)節(jié)
同時(shí),在這片IEEE的論文中還討論了如何將此FFT核蝶形轉(zhuǎn)換到較少的LUT單元中,而如何有效轉(zhuǎn)換關(guān)系到是否可以實(shí)現(xiàn)DSP48 preadders的蝶形地址,在實(shí)現(xiàn)過(guò)程中,通過(guò)將有效的數(shù)據(jù)映射和轉(zhuǎn)換因子存儲(chǔ)到BRAM 及分布式存儲(chǔ)資源中,有效地完成 radix-2k算法轉(zhuǎn)換因子的共享,此外采用重新定時(shí)和流水的方式來(lái)縮短實(shí)現(xiàn)時(shí)間。
雖然這篇博客展示的任何技術(shù)都是來(lái)自于論文中,讀者也可以從IEEE論文網(wǎng)站得到,但是還是會(huì)給出論文中的一些結(jié)論(以便可以提起您去檢索并閱讀全文的興趣):“報(bào)告的實(shí)現(xiàn)結(jié)果表明,相比于之前的有關(guān)實(shí)現(xiàn)而言,通過(guò)利用Virtex-4和Virtex-6內(nèi)部的DSP48實(shí)現(xiàn)一個(gè)FFT核,可以使其性能分別提高350%到400%,同時(shí),還可以獲得一個(gè)更高的混合時(shí)鐘頻率,并且整個(gè)實(shí)現(xiàn)過(guò)程只需要更少的存儲(chǔ)資源。這也正好如以前發(fā)表過(guò)的最好的報(bào)告結(jié)果一樣,都是使用完全一樣的架構(gòu),使用同Virtex-4完全一樣的算法,也體現(xiàn)出這種轉(zhuǎn)換的優(yōu)勢(shì)十分明顯,所以,為提高性能,可以嘗試將架構(gòu)映射到FPGA硬件結(jié)構(gòu)中來(lái)實(shí)現(xiàn)。
總結(jié):
在目前的市場(chǎng)中,尤其是一些互聯(lián)網(wǎng)公司,都開(kāi)始利用FPGA做硬件加速的實(shí)現(xiàn),不僅是因?yàn)镕PGA的可用性,更主要的是各大公司都看中了硬件實(shí)現(xiàn)軟件算法時(shí)對(duì)整個(gè)算法質(zhì)量的極大提升,這類(lèi)市場(chǎng)也恰好是我們Xilinx未來(lái)競(jìng)爭(zhēng)的關(guān)鍵點(diǎn)所在。
-
算法
+關(guān)注
關(guān)注
23文章
4701瀏覽量
94853 -
硬件
+關(guān)注
關(guān)注
11文章
3464瀏覽量
67251 -
軟件
+關(guān)注
關(guān)注
69文章
5124瀏覽量
88982
發(fā)布評(píng)論請(qǐng)先 登錄
采用FPGA實(shí)現(xiàn)DisplayPort詳細(xì)教程【賽靈思內(nèi)部資料】
FPGA設(shè)計(jì)之浮點(diǎn)DSP算法實(shí)現(xiàn)【賽靈思工程師作品】
賽靈思公司亞太區(qū)銷(xiāo)售與市場(chǎng)副總裁給XILINX客戶(hù)的信
求賽靈思的開(kāi)發(fā)環(huán)境ISE軟件下載地址
【AD新聞】賽靈思新CEO訪(fǎng)華繪藍(lán)圖,7nm ACAP平臺(tái)要讓CPU/GPU難企及
【PYNQ-Z2申請(qǐng)】基于賽靈思PYNQ-Z2平臺(tái)的圖像實(shí)時(shí)力學(xué)測(cè)量
基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)
為什么說(shuō)賽靈思已經(jīng)遠(yuǎn)遠(yuǎn)領(lǐng)先于Altera?
賽靈思推出ISE 12軟件設(shè)計(jì)套件
從賽靈思FPGA設(shè)計(jì)流程看懂FPGA設(shè)計(jì)

不僅服務(wù)硬件工程師_2018年賽靈思如何布局AI
賽靈思推出高級(jí)設(shè)計(jì)工具,能大幅簡(jiǎn)化無(wú)線(xiàn)電算法的設(shè)計(jì)生產(chǎn)力
關(guān)于賽靈思FPGA簡(jiǎn)述
賽靈思推出首個(gè)基于機(jī)器學(xué)習(xí)優(yōu)化算法 FPGA EDA 工具套件
賽靈思Vivado ML版優(yōu)化應(yīng)用設(shè)計(jì)

評(píng)論