在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為何CPU主頻比FPGA快還要說可以幫助CPU加速?

FPGA開源工作室 ? 來源:OpenIC ? 作者:溫戈 ? 2021-06-30 10:57 ? 次閱讀

主頻只是影響計算速度的一個因素,并不是全部。在執行一些計算密集型的任務場景中,FPGA的計算速度是更快的,目前FPGA作為CPU的協處理器已經廣泛應用在IntelAMD公司產品中。

CPU、GPU、和FPGA的比較

桌面端的CPU為馮諾依曼結構,從上圖可以看出,其基本組成為控制器,Cache,和ALU。而計算單元ALU在CPU中的占比不大,所以它的并行計算能力有限。

中間的為GPU,綠色的計算單元占了絕大部分,所以并行計算能力很強。

弱點是控制能力很弱,Cache小,為了保證計算能力,就需要大量的高速DDR保證數據吞吐率。

右側為FPGA,包含可編程的I/O、DSP、memory、PCIE等,因為大量存儲單元的存在,FPGA在做計算的時候可以直接從內部存儲單元讀取數據。

推薦一個國外的FPGA學習網站 -- fpga4fun,里邊有FPGA的介紹及26個實戰項目及實現代碼,非常適合入門學習!

https://www.fpga4fun.com/

正因為CPU、GPU、和FPGA在結構上的不同,也讓他們在實際應用層面有所側重。

目前主流的方案是把CPU、GPU和FPGA都集成在一個SoC中,通過片內總線互聯。在執行并行計算的時候,比如進行圖像處理,FPGA的優勢就體現出來了,通過協作分工,使芯片的工作效率最大化。

目前的3D封裝以及chiplet等技術為這樣的組合提供了可實現性。

為什么FPGA計算速度會比CPU更快?

在執行大量的運算場景中,FPGA相比GPU的核心優勢在于低延遲。FPGA比CPU延遲低,在本質上是體系結構的區別。FPGA同時擁有流水線并行和數據并行,而CPU幾乎只有數據并行,雖然也會才有流水線設計,但深度受限。因此,FPGA 更適合做需要低延遲的流式處理,GPU 更適合做大批量同構數據的處理。

舉個例子:

我們有四個全加器,每一個的進為輸出連接到下一個的進位輸入,這樣實現的加法器被稱作行波進位加法器(Ripple-Carry Adder, RCA)。其特點為:

結構特點:低位全加器的Cout連接到高一位全加器Cin

優點:電路布局簡單,設計方便

缺點:高位的運算必須等待低位的運算完成

我們來看一下其關鍵路徑的延遲:

總延遲時間:(T + T)*4 + T = 9T,推廣到n位,總時間為(2n + 1)*T。

每一個全加器計算的時候必須等待它的進位輸入產生后才能計算,所以四個全加器并不是同時進行計算的,而是一個一個的串行計算。這樣會造成較大的延遲。

我們把這個電路改進一下:提前計算出“進位信號”,對進位信號進行分析。

這樣我們就得到了一個:超前進位加法器(Carry-Lookahead Adder, CLA)

其中,C1、C2、C3、C4都由下面的電路計算好,需要3級門延遲,然后在全加器中關鍵路徑上還有1級延遲

所以,總共有4級門延遲。

如果采用這種完全的超前進位,理論上的門延遲都是4級門延遲。

實際電路過于復雜,難以實現(C31需要32位的與門和或門?。?/p>

通常的方法:采用多個小規模的超前進位加法器拼接而成,例如,用4個8-bit的超前進位加法器連接成32-bit加法器。

所以我們需要更多的計算位寬或者更大的數組,或者矩陣的運算的時候,我們使用FPGA的優勢就體現出來。再多的計算,也就是放置更多的硬件邏輯資源。

FPGA對CPU加速場景

在一些特定的應用場景下,單獨使用CPU和CPU+FPGA兩種方案所需處理時間的對比,可見FPGA對CPU的加速效果非常明顯,甚至比單獨使用CPU高出1~2個數量級!

FPGA的缺點

FPGA也是有缺點的,其中之一便是開發周期長。其需要對特定的應用編寫特定的FPGA。只要干的事情稍有不同,一般來說FPGA代碼就要重新寫一遍或者是至少要修改很多東西。如果要做的事情復雜、重復性不強,就會占用大量的邏輯資源,其中的大部分處于閑置狀態。

不過,Chiplet的應用對對FPGA的開發周期有一定的優化,以下是傳統FPGA開發的周期和應用chiplet的開發周期對比:

未來的方向

在現在的SoC設計中,要充分考慮不同模塊的特點,FPGA 和 CPU 協同工作,充分發揮各自的長處,局部性和重復性強的歸 FPGA,復雜的歸 CPU。從而達到整個系統算力的最優化。

在未來,FPGA會作為協處理器和CPU、GPU共存一段時間,其主要提供以下三方面的能力:

能夠提供專門的硬件加速,實現各種應用中需要的關鍵處理功能。

FPGA設計在性能上非常靈活,使用流水線和并行結構,適應對性能的需求變化。

協處理器能為主處理器和系統存儲器提供寬帶,低延遲接口。

目前,英特爾,AMD,賽靈思等公司都把FPGA作為協處理器集成在SoC中作為實際應用的硬件加速解決方案,這樣的設計也使得CPU和FPGA在未來的一段時間內會共存,互相配合,賦能各種計算場景。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21802

    瀏覽量

    606384
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10911

    瀏覽量

    213146
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4788

    瀏覽量

    129419

原文標題:為什么CPU主頻一般都比FPGA快,但是卻說FPGA可以幫助CPU加速?

文章出處:【微信號:leezym0317,微信公眾號:FPGA開源工作室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    CPU怎么降頻 bios中如何把cpu調低頻率

    CPU頻率 以Windows系統為例,可以通過電源管理選項來調節CPU的頻率。具體步驟如下: 打開控制面板 : 在Windows系統中,點擊“開始”菜單,選擇“控制面板”。 選擇電源選項 : 在控制面板中,找到并點擊“電源選項”
    的頭像 發表于 02-01 15:02 ?452次閱讀

    fpgacpu的區別 芯片是gpu還是CPU

    一、FPGACPU的區別 FPGA(Field-Programmable Gate Array,現場可編程門陣列)和CPU(Central Processing Unit,中央處理器
    的頭像 發表于 02-01 14:57 ?139次閱讀

    FPGA+GPU+CPU國產化人工智能平臺

    平臺采用國產化FPGA+GPU+CPU構建嵌入式多核異構智算終端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等組合模式,形成低功耗、高可擴展性的硬件系統,結合使用場景靈
    的頭像 發表于 01-07 16:42 ?399次閱讀
    <b class='flag-5'>FPGA+GPU+CPU</b>國產化人工智能平臺

    如何限制容器可以使用的CPU資源

    默認情況下容器可以使用的主機 CPU 資源是不受限制的。和內存資源的使用一樣,如果不對容器可以使用的 CPU 資源進行限制,一旦發生容器內程序異常使用
    的頭像 發表于 10-24 17:04 ?333次閱讀
    如何限制容器<b class='flag-5'>可以</b>使用的<b class='flag-5'>CPU</b>資源

    服務器cpu和臺式機cpu區別

    服務器CPU和臺式機CPU的區別是一個復雜的話題,涉及到多個方面,包括設計、性能、功耗、可靠性、成本等。 服務器CPU和臺式機CPU的區別 1. 設計目標 服務器
    的頭像 發表于 10-10 15:12 ?1620次閱讀

    CPU主頻是什么意思

    CPU主頻,作為計算機處理器性能的一個重要指標,承載著豐富的技術內涵與實際應用價值。以下是對CPU主頻的詳細解析,包括其定義、用途、技術原理、影響因素以及在多個領域的實際應用。
    的頭像 發表于 09-26 15:50 ?2593次閱讀

    CPU時鐘周期與主頻的關系和區別

    CPU時鐘周期與主頻是計算機體系結構中兩個緊密相連且至關重要的概念,它們之間既存在關系又有所區別。以下將詳細闡述CPU時鐘周期與主頻的關系和區別。
    的頭像 發表于 09-26 15:46 ?2141次閱讀

    CPU時鐘周期的組成和作用

    CPU時鐘周期是計算機體系結構中一個至關重要的概念,它直接關聯到CPU的運行速度和性能。以下是對CPU時鐘周期的定義、組成和作用的詳細解析。
    的頭像 發表于 09-26 15:32 ?874次閱讀

    雙核cpu和單核cpu的區別

    雙核CPU與單核CPU在多個方面存在顯著差異,這些差異主要體現在處理能力、性能、運行效率、功耗以及適用場景等方面。 一、概念與結構 雙核CPU :指在一個處理器上集成兩個運算核心,通過并行總線將各處
    的頭像 發表于 09-24 16:17 ?4112次閱讀

    什么是CPU緩存?它有哪些作用?

    CPU緩存(Cache Memory)是計算機系統中一個至關重要的組成部分,它位于CPU與內存之間,作為兩者之間的臨時存儲器。CPU緩存的主要作用是減少CPU訪問內存所需的時間,從而提
    的頭像 發表于 08-22 14:54 ?3853次閱讀

    多核CPU的優勢是什么

    多核CPU(Central Processing Unit,中央處理器)作為現代計算機技術的重要里程碑,其優勢在于顯著提升了計算性能、多任務處理能力、系統穩定性以及能效等多個方面。以下將詳細闡述多核CPU的幾大優勢,并結合相關
    的頭像 發表于 08-22 14:30 ?3408次閱讀

    JAVA應用CPU跳點自動DUMP工具

    背景 在做系統監控時,CPU的使用率是一個關鍵的指標,它反映了系統的性能穩定性以及是否存在異常情況,能幫助我們了解系統的負載情況。通過監控CPU使用率,可以判斷系統是否正常運行或者是否
    的頭像 發表于 08-05 17:48 ?587次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?604次閱讀
    英特爾助力京東云用<b class='flag-5'>CPU</b><b class='flag-5'>加速</b>AI推理,以大模型構建數智化供應鏈

    CPU的各種知識

    1、CPU的位和字長位:在數字電路和電腦技術中采用二進制,代碼只有“0”和“1”,其中無論是“0”或是“1”在CPU中都是一“位”。字長:電腦技術中對CPU在單位時間內(同一時間)能一次處理的二進制
    的頭像 發表于 04-19 08:26 ?583次閱讀
    <b class='flag-5'>CPU</b>的各種知識

    請問DMA控制器可以減輕CPU負擔嗎?

    直接存儲器訪問 ( DMA )控制器,可以在內存和/或外設之間傳輸數據,而不需要 CPU 參與每次傳輸。合理利用 DMA 控制器,可以減輕CPU的負擔。
    的頭像 發表于 03-28 09:41 ?807次閱讀
    請問DMA控制器<b class='flag-5'>可以</b>減輕<b class='flag-5'>CPU</b>負擔嗎?
    主站蜘蛛池模板: 色噜噜噜噜| 成人一级毛片 | 中文字幕在线观看你懂的 | seba51久久精品 | 成人黄色免费看 | 中日韩精品视频在线观看 | 中文字幕二区 | 色噜噜狠狠色综合中文字幕 | 91av免费 | 久久婷婷激情 | 国产精品美女久久久 | 午夜色a大片在线观看免费 午夜色大片在线观看 | 夜夜夜操 | 欧美精品xxxxbbbb | 在线观看免费视频资源 | 俺来色 | 美女无遮挡拍拍拍免费视频 | 四虎影院最新网站 | 人人看人人澡 | 久久久久999 | 在线观看黄a | 天天夜夜爽 | 国产在线综合网 | 性欧美大胆高清视频 | 日本人69xxxxx | 在线免费一区 | 欧美黄色大片免费 | 国产www在线播放 | 天天做天天玩天天爽天天 | 99国产精品农村一级毛片 | 人人插人人草 | 激情综合婷婷丁香六月花 | 激情九月 | 边摸边吃奶边做视频叫床韩剧 | 欧美伦理一区 | 欧美色视频日本片高清在线观看 | 免费看日本黄色片 | 日本一区二区三区在线观看视频 | 亚洲欧美卡通 动漫 丝袜 | 亚洲国产精品乱码在线观看97 | 户外露出 自拍系列 |