在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差,為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力呢

Dbwd_Imgtec ? 來源:未知 ? 作者:李建兵 ? 2018-03-16 15:12 ? 次閱讀

問:為什么 CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差,為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力?


「速度區(qū)別主要是來自于架構(gòu)上的區(qū)別」是一個表面化的解釋。對,架構(gòu)是不同。但是這種不同是目前各個廠家選擇的現(xiàn)狀,還是由于本質(zhì)的原因決定的?CPU 能不能增加核?GPU 那張圖為什么不需要 cache?

首先,CPU 能不能像 GPU 那樣去掉 cache?不行。GPU 能去掉 cache 關(guān)鍵在于兩個因素:數(shù)據(jù)的特殊性(高度對齊,pipeline 處理,不符合局部化假設(shè),很少回寫數(shù)據(jù))、高速度的總線。對于后一個問題,CPU 受制于落后的數(shù)據(jù)總線標(biāo)準(zhǔn),理論上這是可以改觀的。對于前一個問題,從理論上就很難解決。因?yàn)?CPU 要提供通用性,就不能限制處理數(shù)據(jù)的種類。這也是 GPGPU 永遠(yuǎn)無法取代 CPU 的原因。

其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面積。其次,CPU 為了維護(hù) cache 的一致性,要增加每個核的復(fù)雜度。還有,為了更好的利用 cache 和處理非對齊以及需要大量回寫的數(shù)據(jù),CPU 需要復(fù)雜的優(yōu)化(分支預(yù)測、out-of-order 執(zhí)行、以及部分模擬 GPU 的 vectorization 指令和長流水線)。所以一個 CPU 核的復(fù)雜度要比 GPU 高的多,進(jìn)而成本就更高(并不是說蝕刻的成本高,而是復(fù)雜度降低了成片率,所以最終成本會高)。所以 CPU 不能像 GPU 那樣增加核。

至于控制能力,GPU 的現(xiàn)狀是差于 CPU,但是并不是本質(zhì)問題。而像遞歸這樣的控制,并不適合高度對齊和 pipeline 處理的數(shù)據(jù),本質(zhì)上還是數(shù)據(jù)問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10996

    瀏覽量

    214859
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4870

    瀏覽量

    130249

原文標(biāo)題:為什么 CPU 的浮點(diǎn)運(yùn)算能力比 GPU 差,為什么不提高 CPU 的浮點(diǎn)運(yùn)算能力?

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    設(shè)計(jì)了一個基于浮點(diǎn)數(shù)運(yùn)算的協(xié)處理器,使用C語言編程時(shí)沒法輸入float型數(shù)據(jù),請問有哪些部分需要修改?

    我設(shè)計(jì)了一個基于浮點(diǎn)數(shù)運(yùn)算的協(xié)處理器,使用C語言編程時(shí)沒法輸入float型數(shù)據(jù),請問有哪些部分需要修改?SDK,EXU_decoder浮點(diǎn)寄存器都需要修改嗎,謝謝
    發(fā)表于 03-07 16:03

    【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】RA4E2的DSP浮點(diǎn)性能的軟件浮點(diǎn)測試和硬件浮點(diǎn)測試對比

    , atan,等等基本操作。 當(dāng)然為了測試出硬件浮點(diǎn)運(yùn)算性能,這里很有必要在測試一下軟件浮點(diǎn)運(yùn)算能力,方便做個測試對比,怎么做軟件
    發(fā)表于 12-30 17:55

    FPGA中的浮點(diǎn)四則運(yùn)算是什么

    由于定點(diǎn)的四則運(yùn)算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點(diǎn)對齊等問題即可。在本文中,運(yùn)用在前一節(jié)中描述的自定義浮點(diǎn)格式FPGA中數(shù)的表示方法(下),完成浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 12:51 ?672次閱讀
    FPGA中的<b class='flag-5'>浮點(diǎn)</b>四則<b class='flag-5'>運(yùn)算</b>是什么

    FPGA中浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過程

    由于定點(diǎn)的四則運(yùn)算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點(diǎn)對齊等問題即可。在本文中,運(yùn)用在前一節(jié)中描述的自定義浮點(diǎn)格式FPGA中數(shù)的表示方法(下),完成浮點(diǎn)四則運(yùn)算的實(shí)現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 11:19 ?1047次閱讀
    FPGA中<b class='flag-5'>浮點(diǎn)</b>四則<b class='flag-5'>運(yùn)算</b>的實(shí)現(xiàn)過程

    【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】在M23內(nèi)核上使用qfplib浮點(diǎn)運(yùn)算庫進(jìn)行浮點(diǎn)運(yùn)算

    運(yùn)算。難道由于硬件不支持FPU, 常用的M0/M0+/M23/M3內(nèi)核就無緣浮點(diǎn)運(yùn)算?答案是顯然不是的。 我們可以移植使用開源的qfplib庫來實(shí)現(xiàn)
    發(fā)表于 11-05 22:07

    【AG32開發(fā)板免費(fèi)試用】+數(shù)據(jù)采集存儲系統(tǒng)(2)-串口輸出+浮點(diǎn)運(yùn)算驗(yàn)證

    本次學(xué)習(xí)下串口配置和輸出。 并驗(yàn)證芯片的浮點(diǎn)運(yùn)算能力。 下面直接上干貨哦。 VE 配置 SYSCLK 100 HSECLK 8 GPIO4_1 PIN_31 # LED4 GPIO4_2
    發(fā)表于 10-31 21:22

    《算力芯片 高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔:從基準(zhǔn)測試到CPU微架構(gòu)的深度探索

    叫好。SIMD就像是一位指揮家,用一個指令指揮整個樂團(tuán)同時(shí)演奏,大大提高了計(jì)算效率。計(jì)算單元設(shè)計(jì)是CPU性能提升的另一重要方向。ALU(算術(shù)邏輯單元)作為CPU的核心,負(fù)責(zé)執(zhí)行整數(shù)運(yùn)算
    發(fā)表于 10-19 01:21

    雙核cpu和單核cpu的區(qū)別

    雙核CPU與單核CPU在多個方面存在顯著差異,這些差異主要體現(xiàn)在處理能力、性能、運(yùn)行效率、功耗以及適用場景等方面。 一、概念與結(jié)構(gòu) 雙核CPU :指在一個處理器上集成兩個
    的頭像 發(fā)表于 09-24 16:17 ?5782次閱讀

    請問AURIX TC3xx tricore架構(gòu)下浮點(diǎn)運(yùn)算和將浮點(diǎn)數(shù)小數(shù)點(diǎn)去掉變成整數(shù)來計(jì)算哪種方式更加節(jié)省算力?

    ? tricore架構(gòu)下CPU有專門的FPU來處理浮點(diǎn)數(shù)運(yùn)算,是否意味著用12.89參與運(yùn)算,在調(diào)用FPU來計(jì)算的情況下,計(jì)算時(shí)間不會比12890參與計(jì)算的時(shí)間長,甚至可能
    發(fā)表于 08-26 06:54

    cpu運(yùn)算器和控制器的作用是什么

    CPU運(yùn)算器和控制器是計(jì)算機(jī)的核心組成部分,它們共同完成計(jì)算機(jī)的各種運(yùn)算和控制任務(wù)。下面我們將詳細(xì)介紹運(yùn)算器和控制器的作用。 運(yùn)算器的作用
    的頭像 發(fā)表于 06-30 11:15 ?3158次閱讀

    cpu控制器負(fù)責(zé)什么運(yùn)算

    、設(shè)計(jì)和實(shí)現(xiàn)等方面的內(nèi)容。 CPU控制器的功能 CPU控制器是計(jì)算機(jī)系統(tǒng)中最重要的組件之一。它的主要功能包括: 1.1 指令執(zhí)行:CPU控制器負(fù)責(zé)執(zhí)行程序中的指令。這些指令包括算術(shù)運(yùn)算
    的頭像 發(fā)表于 06-30 11:14 ?1323次閱讀

    cpu控制器和運(yùn)算器組成的部件有哪些

    CPU(中央處理器)是計(jì)算機(jī)的核心部件,負(fù)責(zé)執(zhí)行程序指令和處理數(shù)據(jù)。CPU主要由控制器和運(yùn)算器組成,這兩個部件共同完成計(jì)算機(jī)的運(yùn)算任務(wù)。下面詳細(xì)介紹
    的頭像 發(fā)表于 06-30 11:01 ?2747次閱讀

    請問esp32 wroom 32u默認(rèn)開啟硬件浮點(diǎn)運(yùn)算單元了嗎?

    請問esp32 wroom 32u 默認(rèn)開啟硬件浮點(diǎn)運(yùn)算單元了嗎?感謝
    發(fā)表于 06-21 11:08

    在定時(shí)器內(nèi)使用浮點(diǎn)運(yùn)算的PID控制算法,程序就會重啟,為什么?

    在定時(shí)器內(nèi)使用浮點(diǎn)運(yùn)算的PID控制算法,程序就會重啟,把浮點(diǎn)數(shù)換為整形數(shù)據(jù)就不會。
    發(fā)表于 06-05 07:24

    優(yōu)秀的Verilog/FPGA開源項(xiàng)目-浮點(diǎn)運(yùn)算器(FPU)介紹

    浮點(diǎn)運(yùn)算器(英文:floating point unit,簡稱FPU)是計(jì)算機(jī)系統(tǒng)的一部分,它是專門用來進(jìn)行浮點(diǎn)數(shù)運(yùn)算的(CPU中也叫ALU
    的頭像 發(fā)表于 04-26 11:27 ?4785次閱讀
    優(yōu)秀的Verilog/FPGA開源項(xiàng)目-<b class='flag-5'>浮點(diǎn)</b><b class='flag-5'>運(yùn)算</b>器(FPU)介紹
    主站蜘蛛池模板: 精品国产综合区久久久久99 | 国产精品资源手机在线播放 | 狠狠色 综合色区 | 黄色网址 在线播放 | 亚洲福利午夜 | www.射射| 亚洲激情视频 | 人人艹人人艹 | 国产中文99视频在线观看 | 欧美一级精品 | 一本到卡二卡三卡免费高 | 很黄很暴力 很污秽的小说 很黄很黄叫声床戏免费视频 | 手机看片免费永久在线观看 | 天天爱天天射 | 黄色视屏免费在线观看 | 五月激情啪啪 | 亚洲午夜久久久精品影院视色 | 国产汉服被啪福利在线观看 | 欧美hhh | 国产又爽又黄又粗又大 | 国产精品9999久久久久仙踪林 | 99久热成人精品视频 | 成人精品一级毛片 | 九月婷婷亚洲综合在线 | 激情五月在线 | 午夜影院一级片 | 韩国免费人成在线观看网站 | 俄罗斯aaaaa一级毛片 | 99视频在线永久免费观看 | 色香蕉在线观看 | 五月天婷婷在线观看视频 | 午夜精品国产 | 在线视频一区二区三区 | 欧美日本俄罗斯一级毛片 | 天天摸日日添狠狠添婷婷 | 欧美四级在线 | 免费一级做a爰片久久毛片 免费一看一级毛片 | 日韩免费| 天堂网www在线资源链接 | 成人亚洲欧美在线电影www色 | 神马午夜影院 |