在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能效提升3倍!異構(gòu)計算架構(gòu)讓AI跑得更快更省電

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-05-25 01:55 ? 次閱讀
電子發(fā)燒友網(wǎng)報道(文/李彎彎)異構(gòu)計算架構(gòu)通過集成多種不同類型的處理單元(如CPUGPU、NPU、FPGADSP等),針對不同計算任務(wù)的特點進行分工協(xié)作,從而在性能、能效和靈活性之間實現(xiàn)最優(yōu)平衡。它是應對復雜計算需求的關(guān)鍵技術(shù)之一。

異構(gòu)計算架構(gòu)的核心優(yōu)勢

異構(gòu)計算架構(gòu)的核心要素主要包括多種計算單元結(jié)合、任務(wù)分配機制和協(xié)同工作機制。多種計算單元結(jié)合:結(jié)合不同類型的處理單元,如CPU、GPU、TPU、FPGA等,每種單元針對特定任務(wù)或工作負載進行優(yōu)化。例如CPU擅長處理邏輯判斷、控制流程以及多樣化的通用任務(wù);GPU擁有大量并行處理單元,擅長圖像、視頻深度學習等大規(guī)模數(shù)據(jù)運算;FPGA/ASIC可根據(jù)特定算法進行高度定制,在功耗和實時性方面有優(yōu)勢。

任務(wù)分配機制:通過將不同類型的處理單元分配給不同的任務(wù),異構(gòu)架構(gòu)可以提高系統(tǒng)整體的能效比和性能,實現(xiàn)任務(wù)的并行處理和優(yōu)化。系統(tǒng)會根據(jù)工作負載類型將任務(wù)分配給最適合的硬件單元,讓整體資源得到最大程度的利用。

協(xié)同工作機制:異構(gòu)計算并非讓各個處理單元“各自為政”,而是需要一個良好的編程框架和通訊機制,保證不同單元之間的數(shù)據(jù)傳遞和任務(wù)調(diào)度高效有序。例如采用共享或?qū)S酶咚倬彺妗⒏咚倩ヂ?lián)接口、統(tǒng)一編程模型或驅(qū)動層抽象等方式。

異構(gòu)計算的優(yōu)勢在于性能的提升、能效比優(yōu)化、適應多樣化需求,縮短開發(fā)周期。性能提升,通過利用多種優(yōu)化的處理單元,異構(gòu)架構(gòu)可以顯著提升系統(tǒng)的整體性能和響應速度。例如在深度學習任務(wù)中,GPU的并行計算能力能夠顯著加速模型訓練,減少訓練時間,從而在大規(guī)模數(shù)據(jù)集的處理上帶來極大的性能提升。

能效比優(yōu)化,針對不同類型的工作負載分配適當?shù)奶幚韱卧悩?gòu)架構(gòu)可以在相同功耗下提供更高的計算能力。例如CPU在處理計算密集型任務(wù)時效率較低,而GPU則能在這些任務(wù)中提供更高效的計算,進而減少能源消耗。同時,F(xiàn)PGA等硬件能夠根據(jù)任務(wù)的需要進行定制,進一步優(yōu)化性能與能效。

適應多樣化需求,支持多種應用需求,從科學計算到深度學習,異構(gòu)架構(gòu)可以靈活調(diào)整以滿足不同的計算和數(shù)據(jù)處理需求。

縮短開發(fā)周期,開發(fā)者可以利用現(xiàn)有硬件資源,根據(jù)任務(wù)需求快速選擇合適的硬件加速方案,無需重新設(shè)計專用硬件系統(tǒng)。這不僅節(jié)省了開發(fā)時間,也降低了設(shè)計和開發(fā)的成本,從而加速了產(chǎn)品的推出。

異構(gòu)計算架構(gòu)的典型案例

下面是列舉一些異構(gòu)計算架構(gòu)的典型案例,展示如何通過整合多種處理單元(CPU、GPU、NPU、FPGA等)實現(xiàn)性能、能效和靈活性的協(xié)同優(yōu)化。

智能手機領(lǐng)域,如蘋果M1 Ultra,該芯片包含CPU、GPU、NPU多個單元,8核(4性能核+4能效核)CPU處理通用任務(wù),16核GPU加速圖形渲染和機器學習推理,16核專用加速器NPU,支持實時影像處理(如電影模式視頻分割)。

在協(xié)作方面,視頻處理方面,CPU調(diào)度任務(wù),GPU加速特效渲染,NPU實時分析人臉焦點。在能效優(yōu)化方面,能效核處理后臺任務(wù),性能核專注高負載場景。相比傳統(tǒng)SoC,M1 Ultra在AI任務(wù)(如實時語義分割)能效提升3倍,續(xù)航延長20%。

智能駕駛領(lǐng)域,如特斯拉HW4.0,該芯片架構(gòu)包含GPU、NPU、FPGA單元,AMD定制GPU處理圖形渲染和傳感器融合,自研ASIC(Hardware 4.0)加速BEV(鳥瞰圖)感知和路徑規(guī)劃,F(xiàn)PGA處理實時雷達信號濾波。

在協(xié)作方面,感知層方面,NPU并行處理8攝像頭+雷達數(shù)據(jù),輸出目標檢測結(jié)果;決策層方面,GPU模擬駕駛場景,CPU執(zhí)行車輛控制指令。該架構(gòu)設(shè)計具有明顯成效,如延遲降低至20ms以下,支持純視覺方案的FSD(Full Self-Driving)功能。

數(shù)據(jù)中心領(lǐng)域,如NVIDIA DGX H100,該芯片架構(gòu)包含CPU、GPU、DPU單元,AMD EPYC Genoa處理I/O和系統(tǒng)管理,8塊H100 GPU(NVLink互聯(lián))加速AI訓練,BlueField-3DPU卸載網(wǎng)絡(luò)和存儲任務(wù),釋放GPU算力。在協(xié)作方面,訓練階段,GPU執(zhí)行矩陣運算,DPU預處理數(shù)據(jù)(如壓縮/解密);推理階段,GPU+CPU協(xié)同處理低延遲請求(如實時推薦系統(tǒng))。該架構(gòu)的成效體現(xiàn)在,訓練萬億參數(shù)模型效率提升90%,能效比達30 TFLOPS/W。

邊緣計算領(lǐng)域,如谷歌Edge TPU,采用專用ASIC搭載協(xié)處理器,Edge TPU僅支持INT8量化模型,針對邊緣推理優(yōu)化,低功耗MCU(Cortex-M)管理傳感器數(shù)據(jù)輸入。在協(xié)作方面,預處理方面,MCU完成數(shù)據(jù)濾波和格式轉(zhuǎn)換,在推理方面,Edge TPU執(zhí)行MobileNet-SSD模型(物體檢測),延遲<10ms。相比通用芯片,功耗降低75%,體積縮小50%。

小結(jié):異構(gòu)計算架構(gòu)通過任務(wù)-硬件的精準匹配,在性能、功耗、成本等關(guān)鍵指標上實現(xiàn)突破,成為高性能計算、AI、邊緣計算等領(lǐng)域的核心基礎(chǔ)設(shè)施。未來,隨著Chiplet、存算一體等技術(shù)的融合,異構(gòu)計算將進一步釋放硬件潛力,推動智能計算向更高能效、更低延遲發(fā)展。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    34000

    瀏覽量

    275077
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    526

    瀏覽量

    25840
  • 異構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    44

    瀏覽量

    13311
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    近日, Imagination Technologies 與國內(nèi)領(lǐng)先的異構(gòu)計算軟件與智算混合云服務(wù)提供商 澎峰科技 ( PerfXLab )正式簽署合作備忘錄( MoU ),圍繞 GPU 與 AI
    發(fā)表于 05-21 09:40 ?921次閱讀

    AI人工智能崛起:高性能MOSFET如何重塑架構(gòu)

    本文將聚焦AI對數(shù)據(jù)中心架構(gòu)的影響,以及這些變化對服務(wù)器和機架技術(shù)的意義。具體而言,我們將探討轉(zhuǎn)向48V架構(gòu)如何提升數(shù)據(jù)中心
    的頭像 發(fā)表于 05-06 14:03 ?117次閱讀
    <b class='flag-5'>AI</b>人工智能崛起:高性能MOSFET如何重塑<b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>架構(gòu)</b>

    比和算力提升的衡量方法

    一、比的衡量方法 定義與計算公式? 比(EER)定義為制冷量與輸入功率的比值,計算公式為
    的頭像 發(fā)表于 04-28 07:47 ?187次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b>比和算力<b class='flag-5'>提升</b>的衡量方法

    RAKsmart智能算力架構(gòu)異構(gòu)計算+低時延網(wǎng)絡(luò)驅(qū)動企業(yè)AI訓練范式升級

    AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構(gòu),以異構(gòu)計算資源池化與超低時延網(wǎng)絡(luò)為核心,重構(gòu)
    的頭像 發(fā)表于 04-17 09:29 ?206次閱讀

    RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    框架部署需大量手動優(yōu)化,延誤項目交付。 明遠智睿RK3588核心板的核心優(yōu)勢 異構(gòu)計算架構(gòu): 采用4×Cortex-A76(2.4GHz)+4×Cortex-A55(1.8GHz)設(shè)計,兼顧高性能
    發(fā)表于 04-15 10:48

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件端側(cè)AI模型接入得心應手

    猛增50,將訓練時間從一整天縮短至半小時。更快的端側(cè)LoRA訓練,端側(cè)AI基于用戶端側(cè)數(shù)據(jù)提升個性化體驗,
    發(fā)表于 04-13 19:52

    新品發(fā)布 | HZ-EVM-RK3562開發(fā)板:突破算力與平衡,賦邊緣AI計算

    在人工智能與物聯(lián)網(wǎng)技術(shù)深度融合的今天,邊緣設(shè)備正面臨算力、與實時性的三重挑戰(zhàn)。傳統(tǒng)嵌入式方案往往在性能與功耗之間艱難權(quán)衡,而合眾恒躍最新推出的HZ-EVM-RK3562開發(fā)板,通過異構(gòu)計算
    的頭像 發(fā)表于 04-12 09:02 ?773次閱讀
    新品發(fā)布 | HZ-EVM-RK3562開發(fā)板:突破算力與<b class='flag-5'>能</b><b class='flag-5'>效</b>平衡,賦<b class='flag-5'>能</b>邊緣<b class='flag-5'>AI</b><b class='flag-5'>計算</b>

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ? 異構(gòu)計算的興起:FPGA與CPU、GPU、ASIC等其他計算單元的融合成為趨勢。通過異構(gòu)計算架構(gòu),F(xiàn)PGA能夠充分發(fā)揮其并行處理和低延遲的優(yōu)勢,同時與其他
    發(fā)表于 03-03 11:21

    異構(gòu)計算的概念、核心、優(yōu)勢、挑戰(zhàn)及考慮因素

    異構(gòu)計算就像是一支由“多才多藝”處理器組成的團隊,每個成員都有自己的強項和責任。 ? 什么是異構(gòu)計算????? “異構(gòu)計算”指的是在同一個計算平臺中,部署多種不同類型的處理單元(比如
    的頭像 發(fā)表于 01-13 11:43 ?800次閱讀

    【一文看懂】什么是異構(gòu)計算

    隨著人工智能、深度學習、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展,計算需求的復雜性不斷提升。傳統(tǒng)的單一計算架構(gòu)已難以滿足高效處理復雜任務(wù)的要求,異構(gòu)計算
    的頭像 發(fā)表于 12-04 01:06 ?2405次閱讀
    【一文看懂】什么是<b class='flag-5'>異構(gòu)計算</b>?

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    線程調(diào)度,與Hopper架構(gòu)的細粒度同步機制,使得異構(gòu)計算場景下的任務(wù)協(xié)同更加靈活。在我的分布式訓練實踐中,這些特性顯著提升了模型收斂速度。 張量處理器的設(shè)計是本書點睛之筆。從數(shù)學抽象來看,張量統(tǒng)一了
    發(fā)表于 11-24 17:12

    打造異構(gòu)計算新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    參考設(shè)計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設(shè)備,標志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進特性,可實現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?548次閱讀
    打造<b class='flag-5'>異構(gòu)計算</b>新標桿!國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

    AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

    Avaota SBC 的部分平臺內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計算的功能。 在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構(gòu)計算:解鎖算力潛能的新途徑

    在這個數(shù)據(jù)爆炸的時代,計算力是推動社會與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運行到超級計算機的尖端模擬,均依賴強大的計算能力。但面對多樣化的復雜計算任務(wù),單一處理器難以勝任。于是,
    的頭像 發(fā)表于 07-18 08:28 ?1.6w次閱讀
    <b class='flag-5'>異構(gòu)計算</b>:解鎖算力潛能的新途徑

    利用AI和加速計算提升天氣預報效率和

    在 NVIDIA GPU 驅(qū)動的擴散模型助力下,生成式 AI 在各個領(lǐng)域?qū)崿F(xiàn)新的應用,大大提升了效率。   當臺灣氣象員得以在一臺機器上模擬臺風的細節(jié),他們深感其對預報任務(wù)
    的頭像 發(fā)表于 06-07 15:06 ?804次閱讀
    主站蜘蛛池模板: 久久久久久免费观看 | 午夜影院三级 | 国产精品永久免费自在线观看 | 国产成在线观看免费视频 | 四虎国产精品永久免费网址 | 免费黄色地址 | 人人公开免费超级碰碰碰视频 | mm131美女肉体艺术图片 | 中文天堂在线最新2022更新 | 免费一级毛片清高播放 | 在线色国产 | 俺来也俺去啦久久综合网 | 日本人亚洲人成人 | 一区二区三区四区在线 | 四虎精品久久 | 闲人综合 | 无遮挡高清一级毛片免费 | 欧美性久久久久 | 大又大又粗又爽又黄毛片女人 | 网址色 | 日韩高清特级特黄毛片 | 极品国产一区二区三区 | 天堂网在线.www天堂在线 | 国产一区二区影院 | 天堂免费观看 | 午夜视频在线观看免费观看在线观看 | 性欧美大战久久久久久久野外 | 国产人成午夜免视频网站 | 老司机精品视频免费 | 色偷偷综合网 | 一级毛片黄色 | 香蕉久久影院 | 91久久另类重口变态 | 性视频久久 | 亚洲色图日韩 | 夜夜春宵翁熄性放纵古代 | 另类视频色综合 | 黄色福利站 | 91tm视频 | 国产精品亚洲四区在线观看 | 很黄很暴力 很污秽的小说 很黄很黄叫声床戏免费视频 |