在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

并行計算的崛起:為什么GPU將在邊緣AI中取代NPU

穎脈Imgtec ? 2025-06-06 14:55 ? 次閱讀

文章翻譯自EEnews Europe


人工智能AI)不僅是一項技術突破,它更是軟件編寫、理解和執行方式的一次永久性變革。傳統的軟件開發基于確定性邏輯和大多是順序執行的流程,而如今這一范式正在讓位于概率模型、訓練行為以及數據驅動的計算。這并不是一時的潮流。AI代表了計算機科學的一次根本性、不可逆的轉變——從基于規則的編程,邁向自適應的、基于學習的系統,這些系統正逐步被集成到越來越廣泛的計算問題與能力中。

這一轉變也對硬件提出了相應的變革需求。在AI架構和算法不斷演進(并將持續演進)的時代,為狹窄定義任務而打造的高度專用芯片的舊模式已不再適用。為了滿足不斷變化的AI需求(尤其是在邊緣側),我們需要具備與工作負載同樣動態、適應能力強的計算平臺。

這正是為什么通用并行處理器(即GPU)正在成為邊緣AI的未來,并開始取代諸如神經網絡處理器(NPU)這樣的專用處理器。這不僅僅是性能的問題——更是關于靈活性、可擴展性,以及與未來軟件發展方向保持一致的問題。


Makimoto波動理論與“靈活性”的回歸

要理解這一轉變,我們只需回顧“Makimoto波動理論”:這是由日本工程師牧本次雄(Tsugio Makimoto)提出的一個概念,描述了計算產業在不同階段不斷在“標準化”與“定制化”之間擺動的趨勢,其背后是市場需求、技術創新和軟件復雜性等因素的持續變化。

(Makimoto波動理論展現了計算產業在“靈活性”與“專用性”之間的歷史擺動。而當前AI的發展軌跡,標志著計算正再次呈現出在“靈活性”和“通用平臺”之間的擺動。)

這一模型與AI硬件的演變過程高度契合。在AI發展的早期階段,工作負載較為明確且穩定,此時采用NPU等固定功能加速器是合理的。這類處理器對特定任務(例如使用CNN進行圖像分類或目標檢測)進行了深度優化。

但如今AI已進入高速演進階段。我們已走出簡單、靜態模型的時代,邁入混合網絡、Transformer架構、基礎模型和持續創新的浪潮之中。為去年AI打造的定制硬件,根本無法跟上當今的發展節奏。

我們再次站在了“Makimoto拐點”上——從專用硬件,回歸到可擴展、可適配的通用計算平臺。


AI是一個并行計算問題,而非專用計算問題

AI的本質在于并行計算。深度學習嚴重依賴并發操作——矩陣運算、張量乘法、向量計算——這些正是GPU天生擅長的工作負載。能夠同時渲染數百萬像素的架構,如今正好可以處理數百萬神經元的激活。

如今的通用GPU早已不僅僅用于圖形處理。它們擁有可編程管線、計算著色器,以及日益增強的AI中心化設計,不僅能加速傳統負載,也能支持新興的AI工作負載,是邊緣AI中強大而靈活的計算引擎。

相比之下,像NPU這樣的專用處理器則難以應對持續的變革。它們對特定操作進行了優化,而當AI領域快速演進時,這些芯片便迅速被淘汰。顯然,面對這種全新的軟件范式,我們需要的是一種通用的、并行的、靈活的硬件平臺—— GPU。


為什么通用平臺在邊緣側更具優勢

邊緣AI不僅需要性能,更需要適應性、可重用性與較長的生命周期?,F代GPU等通用并行處理器在這幾個方面均具備明顯優勢:

靈活性:可編程,能夠支持新的模型類型而無需更換硬件;

可擴展性:可適配從IoT傳感器智能攝像頭再到自動駕駛汽車等各種邊緣設備;

軟件生態成熟:擁有豐富的開源工具與開發標準(如OpenCL、LiteRT、TVM);

可持續性:延長產品生命周期,減少不斷重新設計芯片的需求。

簡而言之,GPU的通用并行計算從架構層面就為AI的持續演進而設計。


展望未來

盡管有越來越多的證據說明GPU具備的優勢,市場仍然習慣將AI加速與NPU或定制芯片劃等號。但正如圖形行業早年發現,固定功能的圖形管線無法跟上游戲創新的節奏,如今AI行業也發現:固定硬件無法匹配快速變化的軟件需求。

是時候重新教育整個生態了。邊緣AI的未來不屬于那些高度優化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計算平臺,它們能與智能軟件共同成長并擴展。

幾十年前,Makimoto就洞察了這一趨勢。如今,我們正在親身經歷他的遠見——順應著通用性和靈活性的浪潮前行。GPU不再是追趕者,它已處于領先位置。

Dennis Laudick是Imagination Technologies的產品管理副總裁。在加入公司之前,Dennis曾在Arm任職超過13年,擔任汽車、AI和GPU相關業務的產品與市場領導職務。在此之前,他還曾在多家半導體與OEM巨頭企業擔任高級管理崗位。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4921

    瀏覽量

    130796
  • 并行計算
    +關注

    關注

    0

    文章

    29

    瀏覽量

    9593
  • NPU
    NPU
    +關注

    關注

    2

    文章

    325

    瀏覽量

    19576
  • 邊緣AI
    +關注

    關注

    0

    文章

    150

    瀏覽量

    5376
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    arm系統并行計算優化

    32位,這樣可以一次性處理4個8為數據,不過gps處理需要對每個數據進行判斷而導致無法使用neon。如何數據可以多位一起處理,或者說多層嵌套循環有提前跳出的條件存在,并行計算優化還是有希望。
    發表于 12-30 14:33

    什么是異構并行計算

    先了解什么是異構并行計算同構計算是使用相同類型指令集和體系架構的計算單元組成系統的計算方式。而異構計算主要是指使用不同類型指令集和體系架構的
    發表于 07-19 08:27

    請問openCL并行計算的程序能運行在RK3399Pro的NPU上嗎

    請問openCL并行計算的程序能運行在RK3399Pro的NPU上嗎? 有哪位大神可以解答一下嗎
    發表于 08-19 16:49

    并行計算和嵌入式系統實踐教程

    Linux微機應用十分普遍. 高性能并行計算機數量多. 并行計算,我國有自己的理論. 對并行計算的基本原理,算法,程序設計與實現,優化,成熟軟件應用的推廣不夠. 制約并行計算在研究和工
    發表于 05-09 15:54 ?48次下載

    虛擬化環境下多GPU并行計算研究

    虛擬化環境下多GPU并行計算研究_閔芳
    發表于 01-03 15:24 ?0次下載

    基于GPU圖像去噪總變分對偶模型的并行計算

    研究基于總變分( TV)的圖像去噪問題,針對中央處理器(CPU)計算速度較慢的問題,提出了在圖像處理器( GPU)上并行計算的方法。考慮總變分最小問題的對偶模型,建立原始變量與對偶變量的關系,采用
    發表于 12-18 17:09 ?1次下載

    基于Matlab和GPU的BESO方法的全流程并行計算策略

    了Matlab編程環境實現GPU并行計算的三種途徑的優缺點和適用范圍;其次,分別采用內置函數直接并行的方式實現了拓撲優化算法向量和稠密矩
    發表于 12-21 15:04 ?2次下載
    基于Matlab和<b class='flag-5'>GPU</b>的BESO方法的全流程<b class='flag-5'>并行計算</b>策略

    基于異構并行計算的兩個子概念異構和并行的簡單分析

    異構并行計算包含兩個子概念:異構和并行。 1異構是指異構并行計算需要同時處理多個不同架構的計算平臺的問題。 2并行是指異構
    的頭像 發表于 01-25 16:37 ?6809次閱讀
    基于異構<b class='flag-5'>并行計算</b>的兩個子概念異構和<b class='flag-5'>并行</b>的簡單分析

    并行計算的黃金時代到了?

    “未來幾十年將進入并行計算黃金時代,并行計算軟件和算法的開發將從技術驅動轉向應用驅動,需要計算與應用等不同領域的專家共同合作開發?!敝袊こ淘涸菏坷顕苋涨氨硎尽?/div>
    的頭像 發表于 04-03 17:18 ?2481次閱讀

    淺析云計算并行計算

    并行計算可以劃分成時間并行和空間并行。時間并行即流水線技術,空間并行使用多個處理器執行并發計算,
    的頭像 發表于 05-03 12:01 ?4948次閱讀
    淺析云<b class='flag-5'>計算</b>和<b class='flag-5'>并行計算</b>

    NPU技術如何提升AI性能

    設計的處理器,與傳統的CPU和GPU相比,它在執行深度學習任務時具有更高的效率和更低的能耗。NPU通過專門優化的硬件結構和指令集,能夠更快地處理神經網絡的大量并行計算任務。 1. 優
    的頭像 發表于 11-15 09:11 ?1340次閱讀

    NPU邊緣計算的優勢

    GPU相比,NPU在處理神經網絡相關的計算任務時,能夠提供更高的能效比和更快的處理速度。NPU通過優化數據流和計算結構,使得神經網絡的前向
    的頭像 發表于 11-15 09:13 ?1164次閱讀

    xgboost的并行計算原理

    在大數據時代,機器學習算法需要處理的數據量日益增長。為了提高數據處理的效率,許多算法都開始支持并行計算。XGBoost作為一種高效的梯度提升樹算法,其并行計算能力是其受歡迎的原因
    的頭像 發表于 01-19 11:17 ?927次閱讀

    讀懂極易并行計算:定義、挑戰與解決方案

    GPU經常與人工智能同時提及,其中一個重要原因在于AI與3D圖形處理本質上屬于同一類問題——它們都適用極易并行計算。什么是極易并行計算?極易并行計算
    的頭像 發表于 04-17 09:11 ?341次閱讀
    讀懂極易<b class='flag-5'>并行計算</b>:定義、挑戰與解決方案

    邊緣AI廣泛應用推動并行計算崛起及創新GPU滲透率快速提升

    是時候重新教育整個生態了。邊緣AI的未來不屬于那些高度優化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計算平臺,它們能與智能軟件共同成長并擴展。
    的頭像 發表于 06-11 14:57 ?149次閱讀
    主站蜘蛛池模板: 国产h视频在线观看 | 日本三级hd高清电影 | 激情五月婷婷在线 | 99热手机在线观看 | 狠狠色丁香久久综合网 | 伊人电影综合网 | 欧美一级视频在线观看 | 乱码一区二区三区完整视频 | 欧美高清a | 伊人狼人在线 | 欧美区在线播放 | 免费看欧美一级特黄α大片 | 五月婷婷激情视频 | 日日噜噜爽爽狠狠视频 | 伊人网网| 成年看片免费高清观看 | 天天爽天天爱 | 久久天天躁狠狠躁夜夜 | 天天插插插 | 日日噜夜夜噜 | 不卡精品国产_亚洲人成在线 | 亚洲 欧美 另类 综合 日韩 | 手机精品在线 | 色多多视频网站 | 午夜精品网站 | а8天堂资源在线官网 | 欧美伦理影院 | 激情丁香小说 | 色婷丁香| 日日干天天操 | 国产高清免费不卡观看 | 午夜操| 在线播放交视频 | 九色精品在线 | 国产在线视频网站 | 国产免费播放 | 亚洲精品电影天堂网 | 性欧美bbbbbb动漫 | 人人搞人人干 | 国产精品特黄毛片 | 色婷婷一区 |