武道至尊帝临小说,如何发布网络小说,我欲封天耳根小说

國內GPU廠家或許嘗試，摸著英偉達過河。

近日，摩爾線程在北京發布多款軟硬件新品，包括新一代GPU“春曉”、面向個人電腦的消費級顯卡MTT S80和服務器計算卡MTT S3000、一體化計算設備“MCCX元計算一體機”，以及開發套件、數字人解決方案等。GPU“春曉”做為本次發布會的核心產品受到廣泛關注。

“春曉”是摩爾線程的第二顆GPU，也是摩爾線程首顆面相國內消費級市場發售的GPU，它強調游戲、元宇宙與渲染用途，最重要的是，這個GPU支持英偉達CUDA生態。

其實經常關注顯卡的同學總能從英偉達的發布會上聽到CUDA這個詞，例如最新的RTX3060有擁有多少顆CUDA核心，某某游戲首發即支持CUDA生態等。作為顯卡領域的高頻詞匯，很多人好奇CUDA到底是什么？為什么國產顯卡會用到英偉達的技術？本文將帶你了解即熟悉又陌生的CUDA。

CUDA是什么？

CUDA（Compute Unified Device Architecture，統一計算架構）是由英偉達所推出的一種集成技術，是該公司對于GPGPU的正式名稱。通過這個技術，用戶可利用NVIDIA的GPU進行圖像處理之外的運算，CUDA也是首次可以利用GPU作為C-編譯器的開發環境。簡單來說，程序員平時如果不使用特定框架都是針對CPU進行編程的，CUDA是全球最大GPU廠商英偉達推出的針對GPU的編程的架構。

2006年，英偉達發布了CUDA，它提供了GPU編程的簡易接口，程序員可以基于CUDA編譯基于GPU的應用程序，利用GPU的并行計算能力更高效的解決復雜計算難題。在CUDA發布之前，程序員需要到顯卡內核并利用機器碼進行編譯，編程過程相當繁瑣也很困難。CUDA的發布，相當于將較為復雜的底層代碼封裝成了一個個簡單接口，使用時直接調用，其在GPU編程領域的革命性不亞于C、Python、PHP等高等編程語言的發明。當然，CUDA本身也是兼容C語言的，其本身就類似C語言，這可以幫助程序員更快速上手CUDA。現在主流的深度學習框架大多都基于CUDA進行GPU加速運算。

CUDA工作流程圖源：CSDN

從硬件角度看，英偉達會經常宣傳自家顯卡擁有的CUDA Core數量。CUDA Core其實就是英偉達的流處理器，也就是FP32計算單元，同樣的結構在AMD的GPU內叫做SP。與CUDA Core相對的還有Tensor Core張量核心，從字面上就能看出該核心主要針對深度學習中的Tensor計算設計。Tensor計算就是混合精度計算，即在底層硬件算子層面用半精度（FP16）進行輸入和輸出，使用全精度（FP32）進行計算放置丟失過多精度的操作，這個底層硬件就是Tensor Core。CUDA 9.0引入了一個“warp矩陣函數” C++語言API，以便開發者可以使用GPU上的Tensor Core。

CUDA Core 圖源：知乎

CUDA與 GPGPU的概念一脈相承。GPU就是傳統意義上的顯卡與圖形加速卡。隨著人工智能產業爆炸式增長，導致計算復雜化和算力不足，CPU并行計算能力遠不如GPU，使得GPU在通用計算領域逐漸領先，為了進一步專注通用計算，GPGPU便應運而生。GPGPU與CUDA之間關系十分密切。GPGPU其實是去掉了圖形顯示功能的GPU，它將全部能力都投入到通用計算上，CUDA的出現讓GPU真正實現更廣泛的通用計算。CUDA與GPGPU也直接推動了AI與深度學習的發展與產業革命。

為什么要兼容CUDA？

當我們了解了CUDA是怎么回事，也就方便解釋為什么國產GPU需要兼容CUDA。

前文提到，目前世界上的主流深度學習架構都在使用CUDA，其主要原因就是深度學習的重要載體—GPU市場已被英偉達占領大半。隨之而來的，就是市面上絕大部分GPU相關軟件都是用CUDA開發，國產GPU兼容CUDA可以同時“繼承”英偉達打造好的軟件生態，也有更多資料可供學習，這對于蹣跚起步的國產GPU行業來說，減輕了不少開發難度，也降低了推廣壓力。

從開發角度分析。業內GPU工程師稱目前GPU市場可以籠統的分成兩大塊，分別是計算和渲染。此前國內GPU廠商通常專注與計算方面的研發，也有少部分渲染產品問世，最近摩爾線程發布的GPU強調其具有強大的渲染能力。然而渲染賽道難度較大，其計算復雜度更高，除了通用計算，還包圖形渲染、前后端著色器配置、物體幾何屬性等需要處理。目前世界上標準API主要是CUDA與OpenCL，CUDA是英偉達系統架構，OpenCL則主要被AMD采用。采用標準化的API接口，無論是CUDA還是OpenCL，都可以極大減少開發渲染類GPU的前提投入，后期可以再做相應的優化，這樣可以降低與CUDA等 “地位”穩固的GPU生態直接競爭的難度。

從市場推廣角度看。英偉達的CUDA生態已經問世多年，與下游軟件、驅動廠家已經有了深度合作。大部分廠家對于GPU生態的觀點，往往是不在乎GPU本身好與壞，而是關注GPU好不好用、能不能用。好不好用的評價較為主觀，但采用現成的英偉達CUDA接口進行編程，可以規避大多數未知風險，多數初創企業開發GPU軟件采用統一接口也能增加開發穩定性，降低人才招聘難度。所以，構建自己的GPU生態要慢慢起步，一味求快推廣自家生態只會把風險轉嫁給更多下游開發者。

國產GPU要挑戰CUDA嗎？

CUDA本身涵蓋了多個技術領域，其開發與后續更新都與英偉達自家GPU高度綁定，即使全部開源，第三方廠家也難以完美移植到自家GPU上。從另一個角度看，英偉達在GPU領域的壟斷地位主要通過CUDA平臺上的軟件生態實現。國產GPU若想真正做到與英偉達一較高下，CUDA生態是繞不開的最終BOSS。

知乎用戶對英偉達GPU生態做出分析。國產GPU廠商若無法做到與英偉達的架構、封裝技術、驅動優化等都保持完全一致，CUDA生態就一定不會完美適配其他顯卡。做到完全移植，CUDA生態內的各種庫以及套件等都需要做相應調試，工作量太大。

此外，CUDA也并不是一成不變的。每隔一代GPU，CUDA架構就會發生很大變化。每個驅動小版本推送，CUDA都會做出部分微調。國產GPU如果完全基于CUDA生態進行開發，那它的硬件更新將完全綁定英偉達的開發進程，這樣就失去了主動性，且永遠慢人一步。

不過內開發者也不用悲觀。CUDA本質是一個計算結構，甚至是一個理念，它并不需要英偉達的完全授權。我們可以參考英偉達的有力競爭者AMD。AMD的生態雖然基于開源生態OpenCL開發，但AMD也制作了HIP的編程模式，與CUDA相比，其開發函數甚至可以進行直接替換。如果說英偉達在GPU領域是摸著石頭過河的，那AMD就是摸著英偉達過河。國內GPU廠家或許可以參考AMD發展模式，前期借鑒可以是后期創新的基礎。

寫在最后

CUDA作為英偉達壟斷GPU領域的關鍵力量，是國產廠商必須面對的挑戰。CUDA在誕生之初，為人們在深度學習與AI領域攻堅克難立下汗馬功勞，但如果它被用來鉗制新力量的發展，CUDA也將成為英偉達的馬奇諾防線。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4788

瀏覽量
129422
CUDA

CUDA

+關注

關注
0

文章
121

瀏覽量
13698
英偉達

英偉達

+關注

關注
22

文章
3854

瀏覽量
92076

原文標題：國產GPU繞不開的CUDA生態

文章出處：【微信號：阿寶1990，微信公眾號：阿寶1990】歡迎添加關注！文章轉載請注明出處。

《CST Studio Suite 2024 GPU加速計算指南》

監控/利用率、選擇可用GPU卡子集等內容。 6. 故障排除：針對NVIDIA驅動安裝、多GPU設置、GPU模式、硬件識別、CUDA錯誤、TCC模式等問題給出了相應的解決方法。

發表于 12-16 14:25

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

每個CUDA單元在 OpenCL 編程框架中都有對應的單元。倒金字塔結構GPU存儲體系共享內存是開發者可配置的編程資源，使用門檻較高，編程上需要更多的人工顯式處理。在并行計算架構中，線程

發表于 11-03 12:55

有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理

有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理

發表于 10-20 09:14

打破英偉達CUDA壁壘？AMD顯卡現在也能無縫適配CUDA了

電子發燒友網報道（文/梁浩斌）一直以來，圍繞CUDA打造的軟件生態，是英偉達在GPU領域最大的護城河，尤其是隨著目前AI領域的發展加速，市場火爆，英偉達GPU+CUDA的開發

發表于 07-19 00:16 ?4955次閱讀

大模型發展下，國產GPU的機會和挑戰

電子發燒友網站提供《大模型發展下，國產GPU的機會和挑戰.pdf》資料免費下載

發表于 07-18 15:44 ?10次下載

大模型發展下，<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>的機會和挑戰

英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

7月18日最新資訊，英國創新科技企業Spectral Compute震撼發布了其革命性GPGPU編程工具包——“SCALE”，該工具包實現了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行，標志著在GPU計算領域，NVIDI

發表于 07-18 14:40 ?726次閱讀

軟件生態上超越CUDA，究竟有多難？

神壇的，還是圍繞CUDA打造的一系列軟件生態。 ? 英偉達——CUDA的絕對統治 ? 相信對GPU有過一定了解的都知道，英偉達的最大護城河就是CUD

發表于 06-20 00:09 ?3810次閱讀

借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

Aerial CUDA 加速無線接入網（RAN）可加速電信工作負載，使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率（SE）。

發表于 05-24 11:10 ?676次閱讀

Keil使用AC6編譯提示CUDA版本過高怎么解決？

\' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1

發表于 04-11 07:56

大模型時代，國產GPU面臨哪些挑戰

，國產GPU在不斷成長的過程中也存在諸多挑戰。 ? 在大模型訓練上存在差距 ? 大語言模型是基于深度學習的技術。這些模型通過在海量文本數據上的訓練，學習語言的語法、語境和語義等多層次的信息，用于理解和生成自然語言文本。大語言模型是

發表于 04-03 01:08 ?4771次閱讀

國產GPU在AI大模型領域的應用案例一覽

電子發燒友網報道（文/李彎彎）近一年多時間，隨著大模型的發展，GPU在AI領域的重要性再次凸顯。雖然相比英偉達等國際大廠，國產GPU起步較晚、聲勢較小。不過近幾年，國內不少GPU廠商成

發表于 04-01 09:28 ?4188次閱讀

盤點國產GPU在支持大模型應用方面的進展

電子發燒友網報道（文/李彎彎）目前談到GPU，大家首先想到的應該就是英偉達了。近一年多時間來，隨著大模型的發展，英偉達GPU的強大實力可謂無人不知。而相比之下，國產GPU的聲勢就小了許

發表于 03-29 00:27 ?7407次閱讀

國產GPU搭配國產處理器平臺主機

處理器gpu

GITSTAR 集特工控
發布于 :2024年03月27日 14:11:32

一文詳解GPU硬件與CUDA開發工具

CPU 和 GPU 的顯著區別是：一個典型的 CPU 擁有少數幾個快速的計算核心，而一個典型的 GPU 擁有幾百到幾千個不那么快速的計算核心。

發表于 03-21 10:15 ?1390次閱讀

GPU CUDA 編程的基本原理是什么

神經網絡能加速的有很多，當然使用硬件加速是最可觀的了，而目前除了專用的NPU（神經網絡加速單元），就屬于GPU對神經網絡加速效果最好了

發表于 03-05 10:26 ?955次閱讀