在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產GPU繞不開的CUDA生態

jf_C6sANWk1 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2022-11-29 09:36 ? 次閱讀

國內GPU廠家或許嘗試,摸著英偉達過河。

近日,摩爾線程在北京發布多款軟硬件新品,包括新一代GPU“春曉”、面向個人電腦的消費級顯卡MTT S80和服務器計算卡MTT S3000、一體化計算設備“MCCX元計算一體機”,以及開發套件、數字人解決方案等。GPU“春曉”做為本次發布會的核心產品受到廣泛關注。

“春曉”是摩爾線程的第二顆GPU,也是摩爾線程首顆面相國內消費級市場發售的GPU,它強調游戲、元宇宙與渲染用途,最重要的是,這個GPU支持英偉達CUDA生態。

其實經常關注顯卡的同學總能從英偉達的發布會上聽到CUDA這個詞,例如最新的RTX3060有擁有多少顆CUDA核心,某某游戲首發即支持CUDA生態等。作為顯卡領域的高頻詞匯,很多人好奇CUDA到底是什么?為什么國產顯卡會用到英偉達的技術?本文將帶你了解即熟悉又陌生的CUDA。

CUDA是什么?

CUDA(Compute Unified Device Architecture,統一計算架構)是由英偉達所推出的一種集成技術,是該公司對于GPGPU的正式名稱。通過這個技術,用戶可利用NVIDIA的GPU進行圖像處理之外的運算,CUDA也是首次可以利用GPU作為C-編譯器的開發環境。簡單來說,程序員平時如果不使用特定框架都是針對CPU進行編程的,CUDA是全球最大GPU廠商英偉達推出的針對GPU的編程的架構。

2006年,英偉達發布了CUDA,它提供了GPU編程的簡易接口,程序員可以基于CUDA編譯基于GPU的應用程序,利用GPU的并行計算能力更高效的解決復雜計算難題。在CUDA發布之前,程序員需要到顯卡內核并利用機器碼進行編譯,編程過程相當繁瑣也很困難。CUDA的發布,相當于將較為復雜的底層代碼封裝成了一個個簡單接口,使用時直接調用,其在GPU編程領域的革命性不亞于C、Python、PHP等高等編程語言的發明。當然,CUDA本身也是兼容C語言的,其本身就類似C語言,這可以幫助程序員更快速上手CUDA。現在主流的深度學習框架大多都基于CUDA進行GPU加速運算。

7ca6dda0-6f82-11ed-8abf-dac502259ad0.png

CUDA工作流程 圖源:CSDN

從硬件角度看,英偉達會經常宣傳自家顯卡擁有的CUDA Core數量。CUDA Core其實就是英偉達的流處理器,也就是FP32計算單元,同樣的結構在AMD的GPU內叫做SP。與CUDA Core相對的還有Tensor Core張量核心,從字面上就能看出該核心主要針對深度學習中的Tensor計算設計。Tensor計算就是混合精度計算,即在底層硬件算子層面用半精度(FP16)進行輸入和輸出,使用全精度(FP32)進行計算放置丟失過多精度的操作,這個底層硬件就是Tensor Core。CUDA 9.0引入了一個“warp矩陣函數” C++語言API,以便開發者可以使用GPU上的Tensor Core。

7cb9a84a-6f82-11ed-8abf-dac502259ad0.png

CUDA Core 圖源:知乎

CUDA與 GPGPU的概念一脈相承。GPU就是傳統意義上的顯卡與圖形加速卡。隨著人工智能產業爆炸式增長,導致計算復雜化和算力不足,CPU并行計算能力遠不如GPU,使得GPU在通用計算領域逐漸領先,為了進一步專注通用計算,GPGPU便應運而生。GPGPU與CUDA之間關系十分密切。GPGPU其實是去掉了圖形顯示功能的GPU,它將全部能力都投入到通用計算上,CUDA的出現讓GPU真正實現更廣泛的通用計算。CUDA與GPGPU也直接推動了AI與深度學習的發展與產業革命。

為什么要兼容CUDA?

當我們了解了CUDA是怎么回事,也就方便解釋為什么國產GPU需要兼容CUDA。

前文提到,目前世界上的主流深度學習架構都在使用CUDA,其主要原因就是深度學習的重要載體—GPU市場已被英偉達占領大半。隨之而來的,就是市面上絕大部分GPU相關軟件都是用CUDA開發,國產GPU兼容CUDA可以同時“繼承”英偉達打造好的軟件生態,也有更多資料可供學習,這對于蹣跚起步的國產GPU行業來說,減輕了不少開發難度,也降低了推廣壓力。

從開發角度分析。業內GPU工程師稱目前GPU市場可以籠統的分成兩大塊,分別是計算和渲染。此前國內GPU廠商通常專注與計算方面的研發,也有少部分渲染產品問世,最近摩爾線程發布的GPU強調其具有強大的渲染能力。然而渲染賽道難度較大,其計算復雜度更高,除了通用計算,還包圖形渲染、前后端著色器配置、物體幾何屬性等需要處理。目前世界上標準API主要是CUDA與OpenCL,CUDA是英偉達系統架構,OpenCL則主要被AMD采用。采用標準化的API接口,無論是CUDA還是OpenCL,都可以極大減少開發渲染類GPU的前提投入,后期可以再做相應的優化,這樣可以降低與CUDA等 “地位”穩固的GPU生態直接競爭的難度。

從市場推廣角度看。英偉達的CUDA生態已經問世多年,與下游軟件、驅動廠家已經有了深度合作。大部分廠家對于GPU生態的觀點,往往是不在乎GPU本身好與壞,而是關注GPU好不好用、能不能用。好不好用的評價較為主觀,但采用現成的英偉達CUDA接口進行編程,可以規避大多數未知風險,多數初創企業開發GPU軟件采用統一接口也能增加開發穩定性,降低人才招聘難度。所以,構建自己的GPU生態要慢慢起步,一味求快推廣自家生態只會把風險轉嫁給更多下游開發者。

國產GPU要挑戰CUDA嗎?

CUDA本身涵蓋了多個技術領域,其開發與后續更新都與英偉達自家GPU高度綁定,即使全部開源,第三方廠家也難以完美移植到自家GPU上。從另一個角度看,英偉達在GPU領域的壟斷地位主要通過CUDA平臺上的軟件生態實現。國產GPU若想真正做到與英偉達一較高下,CUDA生態是繞不開的最終BOSS。

知乎用戶對英偉達GPU生態做出分析。國產GPU廠商若無法做到與英偉達的架構、封裝技術、驅動優化等都保持完全一致,CUDA生態就一定不會完美適配其他顯卡。做到完全移植,CUDA生態內的各種庫以及套件等都需要做相應調試,工作量太大。

此外,CUDA也并不是一成不變的。每隔一代GPU,CUDA架構就會發生很大變化。每個驅動小版本推送,CUDA都會做出部分微調。國產GPU如果完全基于CUDA生態進行開發,那它的硬件更新將完全綁定英偉達的開發進程,這樣就失去了主動性,且永遠慢人一步。

不過內開發者也不用悲觀。CUDA本質是一個計算結構,甚至是一個理念,它并不需要英偉達的完全授權。我們可以參考英偉達的有力競爭者AMD。AMD的生態雖然基于開源生態OpenCL開發,但AMD也制作了HIP的編程模式,與CUDA相比,其開發函數甚至可以進行直接替換。如果說英偉達在GPU領域是摸著石頭過河的,那AMD就是摸著英偉達過河。國內GPU廠家或許可以參考AMD發展模式,前期借鑒可以是后期創新的基礎。

寫在最后

CUDA作為英偉達壟斷GPU領域的關鍵力量,是國產廠商必須面對的挑戰。CUDA在誕生之初,為人們在深度學習與AI領域攻堅克難立下汗馬功勞,但如果它被用來鉗制新力量的發展,CUDA也將成為英偉達的馬奇諾防線。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4788

    瀏覽量

    129422
  • CUDA
    +關注

    關注

    0

    文章

    121

    瀏覽量

    13698
  • 英偉達
    +關注

    關注

    22

    文章

    3854

    瀏覽量

    92076

原文標題:國產GPU繞不開的CUDA生態

文章出處:【微信號:阿寶1990,微信公眾號:阿寶1990】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《CST Studio Suite 2024 GPU加速計算指南》

    監控/利用率、選擇可用GPU卡子集等內容。 6. 故障排除:針對NVIDIA驅動安裝、多GPU設置、GPU模式、硬件識別、CUDA錯誤、TCC模式等問題給出了相應的解決方法。
    發表于 12-16 14:25

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應的單元。 倒金字塔結構GPU存儲體系 共享內存是開發者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構中,線程
    發表于 11-03 12:55

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理
    發表于 10-20 09:14

    打破英偉達CUDA壁壘?AMD顯卡現在也能無縫適配CUDA

    電子發燒友網報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態,是英偉達在GPU領域最大的護城河,尤其是隨著目前AI領域的發展加速,市場火爆,英偉達GPU+CUDA的開發
    的頭像 發表于 07-19 00:16 ?4955次閱讀

    大模型發展下,國產GPU的機會和挑戰

    電子發燒友網站提供《大模型發展下,國產GPU的機會和挑戰.pdf》資料免費下載
    發表于 07-18 15:44 ?10次下載
    大模型發展下,<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>的機會和挑戰

    英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創新科技企業Spectral Compute震撼發布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行,標志著在GPU計算領域,NVIDI
    的頭像 發表于 07-18 14:40 ?726次閱讀

    軟件生態上超越CUDA,究竟有多難?

    神壇的,還是圍繞CUDA打造的一系列軟件生態。 ? 英偉達——CUDA的絕對統治 ? 相信對GPU有過一定了解的都知道,英偉達的最大護城河就是CUD
    的頭像 發表于 06-20 00:09 ?3810次閱讀

    借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

    Aerial CUDA 加速無線接入網 (RAN)可加速電信工作負載,使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率 (SE)。
    的頭像 發表于 05-24 11:10 ?676次閱讀
    借助NVIDIA Aerial <b class='flag-5'>CUDA</b>增強5G/6G的DU性能和工作負載整合

    Keil使用AC6編譯提示CUDA版本過高怎么解決?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    發表于 04-11 07:56

    大模型時代,國產GPU面臨哪些挑戰

    國產GPU在不斷成長的過程中也存在諸多挑戰。 ? 在大模型訓練上存在差距 ? 大語言模型是基于深度學習的技術。這些模型通過在海量文本數據上的訓練,學習語言的語法、語境和語義等多層次的信息,用于理解和生成自然語言文本。大語言模型是
    的頭像 發表于 04-03 01:08 ?4771次閱讀
    大模型時代,<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>面臨哪些挑戰

    國產GPU在AI大模型領域的應用案例一覽

    電子發燒友網報道(文/李彎彎)近一年多時間,隨著大模型的發展,GPU在AI領域的重要性再次凸顯。雖然相比英偉達等國際大廠,國產GPU起步較晚、聲勢較小。不過近幾年,國內不少GPU廠商成
    的頭像 發表于 04-01 09:28 ?4188次閱讀
    <b class='flag-5'>國產</b><b class='flag-5'>GPU</b>在AI大模型領域的應用案例一覽

    盤點國產GPU在支持大模型應用方面的進展

    電子發燒友網報道(文/李彎彎)目前談到GPU,大家首先想到的應該就是英偉達了。近一年多時間來,隨著大模型的發展,英偉達GPU的強大實力可謂無人不知。而相比之下,國產GPU的聲勢就小了許
    的頭像 發表于 03-29 00:27 ?7407次閱讀
    盤點<b class='flag-5'>國產</b><b class='flag-5'>GPU</b>在支持大模型應用方面的進展

    國產GPU搭配國產處理器平臺主機

    處理器gpu
    GITSTAR 集特工控
    發布于 :2024年03月27日 14:11:32

    一文詳解GPU硬件與CUDA開發工具

    CPU 和 GPU 的顯著區別是:一個典型的 CPU 擁有少數幾個快速的計算核心,而一個典型的 GPU 擁有幾百到幾千個不那么快速的計算核心。
    的頭像 發表于 03-21 10:15 ?1390次閱讀
    一文詳解<b class='flag-5'>GPU</b>硬件與<b class='flag-5'>CUDA</b>開發工具

    GPU CUDA 編程的基本原理是什么

    神經網絡能加速的有很多,當然使用硬件加速是最可觀的了,而目前除了專用的NPU(神經網絡加速單元),就屬于GPU對神經網絡加速效果最好了
    的頭像 發表于 03-05 10:26 ?955次閱讀
    <b class='flag-5'>GPU</b> <b class='flag-5'>CUDA</b> 編程的基本原理是什么
    主站蜘蛛池模板: 国产黄色三级三级三级 | 国产三级 在线播放 | 激情六月丁香婷婷 | 国产女主播在线播放一区二区 | 拍拍拍美女黄色1000视频 | 四虎影视大全免费入口 | 女人张腿让男桶免费视频网站 | 午夜在线亚洲男人午在线 | 欧美性淫爽www视频播放 | 一道精品视频一区二区三区男同 | 男女免费在线视频 | 欧美在线视频一区二区三区 | 中文字幕一区在线观看 | 全部在线播放免费毛片 | 在线中文天堂 | 激情福利 | 狠狠五月天 | 农村苗族一级特黄a大片 | 亚洲欧美圣爱天天综合 | 噜噜噜动态图超猛烈 | 天天视频天天爽 | 中国性猛交xxxxx免费看 | 丁香午夜婷婷 | 美女张开腿露出尿口让男人桶 | 我要看18毛片 | 国产三级精品三级 | 日本黄色免费片 | 日本操穴| 亚洲电影在线看 | 性开放网站 | 久久精品国产福利国产琪琪 | 亚洲精品二区中文字幕 | 亚洲人成影院在线高清 | 久操久操久操 | 伊人久久天堂 | 色视频在线观看完整免费版 | 手机精品视频在线观看免费 | 2020av在线 | 国产网站免费 | 免费看 s色 | 国产一区二区三区乱码 |