國內GPU廠商有各自的專注領域,其中不乏自主研發的產品,在IP、微架構創新、軟硬件結合等方面均有建樹。隨著ChatGPT掀起AI熱潮,大模型對算力的要求會越來越高,國內GPU廠商以圖形處理、通用GPU(GPGPU)為根基,逐步涉足大模型應用,下面列舉幾家具有實力的國內GPU廠商。
登臨科技
登臨科技專注于高性能通用計算平臺的芯片研發與技術創新,致力于打造云邊端一體、軟硬件協同、訓練推理融合的前沿芯片產品和平臺化基礎系統軟件。
基于GPGPU的軟件定義的片內異構計算架構,登臨科技自主研發了GPU+,在兼容CUDA/OpenCL在內的編程模型和軟件生態的基礎上,通過架構創新,完美解決了通用性和高效率的雙重難題。大量客戶產品實測證明,針對AI計算,GPU+相比傳統GPU在性能尤其是能效上有顯著提升。
圖片來源:登臨科技
登臨科技GPU+架構經過優化,在基準測試中使得計算單元、片上內存的延遲可以做到30+ cycle,傳統GPU為數百cycle。
采用“片上內存共享”技術,帶寬僅為國際主流方案的五分之一到六分之一,帶寬降低帶來的好處是更高的能效比、更高的并行性。
此外,GPU+架構將計算密度和計算效率集中在矩陣單元,綜合上述特性,基于登臨科技GPU+架構的產品與國際旗艦產品相比,具有三到四倍單卡能效比優勢。
圖片來源:登臨科技
在生態上,登臨科技GPU+兼容國內外主流CPU、服務器,以及Network引擎,可有效降低用戶的遷移成本。憑借創新的架構、獨有的技術和完整的生態支持,面向生成式AI的應用和大模型發展浪潮,登臨科技可提供強有競爭力的算力加速方案,全面助力用戶產品的性能提升以及應用落地。
中微電科技
中微電科技專注GPU技術研發,GPU/顯卡產品主要應用于信創市場、消費市場、人工智能、邊緣計算等領域。中微電科技自主研發的指令集MVP ISA被工信部評定為“完全自主知識產權指令集”,成功進行多次基于MVP核的SoC芯片流片,取得處理器領域核心發明專利22項。
在“十四五”規劃期間,中微電科技完成“南風”系列GPU芯片MVP核處理器架構、GPU核心自主知識產權IP、MVP指令集、編譯器及軟件棧等創新迭代升級及系統適配對接。完成“南風一號”量產、“南風二號”量產和“南風三號”預研,打造GPUIP級、芯片級和板塊級產品,形成“自主+安全”的場景解決方案。
圖片來源:中微電科技
中微電科技“南風一號”已于2022年完成流片,并于回片當天點亮成功。“南風一號”顯卡已與長城信創臺式機、麒麟操作系統、飛騰處理器、奇安信可信瀏覽器等完全兼容、運行穩定,性能滿足黨政、金融及安防等信創產業鏈專用整機電腦PC顯卡需求。
通過“南風一號”成功點亮可以充分驗證自研GPU IP滿足桌面電腦顯示的基本功能和性能要求。相對于授權IP受制于人,功能性能受限及產品同質化競爭的問題,自研IP不受任何第三方控制,可自主迭代發展,有望徹底解決卡脖子問題,打造自主GPU產業生態。只有堅持自主IP路線,深度的自研才能在產品和價格上形成競爭力,成為獨特的IP護城河。
沐曦集成電路
沐曦集成電路(下文簡稱沐曦)專注于設計具有完全自主知識產權,針對異構計算等各類應用的高性能通用GPU芯片。首款異構GPU產品MXN100采用7nm制程,已于2022年8月回片點亮,主要應用于推理側;應用于AI訓練及通用計算的產品MXC500已于2022年12月交付流片,公司計劃2024年全面量產。
沐曦擁有完全自主研發的GPU IP、指令集和架構,以及兼容主流GPU生態的完整軟件棧(MXMACA),產品具備高能效、高通用性。目前已推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓練及通用計算,以及MXG系列GPU(曦彩)用于圖形渲染,可滿足數據中心對高能效和高通用性的算力需求。
圖注:沐曦產品系列。來源:沐曦、財通證券研究所
景嘉微
景嘉微研發了JM5400、JM7200、JM9為代表的系列圖形處理芯片,目前正籌集資金用于“高性能通用GPU芯片研發及產業化項目”、“通用GPU先進架構研發中心建設項目”。
在技術儲備方面,截至2022年12月31日,景嘉微共申請238項專利(193項國家發明專利、31項實用新型專利、10項國際專利、4項外觀專利),較2021年同比增長16.10%,其中87項發明專利、29項實用新型專利、4項外觀專利均已授權,登記了119項軟件著作權,登記了2項集成電路布圖。
圖注:景嘉微GPU產品JM9規格
2022年公司圍繞核心產品保持高研發投入,成功研發JM9系列第二款GPU芯片,并完成適配測試工作。2022年和1Q23受政策波動影響,市場需求萎縮,景嘉微產品銷量減少。
景嘉微成長動力主要為算力需求有望拉動圖形渲染GPU市場,進一步打開信創需求,對辦公PC的GPU性能提出更高要求,推動獨立顯卡成為主流配置,信創GPU市場有望迎來擴容。同時隨著數字化的發展,云游戲、數字孿生、元宇宙、工業數字化等產業成為高性能渲染GPU新的增長點。
圖注:景嘉微業績預測(來源:浙商證券研究所)
龍芯中科
龍芯中科掌握了處理器核及相關IP核設計的核心技術,是國內極少數使用自主架構研制通用處理器的企業。龍芯中科掌握指令系統、處理器核微結構、GPU以及各種接口IP等芯片核心技術,在關鍵技術上進行自主研發,擁有大量的自主知識產權,已取得專利400余項。龍芯指令系統和處理器IP核的關鍵技術已申請相關專利,相關處理器芯片也申請了集成電路布圖設計版權。
圖注:龍芯中科的核心技術(來源:龍芯中科招股書)
在顯卡GPU驅動層面,根據龍芯系統架構的特點和優勢,通過數據布局、傳輸通路、協作機制等優化手段,圖形系統可充分釋放GPU的性能潛力。在渲染庫、解碼庫等基礎圖形庫層面,結合龍芯CPU微結構和指令集的特點進行算法優化,從而推動整體系統性能的改善。
海光信息
海光信息同時具備CPU和DCU研發能力,在電信、金融、能源等重要行業領域實現訂單放量。當前海光四號、海光五號CPU產品,以及深算二號、深算三號DCU(深度計算單元)產品研發進展順利。
海光DCU系列產品以GPGPU架構為基礎,兼容“類CUDA”環境,具備豐富軟硬件生態,全面覆蓋支持深度學習訓練場景,滿足AI、大數據處理、商業計算等高性能需求。深海一號DCU產品在典型應用場景下性能已達國際同類型產品同期水平,已經在北京大學高性能計算系統及百度飛槳AI大框架中應用落地,未來有望持續受益于AIGC時代算力需求爆發以及國產替代下的龐大市場。
圖注:海光信息業績預估
從消費應用到大模型,國內GPU如何突破?
目前實現商業化的國內GPU產品以消費應用居多,據Imagination中國區技術總監艾克介紹,消費應用的GPU和大模型中的GPU有所不同,國內GPU廠商要將技術和產品擴展到大模型應用,需要關注幾點:
(1)技術研發:大規模GPU模型需要高性能的計算能力和大規模的數據存儲能力,需要加強對GPU技術的研發力量,提升核心技術水平。包括研發GPU架構、設計和制造工藝的能力,提高芯片性能和功耗比,推動技術創新。
(2)創新應用:需要在新的應用領域進行創新,如人工智能、云計算、大數據,自動駕駛等。這些領域對計算能力的要求非常高,GPU可以提供并行計算能力,因此加強與這些領域的合作,推動GPU技術的應用。
(3)產業環境:需要打造良好的產業環境,吸引和培育GPU相關企業和人才。加大對GPU產業鏈關鍵環節的支持力度。同時,建立起完善的知識產權保護體系,保護自主研發成果。
(4)先進制造工藝:當前最先進制程和高GPU算力的設計,或受到美國出口技術的限制。如果國內先進制程技術能夠獲得突破,那么將十分利于國產GPU的發展。
圖注:消費級GPU與大模型GPU的區別(來源:Imagination)
小結
海外廠商的發展過程有幾個特點值得觀察。首先,選擇技術方向或許比快速展開業務更加重要。NVIDIA很早就意識到GPU在科學計算領域的潛力,并將其應用于人工智能、深度學習等領域。提前布局為未來趨勢做好準備。
其次,持續進行微架構創新。NVIDIA始終保持著創新和領導地位,與不斷研發新的GPU微架構和技術、提升性能和能效有較大關系。NVIDIA在GPU微架構上不斷演進,推出了包括Tesla、Fermi、Kepler、Maxwell、Pascal、Volta、Turing、Ampere在內的架構,每一次微架構的創新涵蓋了許多關鍵技術的引入和改進,推動了游戲圖形性能的提升,也使得GPU在科學計算、人工智能等領域發揮了重要作用。
此外,國產GPU發展初期可以通過兼容CUDA的部分功能,快速拓展市場,降低開發難度和用戶移植成本,但是長期來看,國內GPU廠商還是要不斷提升自身的軟硬件實力,打造一個自己的、獨具特色的軟硬件生態系統。
審核編輯黃宇
-
芯片
+關注
關注
459文章
51988瀏覽量
434180 -
gpu
+關注
關注
28文章
4889瀏覽量
130469 -
AI
+關注
關注
87文章
33711瀏覽量
274442
發布評論請先 登錄

你不了解的示波器前面板
鏈接腳本對一些命令不了解
總結使用 Vim 的過程中不得不了解的一些指令和注意事項
你所不了解的自動焊錫機
你到底了不了解物聯網
談談你所不了解的PCB
不了解中斷,還怎么玩單片機?資料下載

評論