AI需要多元異構(gòu)算力提供支持,拉動(dòng)AI芯片需求。人工智能算法需要從海量的圖像、語(yǔ)音、視頻等非結(jié)構(gòu)化數(shù)據(jù)中挖掘信息。從大模型的訓(xùn)練、場(chǎng)景化的微調(diào)以及推理應(yīng)用場(chǎng)景,都需要算力支撐。而以CPU為主的通用計(jì)算能力已經(jīng)無(wú)法滿足多場(chǎng)景的AI需求。以CPU+AI芯片(GPU、FPGA、ASIC)提供的異構(gòu)算力,并行計(jì)算能力優(yōu)越、具有高互聯(lián)帶寬,可以支持AI計(jì)算效力實(shí)現(xiàn)最大化,成為智能計(jì)算的主流解決方案。
服務(wù)器中的CPU和AI卡的數(shù)量并不固定,會(huì)根據(jù)客戶(hù)應(yīng)用需求調(diào)整,對(duì)于AI服務(wù)器來(lái)講,較為常見(jiàn)的是配備2個(gè)CPU,以及八個(gè)AI卡。而相比于AI服務(wù)器,傳統(tǒng)的通用服務(wù)器則以CPU為主。因此,AI的發(fā)展將極大拉動(dòng)GPGPU、TPU、NPU等AI芯片的需求。
AI 計(jì)算需要多元異構(gòu)算力提供支持,將極大拉動(dòng)GPGPU、AISC 等 AI 芯片的需求。中國(guó) AI 芯片市場(chǎng)規(guī)模有望快速增長(zhǎng),據(jù)艾瑞咨詢(xún)發(fā)布的《2022 年中國(guó)人工智能產(chǎn)業(yè)研究報(bào)告(Ⅴ)》,預(yù)計(jì) 2027 年達(dá)到 2164 億元。
中國(guó)AI芯片市場(chǎng)將保持高速增長(zhǎng),AI推理芯片份額有望持續(xù)提升,國(guó)產(chǎn)化AI芯片占比有望提升。2022年,中國(guó)的AI芯片市場(chǎng)規(guī)模約385億元。隨著AI發(fā)展以及智算中心建設(shè)浪潮,該市場(chǎng)預(yù)計(jì)將保持高增長(zhǎng)趨勢(shì)。據(jù)艾瑞咨詢(xún)測(cè)算,到2027年,中國(guó)的AI芯片市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到2164億元。另外,在我國(guó)高性能及AI服務(wù)器中,GPGPU憑借其優(yōu)秀的性能和通用能力占比92%,剩下份額由AISC和FPGA分享。隨著AI模型的優(yōu)化落地,AI推理芯片的占比將日益提升。據(jù)艾瑞咨詢(xún),2022年,中國(guó)AI訓(xùn)練芯片以及AI推理芯片的占比分別為47.2%和52.8%。
AI芯片領(lǐng)域的三類(lèi)玩家。大模型的訓(xùn)練需要大規(guī)模的訓(xùn)練數(shù)據(jù)以及強(qiáng)大的計(jì)算資源,需要多卡多機(jī)協(xié)同完成。這對(duì)AI芯片本身的性能,以及多卡多機(jī)的互聯(lián)提出了很高的要求。目前,在AI芯片領(lǐng)域,有三類(lèi)玩家。一種是以Nvidia、AMD為代表的實(shí)力強(qiáng)勁的老牌芯片巨頭,這些企業(yè)積累了豐富的經(jīng)驗(yàn),產(chǎn)品性能突出。
另一種是以Google、百度、華為為代表的云計(jì)算巨頭,這些企業(yè)紛紛布局通用大模型,并自己開(kāi)發(fā)了AI芯片、深度學(xué)習(xí)平臺(tái)等支持大模型發(fā)展。如google的TensorFlow以及TPU,華為的鯤鵬昇騰、CANN及Mindspore。
最后是一些小而美的AI芯片獨(dú)角獸,如寒武紀(jì)、壁仞等。
英偉達(dá)占據(jù)80%以上中國(guó)加速卡市場(chǎng)份額,國(guó)產(chǎn)AI芯片亟待發(fā)展。根據(jù)IDC的數(shù)據(jù)顯示,2021年中國(guó)加速卡的出貨數(shù)量已經(jīng)超過(guò)80萬(wàn)片,其中Nvidia占據(jù)了超過(guò)80%的市場(chǎng)份額。剩下的份額有AMD、百度、寒武紀(jì)、燧原科技、新華三、華為、Intel和賽靈思等品牌。
1、英偉達(dá):全球GPU龍頭
英偉達(dá)占據(jù)芯片市場(chǎng)絕對(duì)優(yōu)勢(shì)。長(zhǎng)期以來(lái),英偉達(dá)在高端GPU市場(chǎng)占據(jù)絕對(duì)主導(dǎo)地位,現(xiàn)如今已量產(chǎn)的主流A100芯片相比前代產(chǎn)品V100,性能得到顯著提高,代表當(dāng)今高端芯片水平。最新一代H100芯片也已經(jīng)亮相,即將量產(chǎn)。天數(shù)智芯數(shù)據(jù)顯示,2021年英偉達(dá)在中國(guó)云端AI訓(xùn)練芯片市場(chǎng)的份額達(dá)到90%。據(jù)IDC,在2021年中國(guó)出貨的80多萬(wàn)張加速卡中,英偉達(dá)占據(jù)超過(guò)80%份額。芯片的研發(fā)周期較長(zhǎng),英偉達(dá)具有絕對(duì)先行優(yōu)勢(shì),雖然目前國(guó)內(nèi)企業(yè)突破英偉達(dá)壟斷仍然任重道遠(yuǎn),但寒武紀(jì)、華為AI芯片快速發(fā)展,有望逐步進(jìn)行國(guó)產(chǎn)替代。
受制裁影響,英偉達(dá)對(duì)部分產(chǎn)品性能進(jìn)行 “閹割”,推出“中國(guó)版芯片”A800、H800。2022年10月,美國(guó)發(fā)布了針對(duì)中國(guó)的先進(jìn)計(jì)算與半導(dǎo)體產(chǎn)品的出口管制,限制美國(guó)企業(yè)向中國(guó)出口先進(jìn)高端芯片設(shè)備。在新管制的限制下,英偉達(dá)的A100、H100被禁止售賣(mài)給中國(guó),而采用12nm工藝、性能較低的V100 GPU芯片不在管控之列。針對(duì)此次制裁,英偉達(dá)對(duì)A100的部分性能進(jìn)行“閹割”,推出A800。
相比于A100,A800在單卡計(jì)算性能上沒(méi)有差別,但是互聯(lián)帶寬從600GB/s下降到了400GB/s,在一定程度上影響了如大模型訓(xùn)練等多卡互聯(lián)場(chǎng)景的性能。目前,A800已實(shí)現(xiàn)量產(chǎn),并在中國(guó)規(guī)模化落地應(yīng)用。英偉達(dá)還推出了旗艦芯片H100的替代版H800,目前還未量產(chǎn)。
2、海光信息:國(guó)產(chǎn)高性能CPU和GPGPU領(lǐng)軍企業(yè)
海光信息專(zhuān)注于研發(fā)、設(shè)計(jì)和銷(xiāo)售高端處理器(CPU以及GPGPU),持續(xù)技術(shù)創(chuàng)新、產(chǎn)品迭代。海光信息的主要產(chǎn)品為應(yīng)用于服務(wù)器和工作站等設(shè)備中的通用處理器(CPU)和協(xié)處理器(DCU,即GPGPU)。海光處理器性能出眾,同時(shí)軟硬件生態(tài)豐富、工具鏈完整、應(yīng)用遷移成本低。另外,海光CPU與DCU雖脫胎于AMD,但經(jīng)過(guò)多年獨(dú)立自主研發(fā)迭代,已經(jīng)實(shí)現(xiàn)自主可控、安全可靠,是***之光。目前,蘇州昆山、成都等多地超算中心已經(jīng)搭載海光CPU與DCU,為社會(huì)提供優(yōu)質(zhì)算力。
海光CPU一、二代均已商業(yè)化, 三代初亮相,四代有序研發(fā)中。海光DCU一代已商業(yè)化應(yīng)用,二代研發(fā)中。公司持續(xù)技術(shù)創(chuàng)新和演進(jìn),堅(jiān)持走“銷(xiāo)售一代, 驗(yàn)證一代, 研發(fā)一代”的產(chǎn)品開(kāi)發(fā)策略。公司建立了完善的高端處理器的研發(fā)環(huán)境和流程,持續(xù)開(kāi)發(fā)多代產(chǎn)品,產(chǎn)品性能不斷提高,同時(shí)功能不斷完善豐富。海光CPU的四代產(chǎn)品中,海光一號(hào)和海光二號(hào)均實(shí)現(xiàn)了商業(yè)化應(yīng)用,海光三號(hào)已亮相發(fā)布會(huì),海光四號(hào)處于研發(fā)階段。海光DCU于2018年啟動(dòng)DCU第一代產(chǎn)品深算一號(hào)的產(chǎn)品研發(fā),于2020年1月啟動(dòng)了深算二號(hào)的研發(fā),截至2022年6月,深算一號(hào)已實(shí)現(xiàn)商業(yè)化應(yīng)用。
海光DCU某些硬件性能與英偉達(dá)的A100、AMD的MI100相近。海光DCU雙精度計(jì)算能力突出。據(jù)北京大學(xué)高性能計(jì)算系統(tǒng)中標(biāo)公告(HCZB-2021-ZB0364),海光信息的DCU Z100的通用計(jì)算核心達(dá)到8192個(gè)。其關(guān)鍵性能指標(biāo)實(shí)現(xiàn):FP64 10.8TFlops,顯存32GB HBM2,對(duì)比全球芯片巨頭的高端AI芯片不遑多讓。英偉達(dá)A100的相關(guān)指標(biāo)為:FP64 9.7 TFlops、顯存40/80GB HBM2。AMD MI100的相關(guān)指標(biāo)為:FP64 11.5 TFlops、顯存32GB HBM2。
海光DCU生態(tài)豐富,工具鏈完整。海光的DCU脫胎于AMD,兼容主流生態(tài)——開(kāi)源ROCmGPU計(jì)算生態(tài),支持TensorFlow、Pytorch和PaddlePaddle等主流深度學(xué)習(xí)框架、適配主流應(yīng)軟件。ROCm又被稱(chēng)為類(lèi)CUDA,現(xiàn)有CUDA上運(yùn)行的應(yīng)用可以低成本遷移到基于ROCm的海光平臺(tái)上運(yùn)行。
2022年,海光發(fā)布國(guó)內(nèi)首個(gè)全精度(FP64)異構(gòu)計(jì)算平臺(tái),該平臺(tái)搭載CPU海光三號(hào)和DCU海光深算,涵蓋數(shù)值模擬、AI訓(xùn)練、AI推理所需的多樣算力,實(shí)現(xiàn)了智能計(jì)算與數(shù)值運(yùn)算的深度融合。同時(shí),此平臺(tái)可全面支持TensorFlow、PyTorch、Caffe2等主流AI深度學(xué)習(xí)框架,目前已超過(guò)1000種應(yīng)用軟件部署在該平臺(tái)上。
3、寒武紀(jì):國(guó)產(chǎn)AI芯片先行者
寒武紀(jì)始終深耕芯片研發(fā),不斷推陳出新、實(shí)現(xiàn)技術(shù)進(jìn)步。寒武紀(jì)成立于2016年,專(zhuān)注人工智能芯片產(chǎn)品的研發(fā)與創(chuàng)新。公司成立之初便開(kāi)始了對(duì)AI芯片領(lǐng)域的探索創(chuàng)新。并在2016年年底成功研發(fā)出全球首款A(yù)I手機(jī)芯片——寒武紀(jì)1A。2017年,這款芯片被搭載于華為的高端系統(tǒng)級(jí)芯片麒麟970,應(yīng)用于Mate10手機(jī),并獲得了廣泛好評(píng)。芯片可以在功耗極低的前提下,涵蓋人臉識(shí)別、語(yǔ)音識(shí)別、圖像增強(qiáng)等多種功能。此后,寒武紀(jì)又陸續(xù)推出了多款A(yù)I芯片產(chǎn)品,包括云端訓(xùn)練芯片MLU100、邊緣推理芯片MLU270、車(chē)載推理芯片MLU290等 。這些產(chǎn)品都具有高性能、低功耗、高集成度等特點(diǎn),在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域都有著優(yōu)異的表現(xiàn)。
思元370是寒武紀(jì)的首款訓(xùn)練推理一體芯片,也是其云端產(chǎn)品的第三代。思元370采用了7nm制程工藝,并成為首款采用Chiplet技術(shù)的人工智能芯片。該芯片最大算力可達(dá)256TOPS(INT8),是上一代云端推理產(chǎn)品思元270算力的兩倍,同時(shí)該芯片還支持LPDDR5內(nèi)存,內(nèi)存帶寬是270的三倍,因此可以在板卡有限的功耗范圍內(nèi)為人工智能芯片分配更多的能源,從而輸出更高的算力。思元370智能芯片還采用了先進(jìn)的Chiplet技術(shù),支持靈活的芯粒組合,僅用單次流片便可以實(shí)現(xiàn)多款智能加速卡產(chǎn)品的商用。目前,該公司已推出三款加速卡:MLU370-S4、MLU370-X4和MLU370-X8,包含應(yīng)用于計(jì)算密度高的數(shù)據(jù)中心、針對(duì)專(zhuān)注人工智能推理相關(guān)業(yè)務(wù)的互聯(lián)網(wǎng)廠商需求和應(yīng)用于對(duì)算力帶寬要求高的訓(xùn)練任務(wù),滿足用戶(hù)的多樣化需求。
新一代訓(xùn)練芯片寒武紀(jì)590還未量產(chǎn),據(jù)悉訓(xùn)練能力突出。寒武紀(jì)最新一代云端智能訓(xùn)練芯片思元590還未正式發(fā)布,據(jù)寒武紀(jì)董事長(zhǎng)在2022 WAIC上介紹,思元590采用全新的MLUarch05架構(gòu),實(shí)測(cè)訓(xùn)練性能較在售產(chǎn)品有了顯著提升。思元590可提供更大的內(nèi)存容量和更高的內(nèi)存帶寬,其PCIe接口也較上代實(shí)現(xiàn)了升級(jí)。
審核編輯 :李倩
-
芯片
+關(guān)注
關(guān)注
459文章
52343瀏覽量
438464 -
AI
+關(guān)注
關(guān)注
88文章
34733瀏覽量
276813 -
人工智能
+關(guān)注
關(guān)注
1805文章
48887瀏覽量
247787
原文標(biāo)題:大模型AI興起:新一輪芯片、服務(wù)器、智算等浪潮來(lái)襲
文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論