一個(gè)新的時(shí)代似乎已經(jīng)到來。
英特爾,這位CPU領(lǐng)域的絕對(duì)王者開始頻頻與“軟件為先”和“XPU”等詞進(jìn)行捆綁。同樣值得關(guān)注的是英特爾的老對(duì)手英偉達(dá)以及AMD,在過去的一年中,英偉達(dá)宣布收購(gòu)Arm,AMD則提出收購(gòu)賽靈思。
冥冥之中,這些巨頭似乎都開始瞄準(zhǔn)了同一個(gè)方向——“異構(gòu)計(jì)算”。
異構(gòu)計(jì)算時(shí)代到來
所謂異構(gòu),就是將CPU、DSP、GPU、ASIC、FPGA等不同制程架構(gòu)、不同指令集、不同功能的計(jì)算單元,組合起來形成一個(gè)混合的計(jì)算系統(tǒng)。
為什么需要異構(gòu)計(jì)算?原因很簡(jiǎn)單:我們需要越來越強(qiáng)大、越來越高效的計(jì)算系統(tǒng)。在過去,隨著半導(dǎo)體技術(shù)的進(jìn)步和頻率的提升,絕大多數(shù)計(jì)算機(jī)應(yīng)用不需要結(jié)構(gòu)性的變化,或者特定的硬件加速,即可不斷提升性能,但是現(xiàn)代應(yīng)用經(jīng)常會(huì)碰到內(nèi)存、功耗方面的限制。此時(shí),引入特定單元、讓計(jì)算系統(tǒng)變成混合結(jié)構(gòu)就成了必然,每一種不同類型的計(jì)算單元都可以去執(zhí)行自己最擅長(zhǎng)的任務(wù)。
有資料顯示,異構(gòu)計(jì)算提高了處理效率。異構(gòu)計(jì)算能夠充分發(fā)揮CPU/GPU在通用計(jì)算上的靈活性,及時(shí)響應(yīng)數(shù)據(jù)處理需求,搭配上FPGA/ASIC等特殊能力,來充分發(fā)揮協(xié)處理器的效能,根據(jù)特定需求合理地分配計(jì)算資源。
其次異構(gòu)計(jì)算成本利好。由于目前神經(jīng)網(wǎng)絡(luò)算法和與之對(duì)應(yīng)的計(jì)算架構(gòu)層出不窮,如果采用不斷更新ASIC架構(gòu)的方式,最終下沉到用戶和企業(yè)身上,就會(huì)導(dǎo)致使用成本和替換成本過高。因此,最好的解決辦法就是將多種計(jì)算架構(gòu)融合在一起,生命周期變長(zhǎng),在產(chǎn)業(yè)落地上具有更大的優(yōu)勢(shì)。
英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)曾在采訪中表示,如果說傳統(tǒng)計(jì)算架構(gòu)是一種燒汽油的引擎,那么異構(gòu)計(jì)算就是一種混合動(dòng)力引擎甚至新能源引擎,并且“動(dòng)力十足”,能夠推動(dòng)人工智能、5G等新興領(lǐng)域更好、更快地發(fā)展。
三大巨頭割據(jù)戰(zhàn)
事實(shí)上,異構(gòu)計(jì)算并不是近兩年來興起的概念,早在上世紀(jì)80年代,異構(gòu)計(jì)算就已經(jīng)誕生,隨著計(jì)算需求呈指數(shù)級(jí)增長(zhǎng),異構(gòu)計(jì)算也經(jīng)歷了CPU+GPU、FPGA等多種路線之爭(zhēng)。
2003年,AMD推出了業(yè)內(nèi)首款x86-64架構(gòu)處理器,開啟了64位計(jì)算時(shí)代。2006年,AMD收購(gòu)了著名GPU廠商ATI,就在宣布收購(gòu)的第二天,AMD便迫不及待地宣布要把高性能CPU、GPU做到同一顆芯片上,并在三個(gè)月后為這一項(xiàng)目命名為“Fusion”(融聚),又過了兩個(gè)月提出了全新的“APU”(加速處理器)概念,后來甚至還把Fusion寫入了公司口號(hào)中。看上去似乎是另外一種集成顯卡,從主板上轉(zhuǎn)移到處理器中而已,但是關(guān)鍵就在“加速”二字。怎么去加速?答案就是——異構(gòu)計(jì)算。
當(dāng)然,“Fusion”這條路走得很艱辛。從最初宣布到最終發(fā)布,APU花了足足四年半的光陰,期間經(jīng)歷了GPU加速計(jì)算的崛起、GPU/GPU地位之爭(zhēng),直到2010年初才開花結(jié)果。
有意思的是,也就在同一年,英特爾也迅速跟進(jìn),發(fā)布了Sandy Bridge,將CPU、GPU整合到了一起,雖然被業(yè)界戲稱為“只不過是在CPU里集成了顯卡”,沒有實(shí)現(xiàn)APU那樣的高度融合,但也開始了異構(gòu)計(jì)算的探索之路。而在這期間,英偉達(dá)也以其大規(guī)模的并行GPU和專用GPU編程框架CUDA進(jìn)入了主流市場(chǎng)。
2012年,AMD成立了一個(gè)HSA(異構(gòu)系統(tǒng)架構(gòu))基金會(huì),拉了ARM、Imagination、聯(lián)發(fā)科、德州儀器、三星等眾多一線大廠一同上陣,主推一個(gè)叫做OpenCL的異構(gòu)編程框架。HSA聯(lián)盟發(fā)展了兩年也有一些新成員加入,但是總的來說對(duì)英特爾威脅不大。
直到2017年,賽靈思推出的一款新器件對(duì)英特爾造成了直接的威脅。一款基于16nm FinFET 3D晶體管的FPGA新品---Zynq UltraScale MPSoC,這其實(shí)就是一款異構(gòu)處理器。賽靈思表示,用了他們的新工具可以把可編程資源利用率提升到95%,這基本上和ASIC沒有兩樣。有報(bào)道指出,此舉直接推動(dòng)了英特爾收購(gòu)賽靈思的競(jìng)爭(zhēng)對(duì)手——Altera。
業(yè)界對(duì)于英特爾收購(gòu)Altera的決定議論紛紛,但不可否認(rèn)的是,英特爾此舉是要加強(qiáng)其在數(shù)據(jù)中心領(lǐng)域的競(jìng)爭(zhēng)力。有趣的是,在英特爾拿下Altera的時(shí)候,市場(chǎng)曾經(jīng)傳言賽靈思曾經(jīng)考慮并購(gòu) AMD,現(xiàn)在則是 AMD 收購(gòu)賽靈思了。
2019年,英偉達(dá)以 70 億美元收購(gòu)服務(wù)器端到端解決方案廠商邁絡(luò)思 (Mellanow),2020年400億美元收購(gòu) Arm,都是為了在未來的數(shù)據(jù)中心市場(chǎng)搶占先機(jī)。
異構(gòu)計(jì)算會(huì)成為未來數(shù)據(jù)中心處理器的主流,在這方面,英偉達(dá)和 AMD 都有著相同的戰(zhàn)略思路。
英偉達(dá)收購(gòu)Arm讓雄心勃勃想在數(shù)據(jù)中心市場(chǎng)大干一場(chǎng)的 AMD 直接感受到了威脅,也促使蘇姿豐去考慮收購(gòu)賽靈思。AMD 同樣擁有 CPU 和 GPU 產(chǎn)品,賽靈思可以給他們帶來數(shù)據(jù)中心市場(chǎng)的加速能力。
不難發(fā)現(xiàn),在英特爾、英偉達(dá)以及AMD三方混戰(zhàn)多年后,隨著異構(gòu)計(jì)算的到來,市場(chǎng)局面開始出現(xiàn)松動(dòng)。經(jīng)過一系列收購(gòu)以及自研行為,這三大處理器頭部廠商都在向CPU+GPU+FPGA/NPU的方向靠攏,為異構(gòu)計(jì)算之戰(zhàn)備足“糧草”。
時(shí)至今日,我們?cè)倏催@三大巨頭,他們已經(jīng)產(chǎn)生了很大的變化。
2020末,英特爾宣布重返獨(dú)顯市場(chǎng),正式發(fā)布了獨(dú)立顯卡iRIS Xe Max。在一系列的收購(gòu)行為后,英特爾彌補(bǔ)了PC產(chǎn)品線的關(guān)鍵零部件,也成功實(shí)現(xiàn)了XPU異構(gòu)計(jì)算架構(gòu)。
而AMD對(duì)賽靈思的收購(gòu),也釋放出強(qiáng)化異構(gòu)計(jì)算布局的信號(hào)。在具備“CPU+GPU”計(jì)算架構(gòu)的基礎(chǔ)上,F(xiàn)PGA的可編程特質(zhì),能進(jìn)一步提升計(jì)算平臺(tái)的靈活性,從而適應(yīng)AI時(shí)代根據(jù)不同工作負(fù)載進(jìn)行加速的需求。
同樣重要的是,誠(chéng)如前文所言賽靈思本身對(duì)異構(gòu)計(jì)算就頗有研究,2017年推出異構(gòu)計(jì)算處理器,同時(shí)還推出了Versal ACAP異構(gòu)計(jì)算平臺(tái),以縮短車載多傳感器同步和融合所帶來的系統(tǒng)整體響應(yīng)時(shí)間。
英偉達(dá)收購(gòu)ARM,不僅彌補(bǔ)了缺乏CPU的短板,也將英偉達(dá)的AI計(jì)算平臺(tái)拓展到移動(dòng)生態(tài)。值得注意的是,ARM也在異構(gòu)計(jì)算有所涉獵。基于開源的開發(fā)框架ARM NN,開發(fā)者可以調(diào)動(dòng)ARM CPU、GPU及NPU,實(shí)現(xiàn)異構(gòu)AI開發(fā)。
異構(gòu)計(jì)算的困境
技術(shù)變革意味著挑戰(zhàn),更意味著機(jī)遇。芯片領(lǐng)域目前的格局變化已經(jīng)充分證明了這一點(diǎn)。異構(gòu)計(jì)算帶來的硬件復(fù)雜性,對(duì)編程人員提出了嚴(yán)苛的挑戰(zhàn)。
不同開發(fā)框架之間的性能表現(xiàn)、兼容性,以及學(xué)習(xí)成本一直是影響開發(fā)效率的主要因素之一,復(fù)雜的開發(fā)環(huán)境、無法同步更新的框架導(dǎo)致開發(fā)者會(huì)花費(fèi)不少精力去自行解決問題。這些都依賴于生態(tài)鏈的建設(shè)。標(biāo)準(zhǔn)的制定與推廣,語言、編譯器、框架、運(yùn)行庫等的支持,都不是易事。
在此基礎(chǔ)上,英特爾推出了oneAPI,據(jù)悉,oneAPI可以簡(jiǎn)化并且統(tǒng)一跨不同架構(gòu)、跨不同廠商之間的編程,它是一個(gè)鼓勵(lì)社區(qū)和行業(yè)支持的一種開放、標(biāo)準(zhǔn)的解決方案。
英特爾并不是唯一一家意識(shí)到生態(tài)鏈的重要性的廠商,在這方面,英偉達(dá)推出了CUDA,AMD推出了ROCm,華為也陸續(xù)推出了Atlas、CANN等面向異構(gòu)場(chǎng)景的平臺(tái)及架構(gòu)。
其次,雖然從表面上看,異構(gòu)計(jì)算是一個(gè)硬件的物理疊加,但真正要釋放其全部能力,最終有賴于從硬件到軟件的整體式設(shè)計(jì)。未來的異構(gòu)計(jì)算,不僅僅是單一的技術(shù)點(diǎn),而是多技術(shù)點(diǎn)的集合。
為了建立完善的軟硬件體系來支撐全新異構(gòu)計(jì)算體系,進(jìn)而解決生態(tài)問題,使下游產(chǎn)業(yè)鏈用戶主動(dòng)采用異構(gòu)計(jì)算技術(shù),AMD、高通、ARM、三星、北京華夏芯等成立了全球異構(gòu)計(jì)算系統(tǒng)HSA(Heterogeneous Syste Architecture)聯(lián)盟,IBM、Google、英偉達(dá)等成立了OpenPOWER聯(lián)盟,Intel則自成體系。
再來,要找到異構(gòu)計(jì)算的優(yōu)勢(shì)場(chǎng)景并不容易。目前AI似乎是實(shí)現(xiàn)落地的理想領(lǐng)域,但AI 是一門較為復(fù)雜、綜合的學(xué)科。在只有 CPU 平臺(tái)的情況下,AI 開發(fā)者要學(xué)習(xí)的算法、模型、框架、編程語言已經(jīng)不少。如果再考慮多個(gè)不同處理器平臺(tái),情況會(huì)變得更為復(fù)雜。
說在最后
隨著5G、AI、云計(jì)算、大數(shù)據(jù)、IoT等技術(shù)推動(dòng)的萬物互聯(lián)時(shí)代即將到來。IDC預(yù)測(cè)數(shù)據(jù)顯示,到2023年全球各種類物聯(lián)網(wǎng)終端數(shù)量將達(dá)352億個(gè),海量連接產(chǎn)生的數(shù)據(jù)量達(dá)175ZB。
隨著數(shù)字化進(jìn)程的推進(jìn),算力需求將越來越大,數(shù)據(jù)中心將逐步演變?yōu)橛?jì)算中心,算力將成為新的生產(chǎn)力。在多種數(shù)據(jù)類型和場(chǎng)景驅(qū)動(dòng)下,異構(gòu)計(jì)算將獲得快速發(fā)展,讓異構(gòu)計(jì)算如何順利融入產(chǎn)業(yè),成為目前值得思考的問題。
但無論如何,我們可以確信的是,異構(gòu)計(jì)算時(shí)代真的來了。
責(zé)任編輯:tzh
-
FPGA
+關(guān)注
關(guān)注
1643文章
21944瀏覽量
613396 -
amd
+關(guān)注
關(guān)注
25文章
5555瀏覽量
135763 -
cpu
+關(guān)注
關(guān)注
68文章
11028瀏覽量
215749
發(fā)布評(píng)論請(qǐng)先 登錄
全志科技多核異構(gòu)SoC助力行業(yè)智能化創(chuàng)新

RAKsmart智能算力架構(gòu):異構(gòu)計(jì)算+低時(shí)延網(wǎng)絡(luò)驅(qū)動(dòng)企業(yè)AI訓(xùn)練范式升級(jí)
AI時(shí)代,封裝材料如何助力實(shí)現(xiàn)更優(yōu)的異構(gòu)集成?

RK3399處理器:高性能多核異構(gòu)計(jì)算平臺(tái)
異構(gòu)計(jì)算的概念、核心、優(yōu)勢(shì)、挑戰(zhàn)及考慮因素
【一文看懂】什么是異構(gòu)計(jì)算?

詳解Arm計(jì)算平臺(tái)的優(yōu)勢(shì)
澎峰科技高性能計(jì)算庫PerfIPP介紹

淺談國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢(shì)和應(yīng)用場(chǎng)景
開啟全新AI時(shí)代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國(guó)產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束
打造異構(gòu)計(jì)算新標(biāo)桿!國(guó)數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計(jì)

AvaotaA1全志T527開發(fā)板AMP異構(gòu)計(jì)算簡(jiǎn)介
異構(gòu)計(jì)算:解鎖算力潛能的新途徑

無問芯穹發(fā)布千卡規(guī)模異構(gòu)芯片混訓(xùn)平臺(tái)
智能時(shí)代的路,將由異構(gòu)計(jì)算鋪就

評(píng)論