從ChatGPT引發(fā)的廣泛關(guān)注,再到大量的云端AI服務(wù)上線,利用人工智能提升效率、優(yōu)化流程正在變得唾手可得。但在大多數(shù)人印象中,AI應(yīng)用意味著背后龐大的服務(wù)器集群夜以繼日的運(yùn)算,需要將自己的信息共享至云端,這與人們關(guān)心的隱私與信息安全背道而馳。
就在COMPUTEX 2023期間,英特爾提出了一種全新的可能性,它可以讓未來(lái)每一臺(tái)筆記本、臺(tái)式機(jī)或者其他終端設(shè)備,在低功耗的前提下也能擁有不錯(cuò)的AI算力,而這個(gè)算力模塊稱為英特爾VPU。
與CPU、GPU不同,英特爾VPU將更專注于AI加速,特別是稀疏化處理的運(yùn)算,并且具有低功耗、低延遲的諸多特點(diǎn),不僅可以輕松處理視頻背景虛化、智能語(yǔ)音降噪等判定式AI,加速StableDiffusion這樣生成式AI也沒(méi)有問(wèn)題。
重點(diǎn)是,英特爾已經(jīng)確認(rèn)下一代處理器MeteorLake將集成VPU,這意味著未來(lái)的輕薄本也同樣具備一定的AI算力,實(shí)現(xiàn)不曾想象的AI操作。那么究竟是什么樣動(dòng)力,讓英特爾如此積極的駛向終端AI的新賽道?
AI的質(zhì)變
盡管英特爾以CPU和IDM模式而聞名,但在AI硬件領(lǐng)域英特爾也同樣進(jìn)行了長(zhǎng)時(shí)間的積累,例如在CPU中添加AI加速的相關(guān)指令集,并在架構(gòu)上針對(duì)AI不斷進(jìn)行優(yōu)化,已經(jīng)發(fā)展到第四代的英特爾至強(qiáng)可擴(kuò)展處理器就是其中很好的例子,從2017年開始,至強(qiáng)可擴(kuò)展處理器就不斷增加了深度學(xué)習(xí)加速、矩陣計(jì)算擴(kuò)展AMX等功能。
而今,英特爾在AI領(lǐng)域即擁有負(fù)責(zé)高端深度學(xué)習(xí)加速器Gaudi系列的Habana Labs,也擁有可以制造低功耗視覺處理單元的Movidius。在大量的AI經(jīng)驗(yàn)積累下,英特爾開始嘗試讓消費(fèi)產(chǎn)品涉及AI加速功能。也正是從IceLake架構(gòu)第10代酷睿開始,CPU開始搭載AI加速單元GNA,用于處理神經(jīng)噪聲抑制、背景模糊等功能判定式AI加速,讓筆記本開始走向智能化。
同時(shí)AI需求在近2年內(nèi)變化非常明顯。以降噪功能為例,2年前降噪計(jì)算復(fù)雜度與現(xiàn)在相比,相差將近50倍。類似StableDiffusion這樣的生成式AI加入,對(duì)PC性能需求提升了一個(gè)唯獨(dú)。如何在不插電的筆記本中流暢運(yùn)行更高負(fù)荷的AI應(yīng)用成了新問(wèn)題,VPU正是為了填補(bǔ)這個(gè)空白而誕生。
即將實(shí)裝MeteorLake的英特爾VPU其實(shí)已經(jīng)進(jìn)階到了第三代,這款源自于英特爾全資子公司Movidius的處理模塊最早計(jì)劃應(yīng)用于無(wú)人機(jī)、相機(jī)、VR設(shè)備等基于視覺深度學(xué)習(xí)和AI加速。在2017年,VPU的前身Myriad X就能實(shí)現(xiàn)1TOPS的吞吐量,這無(wú)疑讓人們對(duì)全新的VPU性能表現(xiàn)抱有更多期待。
同時(shí),VPU不是旗艦處理器的獨(dú)占功能,它將出現(xiàn)在Meteor Lake的所有SKU中。這意味著VPU帶來(lái)的AI加速功能將是處理器一項(xiàng)基礎(chǔ)功能,與集顯、Thunderbolt4等一樣,成為CPU中不可缺少的一部分。
但VPU的加入不代表著之前集成在CPU上的AI技術(shù)會(huì)劃上句號(hào)。恰恰相反,由于AI應(yīng)用場(chǎng)景的復(fù)雜性,英特爾將AI使用場(chǎng)景分成了三個(gè)部分,其中CPU負(fù)責(zé)處理諸如語(yǔ)音降噪、變聲這樣的輕負(fù)載、低延遲、高響應(yīng)的AI加速,GPU負(fù)責(zé)重負(fù)載且對(duì)響應(yīng)需求不高的AI模型加速。VPU正好介于CPU和GPU之間,即擁有低功耗、快速響應(yīng)的特點(diǎn),也可以負(fù)責(zé)基礎(chǔ)的視覺處理,比如流媒體中的手勢(shì)識(shí)別,背景虛化等等。
在Meteor Lake中,VPU和CPU、GPU將相輔相成,不同的AI應(yīng)用場(chǎng)景會(huì)指派不同的處理單元應(yīng)對(duì),確保AI加速效率最大化。同時(shí)從功耗上來(lái)看,VPU則是要求最低的,次之是CPU,再次之是GPU。VPU的加入能給注重續(xù)航的筆記本在獲得新功能的同時(shí),保證筆記本的續(xù)航和體驗(yàn)順暢。
為此英特爾也特意準(zhǔn)備了一個(gè)DEMO演示。一款只有集顯的MeteorLake開發(fā)筆記本,在StableDiffusion的文字生成圖片模型內(nèi),僅使用了20秒就完成了工作。這個(gè)過(guò)程中,MeteorLake的VPU主要承載了VNET模塊的運(yùn)行,GPU則負(fù)責(zé)Encoder模塊運(yùn)行,CPU則負(fù)責(zé)軟件運(yùn)行的其他部分,整個(gè)系統(tǒng)被得到充分利用,實(shí)現(xiàn)了在當(dāng)下只有依靠高性能獨(dú)立顯卡PC才能完成的工作。
軟硬件相輔相成
生成式AI的快速成長(zhǎng)自然也會(huì)帶來(lái)不少問(wèn)題,比如的AI開發(fā)界面,AI庫(kù)以及AI模型標(biāo)準(zhǔn)化或者統(tǒng)一化上需要時(shí)間,不同軟件、模型、開源項(xiàng)目之間各自為戰(zhàn),雖然百花齊放,但很難形成統(tǒng)一管理,會(huì)影響資源調(diào)用的效率。比如時(shí)下熱門的Stable Diffusion也僅誕生于2022年,作為一個(gè)開源項(xiàng)目,還有大量的工作需要適配。
在行業(yè)內(nèi)擁有龐大影響力的英特爾深刻了解軟硬件結(jié)合的重要性,在宣布VPU進(jìn)駐MeteorLake的同時(shí),英特爾也已經(jīng)緊鑼密鼓的在軟件層面、軟件合作伙伴方面展開行動(dòng)。
從軟件層面來(lái)看,VPU身后已經(jīng)具備了整套軟件基礎(chǔ),英特爾OpenVINO工具可以幫助VPU在應(yīng)對(duì)不同領(lǐng)域的AI網(wǎng)絡(luò)模型時(shí),進(jìn)需要通過(guò)統(tǒng)一的軟件接口實(shí)現(xiàn)。OpenVINO相當(dāng)于一個(gè)包裹,可以幫助應(yīng)用把底層不同架構(gòu)之間的異構(gòu)計(jì)算的差異統(tǒng)一封裝,以實(shí)現(xiàn)更廣泛的應(yīng)用適配。
同時(shí)英特爾也提供了對(duì)目前主流標(biāo)準(zhǔn)的支持,比如通用的網(wǎng)絡(luò)視頻格式ONNX,W3C允許通過(guò)瀏覽器進(jìn)行神經(jīng)網(wǎng)絡(luò)推理硬件加速的WebNN API,微軟基于DirectX12的機(jī)器學(xué)習(xí)底層推理接口DirectML等等。
同時(shí)英特爾也已經(jīng)與軟件開發(fā)商展開緊密合作,包括Adobe、微軟、字節(jié)跳動(dòng)、騰訊在內(nèi)的100多家軟件開發(fā)商已經(jīng)開始進(jìn)行AI相關(guān)方面的合作。
得益于VPU非常省電的特性,使得許多終端可以在僅使用電池續(xù)航的狀態(tài)下,也能擁有高效的表現(xiàn),原本需要CPU、GPU高功耗合力進(jìn)行的AI任務(wù),現(xiàn)在僅使用VPU即可完成。比如在執(zhí)行GPU渲染的過(guò)程中接通會(huì)議電話,通過(guò)VPU介入流暢的實(shí)現(xiàn)降噪、背景替換等工作。
再比如Adobe上的自動(dòng)摳圖、濾鏡、文字生成圖片等最新功能,通過(guò)VPU運(yùn)行也已經(jīng)可以獲得很好的效果。另外,Blender、虛幻引擎等軟件也已經(jīng)對(duì)VPU展開了適配。
在龐大的安裝量推動(dòng)下,英特爾在產(chǎn)品投向市場(chǎng)之前已經(jīng)做足了軟件層面適配的鋪墊。筆記本VPU與CPU、GPU以及其他功能模塊一起,成為下一代PC的標(biāo)準(zhǔn)配置,也進(jìn)而推動(dòng)了整個(gè)AI生態(tài)的普及與標(biāo)準(zhǔn)化,從而推動(dòng)AI應(yīng)用的持續(xù)發(fā)展,最終實(shí)現(xiàn)了良性循環(huán)的局面。
開創(chuàng)AI體驗(yàn)新局面
在過(guò)去兩年中,英特爾進(jìn)步非常顯著,通過(guò)12、13代酷睿的兩代高性能混合架構(gòu)設(shè)計(jì),英特爾已經(jīng)與OEM合作完成了超過(guò)700個(gè)系統(tǒng)設(shè)計(jì),交付了1.2億個(gè)高性能混合架構(gòu)處理芯片,使之在短時(shí)間內(nèi)快速普及。
但對(duì)于英特爾而言這還遠(yuǎn)遠(yuǎn)不夠,按照英特爾CEO帕特·基辛格提出的IDM2.0戰(zhàn)略,英特爾還會(huì)在四年里跨越5個(gè)制程工藝節(jié)點(diǎn),從現(xiàn)在的Intel7邁進(jìn)MeteorLake開始使用的Intel4,緊接著Intel20A和Intel18A也會(huì)相繼到來(lái)。
不僅如此,英特爾也將使用第三方代工的制造工藝來(lái)完善處理器產(chǎn)品,從MeteorLake開始使用的分離式模塊架構(gòu),讓處理器設(shè)計(jì)不再一體化,而是不同單元會(huì)成為不同的獨(dú)立設(shè)計(jì)模塊、不同的制造工藝和升級(jí)策略,實(shí)現(xiàn)效率的最大化,英特爾VPU的加入就很好的印證了這一點(diǎn)。
在即將到來(lái)的MeteorLake上,英特爾將從另一個(gè)維度提升處理器的每瓦性能表現(xiàn),讓處理器獲得表現(xiàn)更好的CPU、GPU,并加入獨(dú)立的VPU單元提升PC整體對(duì)AI性能優(yōu)化,從而帶動(dòng)PC體驗(yàn)的又一輪升級(jí)。
在過(guò)去幾年中,我們經(jīng)歷了Wi-Fi6、處理器混合架構(gòu)、Thunderbolt4接口的快速普及,均得益于英特爾將新技術(shù)無(wú)保留的放入主流的處理器設(shè)計(jì)中。英特爾VPU則成為下一個(gè)增長(zhǎng)點(diǎn),憑借著新一輪處理器升級(jí)帶來(lái)的龐大體量,不插電、低功耗環(huán)境下使用流暢的AI加速體驗(yàn),無(wú)疑會(huì)給現(xiàn)有的AI軟件生態(tài)、AI標(biāo)準(zhǔn)制定帶來(lái)全新的變化。英特爾也將再次成為整個(gè)PC軟硬件生態(tài)升級(jí)的重要推手。
審核編輯黃宇
-
英特爾
+關(guān)注
關(guān)注
61文章
10119瀏覽量
173424 -
cpu
+關(guān)注
關(guān)注
68文章
10995瀏覽量
214846 -
AI
+關(guān)注
關(guān)注
87文章
33258瀏覽量
273524 -
vpu
+關(guān)注
關(guān)注
0文章
15瀏覽量
11878
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
在英特爾酷睿Ultra AI PC上部署多種圖像生成模型

FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......
當(dāng)我問(wèn)DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......
Gupshup加速企業(yè)AI應(yīng)用進(jìn)程
NVIDIA AI正加速推進(jìn)藥物研發(fā)
英特爾計(jì)劃明年AI PC出貨一億臺(tái)
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施
Lunar Lake:NPU性能全面提升,能耗也大幅降低,綜合AI算力提升至120TOPS

在英特爾酷睿Ultra處理器上優(yōu)化和部署YOLOv8模型

“攜手走進(jìn)AI時(shí)代” Meteor Lake新品發(fā)布會(huì)

評(píng)論