在AI和大數(shù)據(jù)時(shí)代到來之后,GPU單兵作戰(zhàn)就變成了奢望,以現(xiàn)在的數(shù)據(jù)中心和超算為例,動(dòng)輒就是成千上萬張GPU,龐大的GPU網(wǎng)絡(luò)在交換機(jī)和光模塊的支持下代表了這個(gè)計(jì)算時(shí)代下最高的算力。但并非只有數(shù)據(jù)中心和超算里的GPU才需要這樣的擴(kuò)展性,嵌入式GPU和專業(yè)GPU同樣如此。
物理限制的嵌入式GPU
隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對(duì)邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過程中,我們還有一些物理限制沒法消除,像是尺寸、重量和功耗等。
為了解決這一系列問題,美國(guó)政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開發(fā)開放的標(biāo)準(zhǔn)和最好的方案來實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。
這類嵌入式GPU并非用來單獨(dú)售賣,而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國(guó)空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。
即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGA和ASIC等等。SOSA聯(lián)盟主席,來自美國(guó)空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來就不得不犧牲帶寬、容量。
所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對(duì)于嵌入式GPU的擴(kuò)展性來說還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來者顛覆。
顯卡交火時(shí)代的結(jié)束
不管是最新發(fā)布的RTX4090消費(fèi)級(jí)顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無論是晶體管數(shù)目還是CUDA核心都做到了極致。
然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說法,他們省下了NVLink連接器的空間,釋放了更多的空間來處理更多的AI計(jì)算。
在上一代顯卡的NVLink中,通過連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對(duì)于個(gè)人或?qū)I(yè)用戶來說是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問題。

RTX6000 / 英偉達(dá)
英偉達(dá)方面表示,就RTX 6000這類專業(yè)顯卡而言,他們?nèi)∠鸑VLink后省下了足夠的空間,塞入了更多的計(jì)算單元來提升單卡的性能。與此同時(shí),雖然這些專業(yè)顯卡的NVLink支持被取消,不代表英偉達(dá)放棄了這一技術(shù)。英偉達(dá)決心將NVLink的重心放在數(shù)據(jù)中心產(chǎn)品上,比如Grace CPU、Hopper GPU,他們通過NVLink Die to Die和Chip to Chip的互聯(lián)可以實(shí)現(xiàn)更好的擴(kuò)展性。
但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過去AMD的交火和英偉達(dá)的SLI也是兩家競(jìng)爭(zhēng)最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來了終結(jié)。
但顯卡交火的落幕也情有可原,且不說這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持。或許專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。
物理限制的嵌入式GPU
隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對(duì)邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過程中,我們還有一些物理限制沒法消除,像是尺寸、重量和功耗等。
為了解決這一系列問題,美國(guó)政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開發(fā)開放的標(biāo)準(zhǔn)和最好的方案來實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。
這類嵌入式GPU并非用來單獨(dú)售賣,而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國(guó)空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。
即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGA和ASIC等等。SOSA聯(lián)盟主席,來自美國(guó)空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來就不得不犧牲帶寬、容量。
所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對(duì)于嵌入式GPU的擴(kuò)展性來說還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來者顛覆。
顯卡交火時(shí)代的結(jié)束
不管是最新發(fā)布的RTX4090消費(fèi)級(jí)顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無論是晶體管數(shù)目還是CUDA核心都做到了極致。
然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說法,他們省下了NVLink連接器的空間,釋放了更多的空間來處理更多的AI計(jì)算。
在上一代顯卡的NVLink中,通過連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對(duì)于個(gè)人或?qū)I(yè)用戶來說是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問題。

RTX6000 / 英偉達(dá)
但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過去AMD的交火和英偉達(dá)的SLI也是兩家競(jìng)爭(zhēng)最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來了終結(jié)。
但顯卡交火的落幕也情有可原,且不說這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持。或許專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
gpu
+關(guān)注
關(guān)注
28文章
4912瀏覽量
130675
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
聚徽分享高性能工控機(jī)選購(gòu)指南:穩(wěn)定性、擴(kuò)展性、抗干擾能力如何平衡?
協(xié)調(diào)的重任。而在選購(gòu)高性能工控機(jī)時(shí),穩(wěn)定性、擴(kuò)展性與抗干擾能力成為了至關(guān)重要的考量因素,如何在這三者之間找到完美的平衡,成為了眾多企業(yè)面臨的關(guān)鍵難題。 穩(wěn)定性:工業(yè)運(yùn)行的基石 1. 硬件質(zhì)量與可靠性 工業(yè)級(jí)元器件的
瑞芯微RK3288解決方案:高性能、高擴(kuò)展性的嵌入式系統(tǒng)設(shè)計(jì)理念與應(yīng)用分析
。本文將深入剖析基于RK3288的處理方案,重點(diǎn)闡述其在硬件架構(gòu)、軟件平臺(tái)、擴(kuò)展性設(shè)計(jì)以及應(yīng)用場(chǎng)景等方面的優(yōu)勢(shì),并探討其所蘊(yùn)含的嵌入式系統(tǒng)設(shè)計(jì)理念。一、RK328

IAR推動(dòng)嵌入式開發(fā):云就緒、可擴(kuò)展的CI/CD和可持續(xù)自動(dòng)化
IAR正式發(fā)布全新云就緒平臺(tái),為嵌入式開發(fā)團(tuán)隊(duì)提供企業(yè)級(jí)的可擴(kuò)展性、安全性和自動(dòng)化能力。
從圖形處理到AI加速,一文看懂Imagination D系列GPU
Imagination的D系列于2022年首次發(fā)布,見證了生成式AI從云端到智能手機(jī)等消費(fèi)設(shè)備中普及。在云端,由于GPU的可編程性、可擴(kuò)展性和快速處理AI工作負(fù)載的能力,GPU已成為高

解鎖新應(yīng)用:探索GPU擴(kuò)展是如何提升渲染農(nóng)場(chǎng)的工作效率
聯(lián)瑞GPU擴(kuò)展方案在渲染農(nóng)場(chǎng)的應(yīng)用,是在原有計(jì)算機(jī)設(shè)備的基礎(chǔ)上增加GPU的數(shù)量,不用額外購(gòu)買GPU

FPGA+GPU+CPU國(guó)產(chǎn)化人工智能平臺(tái)
平臺(tái)采用國(guó)產(chǎn)化FPGA+GPU+CPU構(gòu)建嵌入式多核異構(gòu)智算終端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等組合模式,形成低功耗、高可擴(kuò)展性的硬件系統(tǒng),結(jié)合使用場(chǎng)景靈活搭配,已有

在眾核場(chǎng)景下EXT4該如何應(yīng)對(duì)才能發(fā)揮性能
一、背景和問題 1. EXT4日志的問題 隨著計(jì)算機(jī)系統(tǒng)加載數(shù)百個(gè)CPU內(nèi)核,文件系統(tǒng)的可擴(kuò)展性得到進(jìn)一步強(qiáng)調(diào)。因此本文主要定位服務(wù)器中廣泛使用的Ext4文件系統(tǒng)在做日志記錄時(shí)的可擴(kuò)展性問題

訓(xùn)練AI大模型需要什么樣的gpu
訓(xùn)練AI大模型需要選擇具有強(qiáng)大計(jì)算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴(kuò)展性的GPU。在選擇時(shí),需要根據(jù)具體需求進(jìn)行權(quán)衡和選擇。
深度評(píng)測(cè):云計(jì)算平臺(tái)的優(yōu)勢(shì)和不足
云計(jì)算平臺(tái)具有成本效益、靈活性和可擴(kuò)展性、簡(jiǎn)化維護(hù)和升級(jí)、全球訪問性以及災(zāi)難恢復(fù)等優(yōu)勢(shì),但也面臨安全性問題、依賴性問題、合規(guī)性和隱私問題、性能限制以及遷移復(fù)雜性等挑戰(zhàn)。企業(yè)在采用云計(jì)算
Perforce Helix Core通過ISO 26262認(rèn)證!為汽車軟件開發(fā)團(tuán)隊(duì)提供無限可擴(kuò)展性、細(xì)粒度安全性、文件快速訪問等
News!Helix Core通過ISO 26262認(rèn)證,符合汽車系統(tǒng)開發(fā)所需的安全和可靠性標(biāo)準(zhǔn),助力汽車軟件安全合規(guī)!具備無限可擴(kuò)展性、細(xì)粒度安全性、文件快速訪問...是眾多汽車OEM和供應(yīng)商的首選版本控制工具。

GPU算力租用平臺(tái)怎么樣
GPU算力租用平臺(tái)以其成本效益、靈活性與可擴(kuò)展性、簡(jiǎn)化運(yùn)維以及即時(shí)訪問等優(yōu)勢(shì),在深度學(xué)習(xí)、科學(xué)計(jì)算、圖形渲染等多個(gè)領(lǐng)域發(fā)揮著重要作用。
Cincoze高階效能&PCIe擴(kuò)展型工控機(jī)
應(yīng)用于如機(jī)器視覺、AI運(yùn)算等要求高度運(yùn)算效能與實(shí)時(shí)GPU圖像辨識(shí)速度的應(yīng)用場(chǎng)景。DS?系列不僅具備強(qiáng)大的處理能力,還支持多種擴(kuò)展模塊,以及多元的認(rèn)證標(biāo)準(zhǔn),確保在苛刻的環(huán)境下持續(xù)穩(wěn)定運(yùn)行

Imagination DXS GPU:重塑汽車智能與交互的未來
增長(zhǎng)。在此背景下,Imagination公司最新推出的DXS GPU IP產(chǎn)品,以其可擴(kuò)展性、靈活性和強(qiáng)大的計(jì)算能力,為車載智能與交互系統(tǒng)注入了新的活力。
使用低成本MSPM0 MCU在無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可擴(kuò)展性
電子發(fā)燒友網(wǎng)站提供《使用低成本MSPM0 MCU在無線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可擴(kuò)展性.pdf》資料免費(fèi)下載
發(fā)表于 09-02 11:47
?2次下載

國(guó)產(chǎn)NVMe SSD擴(kuò)展卡:驅(qū)動(dòng)存儲(chǔ)新紀(jì)元
NVMe技術(shù)的標(biāo)準(zhǔn)化接口使得不同廠商的設(shè)備能夠更好地兼容和互操作,提升了存儲(chǔ)系統(tǒng)的靈活性和擴(kuò)展性。

評(píng)論