NVIDIA 發(fā)布了Jetson Xavier NX,這是世界上最小、最先進(jìn)的嵌入式 AI 超級(jí)計(jì)算機(jī),用于自主機(jī)器人和邊緣計(jì)算設(shè)備。Jetson Xavier NX 能夠在緊湊的 70x45mm 外形尺寸中部署服務(wù)器級(jí)性能,在 15W 功率下提供高達(dá) 21 TOPS 的計(jì)算,或在 10W 下提供高達(dá) 14 TOPS 的計(jì)算。Jetson Xavier NX 模塊(圖 1)與 Jetson Nano 引腳兼容,并基于 NVIDIA 的 Xavier SoC 的低功耗版本,該版本在邊緣 SoC 中領(lǐng)先于最近的MLPerf Inference 0.5結(jié)果,為部署要求苛刻的基于 AI 的邊緣的工作負(fù)載可能會(huì)受到尺寸、重量、功率和成本等因素的限制。
圖 2:Jetson Xavier NX 處理器引擎的框圖,包括高速 I/O 和內(nèi)存結(jié)構(gòu)。
如圖 2 所示,Jetson Xavier NX 包括一個(gè)集成的 384 核 NVIDIA Volta GPU,具有 48 個(gè) Tensor 核心、6 核 NVIDIA Carmel ARMv8.2 64 位 CPU、8GB 128 位 LPDDR4x、雙 NVIDIA 深度學(xué)習(xí)加速器 (NVDLA)引擎、4K 視頻編碼器和解碼器、用于多達(dá) 6 個(gè)同步高分辨率傳感器流的專(zhuān)用攝像頭攝取、PCIe Gen 3 擴(kuò)展、雙 DisplayPort/HDMI 4K 顯示器、USB 3.1 和 GPIO,包括 SPI、I2C、I2S、CAN 總線和UART。請(qǐng)參閱下表 1,了解功能列表和Jetson Xavier NX 模塊數(shù)據(jù)表,了解完整規(guī)格。共享內(nèi)存結(jié)構(gòu)允許處理器自由共享內(nèi)存,而不會(huì)產(chǎn)生額外的內(nèi)存副本(稱(chēng)為 ZeroCopy),從而有效地提高了系統(tǒng)的帶寬利用率和吞吐量。
表 1:Jetson Xavier NX 計(jì)算模塊特性和功能
* CPU 最大工作頻率在 4/6 核模式下為 1400MHz,或在雙核模式下為 1900MHz
? 最大并發(fā)流數(shù)達(dá)到總吞吐量。支持的視頻編解碼器:H.265、H.264、VP9有關(guān)特定編解碼器和配置文件規(guī)范,
請(qǐng)參閱Jetson Xavier NX 模塊數(shù)據(jù)表。
?? MIPI CSI-2,D-PHY V1.2(每通道 2.5Gb/s,總計(jì)高達(dá) 30Gbps)。
? PCIe 1×1 僅支持根端口,1×1/2/4 支持根端口或端點(diǎn)模式
^ 工作溫度范圍,Xavier SoC 結(jié)溫 (Tj)
Jetson Xavier NX 得到 NVIDIA 完整的 CUDA-X 軟件堆棧和用于 AI 開(kāi)發(fā)的JetPack SDK的支持,除了實(shí)時(shí)計(jì)算機(jī)視覺(jué)、加速圖形和豐富的多媒體應(yīng)用程序之外,還能在多個(gè)高分辨率傳感器流上同時(shí)運(yùn)行流行的機(jī)器學(xué)習(xí)框架和復(fù)雜的 DNN在完整的桌面 Linux 環(huán)境中。Jetson 與 NVIDIA 的 AI 加速計(jì)算平臺(tái)的兼容性使得開(kāi)發(fā)和云與邊緣之間的無(wú)縫遷移變得容易。
Jetson Xavier NX 模塊將于 2020 年 3 月以 399 美元的批量供貨,嵌入式設(shè)計(jì)人員可以參考可供下載的設(shè)計(jì)資料,包括Jetson Xavier NX 設(shè)計(jì)指南,為 Jetson Xavier NX 模塊創(chuàng)建生產(chǎn)設(shè)備和系統(tǒng)。與 Jetson Nano 的引腳兼容性允許共享設(shè)計(jì)和對(duì) Jetson Xavier NX 的直接技術(shù)插入升級(jí)。Jetson 生態(tài)系統(tǒng)的硬件設(shè)計(jì)合作伙伴除了提供現(xiàn)成的載體、傳感器和配件外,還能夠提供定制設(shè)計(jì)服務(wù)和系統(tǒng)集成。
軟件開(kāi)發(fā)人員現(xiàn)在可以開(kāi)始為 Jetson Xavier NX 構(gòu)建 AI 應(yīng)用程序,方法是使用 Jetson AGX Xavier 開(kāi)發(fā)工具包,并將設(shè)備配置補(bǔ)丁應(yīng)用到 JetPack,使設(shè)備表現(xiàn)得像 Jetson Xavier NX。除了設(shè)置整個(gè)系統(tǒng)的核心時(shí)鐘頻率和電壓外,它還將通過(guò)軟件改變可用的 CPU 和 GPU 核心的數(shù)量。該補(bǔ)丁是完全可逆的,可用于在硬件可用之前估算 Jetson Xavier NX 的性能。
Jetson Xavier NX 定義了 10 和 15W 的默認(rèn)功率模式,根據(jù)活動(dòng)模式實(shí)現(xiàn) 14 到 21 TOPS 的峰值性能。用于管理電源配置文件的 nvpmodel 工具調(diào)整 CPU、GPU、內(nèi)存控制器和其他 SoC 時(shí)鐘的最大時(shí)鐘頻率,以及在線 CPU 集群的數(shù)量——這些設(shè)置顯示在表 2 中,用于預(yù)定義的 10W 和Jetson Xavier NX 的 15W 模式。CPU 布置在三個(gè)集群中,每個(gè)集群有 2 個(gè)內(nèi)核,在 4/6 核模式下的最高工作頻率為 1400MHz,在雙核模式下最高可達(dá) 1900MHz,適用于可能需要更多單線程與多線程的應(yīng)用程序表現(xiàn)。
表 2:Jetson Xavier NX 在 10W 和 15W 功率模式下的最大工作頻率和核心配置。
* 使用 NVDLA 時(shí),GPU 最高工作頻率為 600MHz(10W 模式)和 1000MHz(15W 模式)
根據(jù)工作負(fù)載,動(dòng)態(tài)電壓和頻率縮放 (DVFS) 調(diào)節(jié)器在運(yùn)行時(shí)將頻率縮放到活動(dòng) nvpmodel 定義的最大限制,因此在空閑時(shí)降低功耗并取決于處理器利用率。nvpmodel 工具還可以根據(jù)應(yīng)用要求和 TDP 輕松創(chuàng)建和自定義新的電源模式??梢跃庉嬰娫磁渲梦募⑵涮砑拥?/etc/nvpmodel.conf 配置文件中,并且在 Ubuntu 狀態(tài)欄中添加了一個(gè) GUI 小部件,以便在運(yùn)行時(shí)輕松管理和切換電源模式。
深度學(xué)習(xí)推理基準(zhǔn)
NVIDIA 還宣布,它在MLPerf Inference 0.5基準(zhǔn)測(cè)試的 5 個(gè)類(lèi)別中的 4 個(gè)類(lèi)別中奪冠,其中 Jetson AGX Xavier 是邊緣計(jì)算 SoC 的領(lǐng)導(dǎo)者,包括所有基于視覺(jué)的任務(wù):使用 Mobilenet 進(jìn)行圖像分類(lèi)和ResNet-50,以及使用 SSD-Mobilenet 和 SSD-ResNet 進(jìn)行對(duì)象檢測(cè)。在 MLPerf 定義的所有五項(xiàng)推理測(cè)試中,NVIDIA GPU 是十種競(jìng)爭(zhēng)芯片架構(gòu)中唯一提交結(jié)果的一種。
為了參考 Jetson 系列成員之間的可擴(kuò)展性,我們還在流行的 DNN 模型上測(cè)量了 Jetson Nano、Jetson TX2、Jetson Xavier NX 和 Jetson AGX Xavier 的推理性能,用于圖像分類(lèi)、對(duì)象檢測(cè)、姿勢(shì)估計(jì)、分割等。這些結(jié)果(如下圖 3 所示)是使用 JetPack 和 NVIDIA 的 TensorRT 推理加速器庫(kù)運(yùn)行的,該庫(kù)可優(yōu)化網(wǎng)絡(luò)以實(shí)現(xiàn)實(shí)時(shí)性能,這些網(wǎng)絡(luò)在 TensorFlow、PyTorch、Caffe、MXNet 等流行的機(jī)器學(xué)習(xí)框架中進(jìn)行了訓(xùn)練。
圖 3. Jetson 系列中使用 TensorRT 的各種基于視覺(jué)的 DNN 模型的推理性能。
Jetson Xavier NX 的性能比 Jetson TX2 高出多達(dá) 10 倍,功率相同,占用空間減少 25%。在這些基準(zhǔn)測(cè)試中,每個(gè)平臺(tái)都以最高性能運(yùn)行(Jetson AGX Xavier 為 MAX-N 模式,Xavier NX 和 TX2 為 15W,Nano 為 10W)。最大吞吐量是在批處理大小不超過(guò) 16 毫秒延遲閾值的情況下獲得的,否則對(duì)于平臺(tái)超過(guò)此延遲閾值的網(wǎng)絡(luò),批處理大小為 1。這種方法在實(shí)時(shí)應(yīng)用程序的確定性低延遲要求和多流用例場(chǎng)景的最大性能之間提供了平衡。
在 Jetson Xavier NX 和 Jetson AGX Xavier 上,NVDLA 引擎和 GPU 以 INT8 精度同時(shí)運(yùn)行,而在 Jetson Nano 和 Jetson TX2 上,GPU 以 FP16 精度運(yùn)行。Jetson Xavier NX 中帶有 Tensor Cores 的 Volta 架構(gòu) GPU 能夠進(jìn)行高達(dá) 12.3 TOPS 的計(jì)算,而該模塊的 DLA 引擎每個(gè)可產(chǎn)生高達(dá) 4.5 TOPS。
除了使用 TensorRT 運(yùn)行神經(jīng)網(wǎng)絡(luò)之外,ML 框架還可以通過(guò) CUDA 和 cuDNN 本地安裝在 Jetson 上,包括 TensorFlow、PyTorch、Caffe/Caffe2、MXNet、Keras 等。除了 AWS Greengrass 等物聯(lián)網(wǎng)框架和 Docker 和 Kubernetes 等容器引擎之外, Jetson Zoo還包括預(yù)構(gòu)建的安裝程序和構(gòu)建說(shuō)明。
Jetson Xavier NX 為部署下一代自主系統(tǒng)和智能邊緣設(shè)備開(kāi)辟了新的機(jī)會(huì),這些設(shè)備需要高性能 AI 和復(fù)雜的 DNN 在小尺寸、低功耗的足跡中——想想移動(dòng)機(jī)器人、無(wú)人機(jī)、智能相機(jī)、便攜式醫(yī)療設(shè)備、嵌入式物聯(lián)網(wǎng)系統(tǒng)等等。支持 CUDA-X 的 NVIDIA JetPack SDK 提供了完整的工具來(lái)開(kāi)發(fā)尖端的 AI 解決方案,并以世界領(lǐng)先的性能在云和邊緣之間擴(kuò)展您的應(yīng)用程序。
關(guān)于作者
Dustin 是 NVIDIA Jetson 團(tuán)隊(duì)的一名開(kāi)發(fā)人員推廣員。Dustin 擁有機(jī)器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開(kāi)展項(xiàng)目。
審核編輯:郭婷
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28646瀏覽量
208430 -
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270347 -
無(wú)人機(jī)
+關(guān)注
關(guān)注
230文章
10515瀏覽量
182431 -
嵌入式AI
+關(guān)注
關(guān)注
0文章
34瀏覽量
898
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
飛凌嵌入式獲批建設(shè)「河北省嵌入式計(jì)算機(jī)控制系統(tǒng)技術(shù)創(chuàng)新中心」
![飛凌<b class='flag-5'>嵌入式</b>獲批建設(shè)「河北省<b class='flag-5'>嵌入式計(jì)算機(jī)</b>控制系統(tǒng)技術(shù)創(chuàng)新中心」](https://file1.elecfans.com/web3/M00/03/F9/wKgZPGduFOGAT8hUAAEH6hxJc1o640.png)
NVIDIA發(fā)布高性?xún)r(jià)比生成式AI超級(jí)計(jì)算機(jī)
NVIDIA 推出高性?xún)r(jià)比的生成式 AI 超級(jí)計(jì)算機(jī)
![NVIDIA 推出高性?xún)r(jià)比的生成<b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>](https://file1.elecfans.com/web3/M00/02/E8/wKgZPGdij9SAflvoAALaY4AiJyY535.jpg)
云端超級(jí)計(jì)算機(jī)使用教程
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)
![NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b><b class='flag-5'>計(jì)算機(jī)</b>](https://file1.elecfans.com/web2/M00/0A/7A/wKgZomchjR-AfeU7AAHSQG3Nhog495.png)
丹麥推出首臺(tái)AI超級(jí)計(jì)算機(jī)Gefion
NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)
ARMxy嵌入式計(jì)算機(jī)在機(jī)器視覺(jué)中的卓越表現(xiàn)
![ARMxy<b class='flag-5'>嵌入式計(jì)算機(jī)</b>在機(jī)器視覺(jué)中的卓越表現(xiàn)](https://file1.elecfans.com/web2/M00/07/17/wKgZombtIG-AAR4rAAH-6_MocZk908.png)
ARMxy ARM嵌入式計(jì)算機(jī)支持Ubuntu OS快速部署AIoT解決方案
![ARMxy ARM<b class='flag-5'>嵌入式計(jì)算機(jī)</b>支持Ubuntu OS快速部署AIoT解決方案](https://file1.elecfans.com/web2/M00/04/67/wKgaombEEmCAYH1CAAAczGLPLPM871.png)
ARMxy ARM嵌入式計(jì)算機(jī)搭載 1 TOPS NPU支持深度學(xué)習(xí)
![ARMxy ARM<b class='flag-5'>嵌入式計(jì)算機(jī)</b>搭載 1 TOPS NPU支持深度學(xué)習(xí)](https://file1.elecfans.com/web2/M00/04/67/wKgaombEEmCAYH1CAAAczGLPLPM871.png)
如何選擇嵌入式主板或單板計(jì)算機(jī)
![如何選擇<b class='flag-5'>嵌入式</b>主板或單板<b class='flag-5'>計(jì)算機(jī)</b>](https://file1.elecfans.com/web2/M00/E8/8F/wKgaomZMW9aAf_VzAADcSjoDGEE251.png)
富士通使用富岳超級(jí)計(jì)算機(jī)訓(xùn)練LLM
微軟和OpenAI計(jì)劃投資1000億美元建造“星際之門(mén)”AI超級(jí)計(jì)算機(jī)
人形機(jī)器人主板:jetson orin nx核心模塊與SOM-7583核心模塊結(jié)合在一塊主板上
![人形機(jī)器人主板:<b class='flag-5'>jetson</b> orin <b class='flag-5'>nx</b>核心模塊與SOM-7583核心模塊結(jié)合在一塊主板上](https://file1.elecfans.com/web2/M00/C5/C3/wKgZomYCO72AGZHnAE2psZ7oMbE137.png)
評(píng)論