在前一篇文章已經帶著讀者創建一個 Triton 的推理模型倉,現在只要安裝好服務器端與用戶端軟件,就能進行基本的測試與體驗。
為了簡化過程,我們使用 NVIDIA Jetson AGX Orin 設備進行示范,所有步驟都能適用于各種基于 NVIDIA Jetson 智能芯片的邊緣設備上,也適用于大部分裝載 Ubuntu 18 以上操作系統的 x86 設備上,即便設備上沒有安裝 NVIDIA 的 GPU 計算卡也能使用,只不過我們的提供的內容都是基于 GPU 計算環境,對于純 CPU 的使用則需要用戶自行研讀說明文件。
現在就開始安裝 Triton 服務器軟件,NVIDIA 為 Triton 服務器提供以下三種軟件安裝的方式:
1. 源代碼編譯
這種方式需要從https://github.com/triton-inference-server/server下載源代碼,然后安裝依賴庫,再用 cmake 與 make 工具進行編譯。通常會遇到的麻煩是步驟繁瑣,并且出錯率較高,因此并不推薦使用這個方法。
有興趣者,請自行參考前面下載的開源倉里的docs/customization_guide/build.md文件,有關于 Ubuntu 20.04、Jetpack 與 Windows 等各種平臺的編譯細節。
2. 可執行文件
Triton 開發團隊為使用者提供編譯好的可執行文件,包括 Ubuntu 20.04、Jetpack 與Windows 平臺,可以在https://github.com/triton-inference-server/server/releases/ 上獲取,每個版本都會提供對應 NGC 容器的版本,如下圖:
然后到下面的“Assets”選擇合適的版本:
以裝載 Jetpack 5 的 Orin 為例,就下載
tritonserver2.26.0-jetpack5.0.2.tgz(1.13GB)壓縮文件到本機上,然后解壓縮到指定目錄下就可以,例如 ${HOME}/triton 目錄,會生成
在執行 Triton 服務器軟件前,還得先安裝所需要的依賴庫,請執行以下指令:
sudo apt-get update
sudoapt-getinstall-y--no-install-recommendssoftware-properties-commonautoconfautomakebuild-essentialgitlibb64-devlibre2-devlibssl-devlibtoollibboost-devrapidjson-devpatchelfpkg-configlibopenblas-devlibarchive-devzlib1g-dev
現在就可以執行以下指令啟動 Triton 服務器:
cd ${HOME}/triton
bin/tritonserver--model-repository=server/docs/examples/model_repository--backend-directory=backends--backend-config=tensorflow,version=2
如果最后出現以下畫面并且進入等待狀態:
現在 Triton 服務器已經正常運行,進入等待用戶端提出請求(request)的狀態。
3. Docker容器
在NGC的
https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver/tags可以找到 Triton 服務器的 Docker 鏡像文件,每個版本主要提供以下幾種版本:
year-xy-py3:包含 Triton 推理服務器,支持 Tensorflow、PyTorch、TensorRT、ONNX 和 OpenVINO 模型;
year-xy-tf2-python-py3:僅支持 TensorFlow 2.x 和 python 后端的 Triton 推理服務器;
year-xy-pyt-python-py3:僅支持 PyTorch 和 python 后端的 Triton 服務器;
year-xy-py3-min:用作創建自定義 Triton 服務器容器的基礎,如 Customize Triton Container(自定義Triton容器)說明文件所描述的內容;
其中“year”是年份的數字,例如 2022 年提交的就是“22”開頭;后面的“xy”是流水號,每次往上加“1”,例如 2022 年 10 月 4 日提交的版本為“22-09”。
NVIDIA 提供的 Triton 容器鏡像是同時支持 x86 / AMD64 與 ARM64 架構的系統,以 22.09-py3 鏡像為例,可以看到如下圖所標示的“2 Architectures”:
點擊最右方的“向下”圖標,會展開如下圖的內容,事實上是有兩個不同版本的鏡像,不過使用相同鏡像名:
因此在 x86 電腦與 Jetson 設備都使用相同的鏡像下載指令,如下:
docker pull nvcr.io/nvidia/tritonserver:22.09-py3
就能根據所使用設備的 CPU 架構去下載對應的鏡像,現在執行以下指令來啟動 Triton 服務器:
# 根據實際的模型倉根目錄位置設定TRITON_MODEL_REPO路徑
export TRITON_MODEL_REPO=${HOME}/triton/server/docs/examples/model_repository
# 執行Triton服務器
dockerrun--rm--net=host-v${TRITON_MODEL_REPO}:/modelsnvcr.io/nvidia/tritonserver:22.09-py3tritonserver--model-repository=/models
如果執行正常,也會出現以下的等待畫面,表示運行是正確的:
以上三種方式都能在計算設備上啟動 Triton 服務器軟件,目前看起來使用 Docker 鏡像是最為簡單的。當服務器軟件啟動之后,就處于“等待請求”狀態,可以使用“Ctrl-C”組合鍵終止服務器的運行。
有一種確認 Triton 服務器正常運行的最簡單方法,就是用 curl 指令檢查 HTTP 端口的狀態,請執行以下指令:
curl -v localhost:8000/v2/health/ready
如果有顯示“HTTP/1.1 200 OK”的信息(如下圖),就能確定 Triton 服務器處于正常運行的狀態:
接下去就要安裝客戶端軟件,用來對服務器提出推理請求,這樣才算完成一個最基礎的推理周期。
推薦閱讀
NVIDIA Jetson Nano 2GB 系列文章(1):開箱介紹

NVIDIA Jetson Nano 2GB 系列文章(2):安裝系統

NVIDIA Jetson Nano 2GB 系列文章(3):網絡設置及添加 SWAPFile 虛擬內存

NVIDIA Jetson Nano 2GB 系列文章(4):體驗并行計算性能

NVIDIA Jetson Nano 2GB 系列文章(5):體驗視覺功能庫

NVIDIA Jetson Nano 2GB 系列文章(6):安裝與調用攝像頭


NVIDIA Jetson Nano 2GB 系列文章(8):執行常見機器視覺應用

NVIDIA Jetson Nano 2GB 系列文章(9):調節 CSI 圖像質量

NVIDIA Jetson Nano 2GB 系列文章(10):顏色空間動態調節技巧

NVIDIA Jetson Nano 2GB 系列文章(11):你應該了解的 OpenCV

NVIDIA Jetson Nano 2GB 系列文章(12):人臉定位

NVIDIA Jetson Nano 2GB 系列文章(13):身份識別

NVIDIA Jetson Nano 2GB 系列文章(14):Hello AI World

NVIDIA Jetson Nano 2GB 系列文章(15):Hello AI World 環境安裝

NVIDIA Jetson Nano 2GB 系列文章(16):10行代碼威力

NVIDIA Jetson Nano 2GB 系列文章(17):更換模型得到不同效果

NVIDIA Jetson Nano 2GB 系列文章(18):Utils 的 videoSource 工具

NVIDIA Jetson Nano 2GB 系列文章(19):Utils 的 videoOutput 工具

NVIDIA Jetson Nano 2GB 系列文章(20):“Hello AI World” 擴充參數解析功能

NVIDIA Jetson Nano 2GB 系列文章(21):身份識別

NVIDIA Jetson Nano 2GB 系列文章(22):“Hello AI World” 圖像分類代碼

NVIDIA Jetson Nano 2GB 系列文章(23):“Hello AI World 的物件識別應用

NVIDIAJetson Nano 2GB 系列文章(24): “Hello AI World” 的物件識別應用

NVIDIAJetson Nano 2GB 系列文章(25): “Hello AI World” 圖像分類的模型訓練

NVIDIAJetson Nano 2GB 系列文章(26): “Hello AI World” 物件檢測的模型訓練

NVIDIAJetson Nano 2GB 系列文章(27): DeepStream 簡介與啟用

NVIDIAJetson Nano 2GB 系列文章(28): DeepStream 初體驗

NVIDIAJetson Nano 2GB 系列文章(29): DeepStream 目標追蹤功能

NVIDIAJetson Nano 2GB 系列文章(30): DeepStream 攝像頭“實時性能”

NVIDIAJetson Nano 2GB 系列文章(31): DeepStream 多模型組合檢測-1

NVIDIAJetson Nano 2GB 系列文章(32): 架構說明與deepstream-test范例

NVIDIAJetsonNano 2GB 系列文章(33): DeepStream 車牌識別與私密信息遮蓋

NVIDIA Jetson Nano 2GB 系列文章(34): DeepStream 安裝Python開發環境

NVIDIAJetson Nano 2GB 系列文章(35): Python版test1實戰說明

NVIDIAJetson Nano 2GB 系列文章(36): 加入USB輸入與RTSP輸出

NVIDIAJetson Nano 2GB 系列文章(37): 多網路模型合成功能

NVIDIAJetson Nano 2GB 系列文章(38): nvdsanalytics視頻分析插件

NVIDIAJetson Nano 2GB 系列文章(39): 結合IoT信息傳輸

NVIDIAJetson Nano 2GB 系列文章(40): Jetbot系統介紹

NVIDIAJetson Nano 2GB 系列文章(41): 軟件環境安裝

NVIDIAJetson Nano 2GB 系列文章(42): 無線WIFI的安裝與調試

NVIDIAJetson Nano 2GB 系列文章(43): CSI攝像頭安裝與測試

NVIDIAJetson Nano 2GB 系列文章(44): Jetson的40針引腳


NVIDIAJetson Nano 2GB 系列文章(46): 機電控制設備的安裝

NVIDIAJetson Nano 2GB 系列文章(47): 組裝過程的注意細節

NVIDIAJetson Nano 2GB 系列文章(48): 用鍵盤與搖桿控制行動

NVIDIAJetson Nano 2GB 系列文章(49): 智能避撞之現場演示

NVIDIAJetson Nano 2GB 系列文章(50): 智能避障之模型訓練

NVIDIAJetson Nano 2GB 系列文章(51): 圖像分類法實現找路功能

NVIDIAJetson Nano 2GB 系列文章(52): 圖像分類法實現找路功能

NVIDIAJetson Nano 2GB 系列文章(53): 簡化模型訓練流程的TAO工具套件

NVIDIA Jetson Nano 2GB 系列文章(54):NGC的內容簡介與注冊密鑰

NVIDIA Jetson Nano 2GB 系列文章(55):安裝TAO模型訓練工具

NVIDIA Jetson Nano 2GB 系列文章(56):啟動器CLI指令集與配置文件

NVIDIA Jetson Nano 2GB 系列文章(57):視覺類腳本的環境配置與映射

NVIDIA Jetson Nano 2GB 系列文章(58):視覺類的數據格式

NVIDIA Jetson Nano 2GB 系列文章(59):視覺類的數據增強

NVIDIA Jetson Nano 2GB 系列文章(60):圖像分類的模型訓練與修剪

NVIDIA Jetson Nano 2GB 系列文章(61):物件檢測的模型訓練與優化

NVIDIA Jetson Nano 2GB 系列文章(62):物件檢測的模型訓練與優化-2

NVIDIA Jetson Nano 2GB 系列文章(63):物件檢測的模型訓練與優化-3

NVIDIA Jetson Nano 2GB 系列文章(64):將模型部署到Jetson設備

NVIDIA Jetson Nano 2GB 系列文章(65):執行部署的 TensorRT 加速引擎

NVIDIA Jetson 系列文章(1):硬件開箱

NVIDIA Jetson 系列文章(2):配置操作系統

NVIDIA Jetson 系列文章(3):安裝開發環境

NVIDIA Jetson 系列文章(4):安裝DeepStream

NVIDIA Jetson 系列文章(5):使用Docker容器的入門技巧

NVIDIA Jetson 系列文章(6):使用容器版DeepStream

NVIDIA Jetson 系列文章(7):配置DS容器Python開發環境

NVIDIA Jetson 系列文章(8):用DS容器執行Python范例

NVIDIA Jetson 系列文章(9):為容器接入USB攝像頭

NVIDIA Jetson 系列文章(10):從頭創建Jetson的容器(1)

NVIDIA Jetson 系列文章(11):從頭創建Jetson的容器(2)

NVIDIA Jetson 系列文章(12):創建各種YOLO-l4t容器

NVIDIA Triton系列文章(1):應用概論

NVIDIA Triton系列文章(2):功能與架構簡介

NVIDIA Triton系列文章(3):開發資源說明

NVIDIA Triton系列文章(4):創建模型倉

原文標題:NVIDIA Triton 系列文章(5):安裝服務器軟件
文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3912瀏覽量
93036
原文標題:NVIDIA Triton 系列文章(5):安裝服務器軟件
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
服務器數據恢復—服務器重裝系統導致分區消失的數據恢復案例

服務器數據恢復—如何預防服務器故障與恢復服務器數據!
windows搭建ftp服務器的步驟
Flexus 云服務器 X 實例實踐:安裝 Ward 服務器監控工具

評論