我們十分高興地宣布,Torch-TensorRT 1.1.0 版本正式發(fā)布!
軟件版本
PyTorch 1.11
CUDA 11.3(在 x86_64 上,默認(rèn)設(shè)置下,兼容的 PyTorch Build 支持較新版本的 CUDA 11)
cuDNN 8.2.4.15
TensorRT 8.2.4.2
由于最近 JetPack 的升級和其發(fā)布流程的變化,Torch-TRTv1.1.0 版本不支持Jetson(Jetpack 5.0DP 或其他)。將在中期版本(Torch-TensorRT1.1.x)同時支持 Jetpack 5.0DP 和 TensorRT 8.4。
重要變更
HF BERT性能
算子和性能的進(jìn)一步優(yōu)化使 HF BERT 的性能比 V1.1 版本提升了 40%
更多的算子
18 個新的 aten 算子轉(zhuǎn)換器提高了 TensorRT 的模型覆蓋范圍和性能
查看全部 250+ 個算子
Triton 后端支持
21.12 版本以上的 Triton 現(xiàn)已支持 Torch-TensorRT
將在不久后提供工作流程教程
調(diào)試工具
上下文管理器現(xiàn)在允許使用更簡潔清晰的調(diào)試工作流程
不支持的算子已降級為警告,建議使用上下文管理器進(jìn)行調(diào)查
API 變更
max_batch_size 和 strict_types 由于在 TRT 中不被遵守已被刪除
所有與 Torch-TensorRT 相關(guān)的 Bug 都應(yīng)被歸入新的 “MachineLearning – TorchTRT” nvbugs 模塊。
原文標(biāo)題:Torch-TensorRT 1.1.0 版本正式發(fā)布
文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
軟件
+關(guān)注
關(guān)注
69文章
5114瀏覽量
88888 -
pytorch
+關(guān)注
關(guān)注
2文章
809瀏覽量
13745
原文標(biāo)題:Torch-TensorRT 1.1.0 版本正式發(fā)布
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
firefly的bm1688硬件,無法import torch怎么解決?
軟件更新 | 你期待的新功能來了!TSMaster 202502 新版本亮點(diǎn)搶先看!

如何使SOLIDWORKS參數(shù)化設(shè)計(jì)軟件提升效率
解鎖NVIDIA TensorRT-LLM的卓越性能
NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub上公開發(fā)布

使用NVIDIA TensorRT提升Llama 3.2性能
TensorRT-LLM低精度推理優(yōu)化

在設(shè)備上利用AI Edge Torch生成式API部署自定義大語言模型

Google AI Edge Torch的特性詳解

魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率
M8020A J-BERT 高性能比特誤碼率測試儀
韓國服務(wù)器的性能如何提升
Allegro X 23.11 版本更新 I PCB 設(shè)計(jì):梯形布線的分析性能提升

評論