實時光線追蹤提升了電子游戲中的光照藝術效果,但該過程需要消耗大量算力。為了減少消耗,NVIDIA 開發了一款顯存實用程序,它將規整和二次分配技術相結合,可優化和減少加速結構的顯存消耗。我們已將此解決方案變為名叫 RTXMU 的 SDK,并在今天將其作為開源版本提供。它專為支持各種 DXR 或 Vulkan 光線追蹤應用程序而構建。
通過利用 RTXMU 規整加速結構,可消除初始構建操作中浪費的顯存。對于使用 RTXMU 的應用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結構緩沖區可防止出現碎片和浪費的空間。包含數千個不同的小 BLAS 的場景將從二次分配中受益匪淺。
RTXMU 如何立即提供幫助?
RTXMU 易于集成,可立即帶來好處。
二次分配和規整顯存管理器需要花費大量工程時間進行驗證。RTXMU 可縮短開發者將規整和二次分配技術集成到 RTX 游戲中所需的時間。
RTXMU 還會抽象化 BLAS 的顯存和規整狀態管理,并管理規整尺寸回讀和規整副本所需的所有屏障。
更深入地說,RTXMU 使用 BLAS 數據結構的句柄間接層來防止錯誤管理 CPU 內存(包括訪問已取消分配或不存在的 BLAS)。此外,二次分配通過將更多 BLAS 裝入 64 KB 或 4 MB 頁面中,帶來了提高 TLB(頁表緩存)命中率的好處。
簡而言之,RTXMU 讓開發者毫不費力地就能讓實時光線追蹤游戲和應用程序更快速地運行。
關于作者
Ethan Einhorn 是一位有21年游戲行業經驗的資深人士,曾擔任編輯、營銷、制作和創意指導等職位。目前,他是 NVIDIA 的高級產品營銷經理。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5026瀏覽量
103296 -
應用程序
+關注
關注
37文章
3283瀏覽量
57767
發布評論請先 登錄
相關推薦
機械革命與NVIDIA聯手首發RTX 50系列游戲本
AMD與NVIDIA GPU優缺點
微軟推出DirectSR接口,集成FSR 3.1等SR技術提升游戲體驗
Foxconn利用NVIDIA AI和Omniverse訓練機器人
顯存技術不斷升級,AI計算中如何選擇合適的顯存
NVIDIA 究竟做了什么?《The First Descendant》幀率躍升 44%
![<b class='flag-5'>NVIDIA</b> 究竟做了什么?《The First Descendant》幀率躍升 44%](https://file.elecfans.com/web2/M00/55/FB/poYBAGLfmrOAMNitAAAqLsDZxGI249.png)
NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業軟件支持
NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服務
利用NVIDIA的nvJPEG2000庫分析DICOM醫學影像的解碼功能
![<b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b>的nvJPEG2000庫分析DICOM醫學影像的解碼功能](https://file1.elecfans.com/web2/M00/E9/D1/wKgZomZVedaAWZmMAAAeFbgpaJE618.png)
AMD RDNA4或采用GDDR6顯存,Navi 4X或Navi 4C具備216個計算單元?
利用NVIDIA組件提升GPU推理的吞吐
NVIDIA數字人技術加速部署生成式AI驅動的游戲角色
![<b class='flag-5'>NVIDIA</b>數字人技術加速部署生成式AI驅動的<b class='flag-5'>游戲</b>角色](https://file1.elecfans.com/web2/M00/C7/83/wKgZomYUo5aAGs_tAABjD6mp1Pc955.png)
評論