DiffusionRenderer 引入了一種神經(jīng)渲染技術(shù),可用于創(chuàng)意領(lǐng)域的內(nèi)容生成和編輯,也可用于智能汽車和機(jī)器人開發(fā)的合成數(shù)據(jù)生成。
NVIDIA Research開發(fā)了一種視頻 AI 光源開關(guān),可將白天場景轉(zhuǎn)為夜景,將陽光明媚的下午轉(zhuǎn)為陰天,并可將刺眼的熒光燈調(diào)低為柔和自然照明。
這項(xiàng)名為 DiffusionRenderer 的技術(shù)是一項(xiàng)新型神經(jīng)渲染技術(shù),利用 AI 模擬現(xiàn)實(shí)世界光線變化。DiffusionRenderer 將兩個(gè)傳統(tǒng)上截然不同的過程(逆渲染和前向渲染)整合到一個(gè)統(tǒng)一的神經(jīng)渲染引擎中,其性能優(yōu)于最先進(jìn)的方法。
DiffusionRenderer 提供了一個(gè)用于視頻光照控制、編輯和合成數(shù)據(jù)增強(qiáng)的框架,成為創(chuàng)意行業(yè)和物理 AI 開發(fā)的強(qiáng)大工具。
廣告、電影和游戲開發(fā)領(lǐng)域的創(chuàng)作者可以使用基于 DiffusionRenderer 的應(yīng)用,在現(xiàn)實(shí)世界或 AI 生成的視頻中添加、刪除并編輯光照。物理 AI 開發(fā)者可以利用它在更多樣化的照明條件下增強(qiáng)合成數(shù)據(jù)集,以訓(xùn)練機(jī)器人和智能汽車(AV)模型。
DiffusionRenderer 是 NVIDIA 發(fā)表于國際計(jì)算機(jī)視覺與模式識別會議(CVPR)的 60 多篇論文之一,本屆大會于當(dāng)?shù)貢r(shí)間 6 月 11 日至 15 日在美國田納西州舉行。
打造令人愉悅的 AI
DiffusionRenderer 解決了僅使用 2D 視頻數(shù)據(jù)對場景進(jìn)行去光照和重新打光的挑戰(zhàn)。
去光照是一個(gè)處理圖像并消除其光照效果的過程,從而僅保留底層對象的幾何圖形和材質(zhì)屬性。重新打光則恰恰相反,該過程可以在場景中添加或編輯光線,同時(shí)保持物體透明度和鏡面反射(表面反射光線的方式)等復(fù)雜屬性的真實(shí)性。
經(jīng)典的、基于物理學(xué)的渲染工作流需要 3D 幾何數(shù)據(jù)來計(jì)算場景中的光線,以進(jìn)行去光照和重新打光。而 DiffusionRenderer 使用 AI 來估算單個(gè) 2D 視頻的屬性,包括法線、金屬度和粗糙度。
通過這些計(jì)算,DiffusionRenderer 能夠生成新的陰影和反射、更改光源、編輯材質(zhì)并將新對象插入場景,所有這些都能保持逼真的照明條件。
利用由 DiffusionRenderer 驅(qū)動的應(yīng)用,智能汽車開發(fā)者可以獲取大部分是白天駕駛鏡頭的數(shù)據(jù)集,并隨機(jī)對每個(gè)視頻片段的光照進(jìn)行調(diào)整,以創(chuàng)建更多具有陰天或雨天、具有刺眼照明和陰影的夜晚以及夜間場景的視頻片段。借助這些增強(qiáng)數(shù)據(jù),開發(fā)者可以優(yōu)化其開發(fā)工作流,對智能汽車模型進(jìn)行訓(xùn)練、測試和驗(yàn)證,這些模型更具備應(yīng)對苛刻照明條件的能力。
如果創(chuàng)作者需要捕捉用于數(shù)字角色創(chuàng)作或特效制作的內(nèi)容,可以使用 DiffusionRenderer 增強(qiáng)用于早期構(gòu)思和模型的工具,從而在采用昂貴的專用光照舞臺系統(tǒng)捕捉制作質(zhì)量的素材之前,探索并反復(fù)試驗(yàn)各種光照選項(xiàng)。
利用 NVIDIA Cosmos增強(qiáng) DiffusionRenderer
自完成原始論文以來,DiffusionRenderer 的幕后研究團(tuán)隊(duì)已將他們的方法與 Cosmos Predict-1 進(jìn)行了集成,后者是一套用于生成逼真、物理感知型未來世界狀態(tài)的世界基礎(chǔ)模型。
這樣一來,研究人員觀察到一種擴(kuò)展效應(yīng),其中應(yīng)用 Cosmos Predict 更大、更強(qiáng)的視頻擴(kuò)散模型相應(yīng)提高了 DiffusionRenderer 的去光照和重新打光質(zhì)量,實(shí)現(xiàn)了更清晰、更準(zhǔn)確和時(shí)間上更一致的結(jié)果。
Cosmos Predict 是 NVIDIA Cosmos 的一部分,NVIDIA Cosmos 是一個(gè)由世界基礎(chǔ)模型、Tokenizer、護(hù)欄和加速數(shù)據(jù)處理和管理工作流組成的平臺,可加速用于物理 AI 開發(fā)的合成數(shù)據(jù)生成。
CVPR 上的 NVIDIA Research
在 CVPR 上,NVIDIA 研究人員展示了數(shù)十篇論文,主題涵蓋汽車、醫(yī)療、機(jī)器人等領(lǐng)域。三篇 NVIDIA 論文榮獲今年最佳論文獎提名:
FoundationStereo:該基礎(chǔ)模型通過匹配立體圖像中的像素,從 2D 圖像中重建 3D 信息。該模型已在超過 100 萬張圖像的數(shù)據(jù)集上進(jìn)行了訓(xùn)練,可處理現(xiàn)實(shí)世界數(shù)據(jù),性能優(yōu)于現(xiàn)有方法,并可跨領(lǐng)域通用。
Zero-Shot Monocular Scene Flow Estimation in the Wild:本論文是 NVIDIA 和布朗大學(xué)的研究人員通力合作的成果,介紹了一個(gè)用于預(yù)測場景流的通用模型,即 3D 環(huán)境中點(diǎn)的運(yùn)動場。
Difix3D+:這篇論文由 NVIDIA 空間智能實(shí)驗(yàn)室的研究人員完成,介紹了一種圖像擴(kuò)散模型,可刪除重建 3D 場景中新視點(diǎn)的偽影,從而提高 3D 呈現(xiàn)的整體質(zhì)量。
NVIDIA 還在 CVPR 上榮獲輔助駕駛國際挑戰(zhàn)賽冠軍,這標(biāo)志著 NVIDIA 連續(xù)兩年登頂端到端領(lǐng)域排行榜,并且連續(xù)三年在大會上榮獲輔助駕駛國際挑戰(zhàn)獎。
NVIDIA Research 在全球擁有數(shù)百名科學(xué)家和工程師,專注于 AI、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、智能汽車和機(jī)器人等領(lǐng)域的研究。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29748瀏覽量
212977 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5309瀏覽量
106448 -
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280123
原文標(biāo)題:CVPR 2025 | NVIDIA Research 通過 AI 賦能的渲染技術(shù)為物理 AI 開發(fā)場景賦以新意
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA攜手諾和諾德借助AI加速藥物研發(fā)
Wandercraft借助NVIDIA技術(shù)開發(fā)個(gè)人外骨骼設(shè)備
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能
英偉達(dá)GTC2025亮點(diǎn):NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新
NVIDIA技術(shù)引領(lǐng)媒體行業(yè)AI革新
NVIDIA發(fā)布Cosmos平臺,加速物理AI開發(fā)
NVIDIA Omniverse擴(kuò)展至生成式物理AI領(lǐng)域
NVIDIA推出加速物理AI開發(fā)的Cosmos世界基礎(chǔ)模型
NVIDIA發(fā)布Cosmos?平臺,助力物理AI系統(tǒng)發(fā)展
堅(jiān)米智能借助NVIDIA Isaac Lab加速四足機(jī)器人開發(fā)
使用NVIDIA Omniverse豐富汽車營銷資產(chǎn)
使用全新NVIDIA AI Blueprint開發(fā)視覺AI智能體
借助NVIDIA Metropolis微服務(wù)構(gòu)建視覺AI應(yīng)用

評論