在一場演示盛宴中,NVIDIA 研究人員為數(shù)字化身技術(shù)作品注入了四個 AI 模型,在 SIGGRAPH 2021 大會的實時直播展示中展出,榮獲“最佳展示”獎。
該展示是今年以虛擬形式舉行的世界大型計算機圖形大會上最令人期待的活動之一,慶祝各種跨越游戲技術(shù)、增強現(xiàn)實和科學可視化的前沿實時項目。該展示包括一系列由評委會評審的交互式項目,演講者來自 Unity Technologies、倫斯勒理工學院、紐約大學未來現(xiàn)實實驗室等等。
NVIDIA 研究團隊從硅谷總部現(xiàn)場直播,展示了一系列能夠創(chuàng)建栩栩如生的虛擬角色的 AI 模型,適用于帶寬高效視頻會議和故事講述等項目。
該演示包括各種工具,可從單張照片生成數(shù)字化身,制作具有自然3D面部動作的化身動畫,以及將文本轉(zhuǎn)換為語音。
NVIDIA 應(yīng)用深度學習研究副總裁 Bryan Catanzaro 在演講中表示:“制作數(shù)字化身是一個非常困難、繁瑣而且昂貴的過程。”但是借助 AI 工具,“我們可以輕松創(chuàng)建真實人物以及卡通角色的數(shù)字化身。它可用于視頻會議、故事講述、虛擬助理和許多其他應(yīng)用領(lǐng)域。”
AI 在面試中表現(xiàn)出色
在演示中,兩位 NVIDIA 研究科學家分別扮演面試官和應(yīng)聘者的角色,通過視頻會議進行交談。在通話過程中,面試者展示了 AI 驅(qū)動的數(shù)字化身技術(shù)如何能夠與面試官進行溝通。
扮演應(yīng)聘者的研究人員在整個過程中使用一臺 NVIDIA RTX 筆記本電腦,而另一名研究人員使用的是由 RTX A6000 GPU 提供支持的臺式工作站。整個流程還可以在云中的 GPU 上運行。
應(yīng)聘者坐在校園的咖啡廳里,戴著棒球帽和口罩,使用 Vid2Vid Cameo 模型在視頻通話中呈現(xiàn)出穿著有領(lǐng)子的襯衣、胡子刮得干干凈凈的形象(見上圖)。AI 模型依據(jù)對象的單張照片創(chuàng)建逼真的數(shù)字化身,無需 3D 掃描或?qū)iT訓(xùn)練的圖像。
他展示了自己的另外兩張照片,并且表示:“數(shù)字化身的創(chuàng)建在一瞬間就能完成,所以我能夠使用不同的照片迅速創(chuàng)建不同的化身。”
該研究人員的系統(tǒng)并不傳輸視頻流,而是只發(fā)送了他的聲音,然后將聲音輸送到NVIDIA Omniverse Audio2Face 應(yīng)用程序。Audio2Face 可生成頭部、眼睛和唇部的自然動作,以便在 3D 頭部模型上實時匹配音頻輸入。這種面部動畫進入 Vid2Vid Cameo,與演講者的數(shù)字化身合成為表現(xiàn)自然的動作。
除了逼真的數(shù)字化身之外,該研究人員還通過 Audio2Face 和 Vid2Vid Cameo 輸送了他的演講,為動畫角色配音。他表示,使用 NVIDIA StyleGAN,開發(fā)者能夠以卡通角色或者繪畫為模型,創(chuàng)建出無限的數(shù)字化身。
這些模型經(jīng)過優(yōu)化,在 NVIDIA RTX GPU 上運行,能夠以每秒 30 幀的速度輕松傳輸視頻。此外,它還具有很高的帶寬效率,因為演講者只通過網(wǎng)絡(luò)發(fā)送音頻數(shù)據(jù),而不是傳輸高分辨率視頻源。
更進一步,該研究人員展示,當咖啡廳環(huán)境變得過于嘈雜,RAD-TTS 模型能夠?qū)⑤斎氲南⑥D(zhuǎn)換為他的聲音,取代輸送到 Audio2Face 中的聲音。基于深度學習的突破性文本轉(zhuǎn)語音工具可以在幾毫秒內(nèi)通過任意文本輸入來合成栩栩如生的語音。
研究團隊在演示的最后展示,RAD-TTS 能夠合成各種聲音,從而幫助開發(fā)者生動地呈現(xiàn)書中的角色,甚至說唱 Eminem 的《The Real Slim Shady》。
SIGGRAPH 大會將持續(xù)到 8 月 13 日。查看 NVIDIA 在大會上的完整活動安排,觀看我們的《在元宇宙中建立聯(lián)系:GTC 主題演講的制作》紀錄片首映。
編輯:jq
-
3D
+關(guān)注
關(guān)注
9文章
2953瀏覽量
109559 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5257瀏覽量
105835 -
gpu
+關(guān)注
關(guān)注
28文章
4915瀏覽量
130708 -
AI
+關(guān)注
關(guān)注
88文章
34378瀏覽量
275599
發(fā)布評論請先 登錄
華為與bKash榮獲GSMA GLOMO“最佳金融科技創(chuàng)新獎”
軟通動力榮膺2024年度CIO信賴的數(shù)字化伙伴獎
維信諾榮獲vivo“最佳交付獎”與“優(yōu)秀質(zhì)量獎”
天馬榮獲vivo 2024年度“優(yōu)秀質(zhì)量獎”和“最佳交付獎”
Bourns榮獲2024亞洲金選獎最佳分立器件獎
睿創(chuàng)微納榮獲第六屆“金輯獎”最佳技術(shù)實踐應(yīng)用獎
基本半導(dǎo)體榮獲禾望電氣“最佳合作獎”
安路科技榮獲“年度卓越董秘獎”和“卓越品宣團隊獎”
華銳捷榮獲第六屆金輯獎“最佳技術(shù)實踐應(yīng)用獎”
安富利榮獲第六屆金輯獎“最佳技術(shù)實踐應(yīng)用獎”
賽卓電子榮獲2024金輯獎——最佳技術(shù)實踐應(yīng)用獎

評論