在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI提供更好的視頻溝通體驗,GAN消除視頻通話中的抖動

火花 ? 來源:IT專家網(wǎng) ? 作者:火花 ? 2020-10-22 12:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Maxine是一款云AI視頻流平臺,將使用GAN來提高帶寬性能

Ming-Yu Liu 和Arun Mallya 正在進行視頻通話,其中一個人的畫面開始出現(xiàn)卡頓,直至畫面定格。這是一種常見且令人反感的情況。但與大多數(shù)人不同的是,Liu和Mallya可以做出一些改變。他們是NVIDIA的AI研究人員,專攻計算機視覺。在與Ting-Chun Wang共事中,他們意識到可以使用神經(jīng)網(wǎng)絡來替代被稱為視頻編解碼器的軟件,這種軟件通常用于視頻在網(wǎng)絡傳輸過程中的壓縮和解壓縮。

迄今為止,他們的工作成果將用戶在視頻通話時所需的網(wǎng)絡帶寬壓縮至原來的十分之一,還有望將帶寬消耗降低數(shù)個數(shù)量級。Mallya表示:“我們希望通過AI提供更好的視頻溝通體驗,即使在帶寬極低的情況下,也可以從語音升級到視頻通話。”

GAN讓連接質量更佳

即使用戶的面部有遮擋(比如戴著帽子、眼鏡、耳機或口罩),這項技術同樣適用。為了增加趣味性,他們在演示中使用了一些裝飾物,這樣用戶可以在線上更改其發(fā)型或衣服或者創(chuàng)建頭像。更重要的是,如上圖所示,借助神經(jīng)網(wǎng)絡定位,無需再盯著顯示器上方攝像頭才能與對方對視,這增強了面對面對話的感覺。Wang表示:“借助計算機視覺技術,我們可以從多個角度來定位頭部。我們認為這將幫助人們更自然地進行對話。”迎接最前沿的AI技術,讓虛擬生活更真實。

AI賦能視頻通話的原理

AI輔助視頻通話的工作機制十分簡單。與目前使用壓縮的視頻流的系統(tǒng)類似,參考圖像發(fā)送后,僅用戶眼睛、鼻子和嘴巴周圍幾個關鍵點的位置數(shù)據(jù)被發(fā)送,而非發(fā)送大量壓縮過像素的圖像。接收端的生成式對抗網(wǎng)絡通過初始圖像和面部關鍵點,在本地GPU上重構后續(xù)圖像。因此,通過網(wǎng)絡傳輸?shù)臄?shù)據(jù)要比之前少得多。

Liu在GAN領域的工作成果GauGAN曾引發(fā)關注。GauGAN是一種可以將涂鴉轉化為寫實藝術作品的AI工具,目前已經(jīng)創(chuàng)建了超過一百萬張圖像。該工具可在AI Playground中獲取。Liu表示:“疫情期間頻繁的視頻會議啟發(fā)了我們,因此我們開始探索突破帶寬瓶頸的方式,讓供應商可以同時為更多人提供服務。”

GPU突破帶寬瓶頸

這一方法順應當前行業(yè)趨勢,將網(wǎng)絡瓶頸轉化為計算任務,從而借助本地或云端資源更輕松地解決此類問題。NVIDIA媒體集團高級產品總監(jiān)Andrew Page表示:“如今,許多公司希望將帶寬問題轉化為計算問題,這是因為帶寬一般很難增加,而增強算力則相對容易。”

NVIDIA Maxine搭配了一套視頻會議和流媒體服務工具

AI 工具優(yōu)化視頻服務

GAN視頻壓縮是NVIDIA Maxine即將推出的幾個功能之一,這是一個云AI視頻流平臺,用于增強視頻會議和電話質量。它將音頻、視頻和對話式AI功能整合在一個工具包中,并支持多種設備。在上周的GTC大會上,NVIDIA宣布推出了Maxine平臺。基于該平臺,服務提供商能夠在提供超高分辨率的視頻的同時,實現(xiàn)實時翻譯、噪聲消除和情景感知的閉路字幕。用戶可以享受到人臉校正、虛擬助手和化身逼真的動畫角色等功能。

Page表示:“視頻會議正在經(jīng)歷一場復興。疫情期間,它的缺點給所有人帶來了不愉快的使用體驗,但回歸視覺動物的屬性,視頻終將成為人們今后生活中的一部分。”通過利用基于Tensor Core核心的NVIDIA GPU,Maxine可運行如NVIDIA Jarvis的軟件。NVIDIA Jarvis是用于對話式AI的SDK,提供了一套語音和文本功能。 它們共同提供了當今有用的AI功能,并成為未來視頻產品和服務的基石。

fqj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35041

    瀏覽量

    279100
  • 視頻通話
    +關注

    關注

    0

    文章

    49

    瀏覽量

    12068
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經(jīng)網(wǎng)絡AI降噪回音消除模塊 A-29說明書

    A-29P 是一款高性能的 DSP 數(shù)字語音處理模塊,針對所有免提全雙工通話設備的回音 問題進行消除(AEC),并具有超強的 AI 環(huán)境噪音壓制(
    發(fā)表于 06-18 15:23 ?0次下載

    A-29P AI智能降噪回音消除模塊說明書

    通話設備獲得更好的語音品質。在同類型模塊,主芯片的處理能力,及算法差異,在外形結構比較小,喇叭音量又很大的通話產品,回音
    發(fā)表于 05-26 16:51 ?1次下載

    鯤云科技提供智慧高速AI視頻分析解決方案

    鯤云科技響應國家及地方的高速公路信息化、智能化政策,提供“算力+算法+平臺”一體化的智慧高速 AI 視頻分析解決方案,滿足交警部門和高速集團日常運營和管理需求,通過智能化的手段,提高工作效率。
    的頭像 發(fā)表于 03-27 14:53 ?485次閱讀

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    學習、自然語言處理(NLP)、計算機視覺(CV)等先進技術提供的強大的數(shù)據(jù)處理和分析能力。 在視頻應用開發(fā)AI Agent可以用于視頻
    發(fā)表于 03-05 19:52

    怎樣才能更好享受到8K視頻帶來的優(yōu)勢

    觀看4K現(xiàn)在已經(jīng)非常普遍了,隨著對音視頻要求的不斷提高,各大設備也在著力發(fā)展8K視頻。本期我們將從觀看8K的工具入手,來聊聊怎樣才能更好享受到8K視頻帶來的優(yōu)勢。
    的頭像 發(fā)表于 02-21 09:30 ?788次閱讀

    訊維AI視頻行為分析系統(tǒng):打造全方位智能安防解決方案

    在當今科技迅猛發(fā)展的時代,視頻監(jiān)控系統(tǒng)已經(jīng)成為各行各業(yè)安全防范的重要手段。然而,傳統(tǒng)的視頻監(jiān)控系統(tǒng)往往依賴人工監(jiān)控,不僅效率低下,還容易遺漏關鍵信息。為了解決這一難題,訊維推出了結合AI檢測、
    的頭像 發(fā)表于 01-16 09:33 ?1270次閱讀
    訊維<b class='flag-5'>AI</b><b class='flag-5'>視頻</b>行為分析系統(tǒng):打造全方位智能安防解決方案

    AI賦能新通話構筑智能業(yè)務入口

    話音作為聯(lián)結全球80億人口的紐帶,承載著人與人之間最基本、最可靠的溝通需求。在科技發(fā)展日新月異的當下,各行各業(yè)迎來前所未有的革新契機。特別是AI技術的蓬勃興起,推動話音業(yè)務從傳統(tǒng)音視頻向多模態(tài)
    的頭像 發(fā)表于 01-06 10:49 ?635次閱讀
    <b class='flag-5'>AI</b>賦能新<b class='flag-5'>通話</b>構筑智能業(yè)務入口

    Luma AI Ray 2視頻模型即將發(fā)布

    能夠在短短10秒內,根據(jù)用戶提供的文本和圖像提示,生成高質量的視頻內容。 Luma AI Ray 2視頻模型是Luma AI
    的頭像 發(fā)表于 12-20 11:37 ?704次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發(fā)表于 12-12 09:40 ?702次閱讀

    Ambarella SoC的 CVflow? 高級AI引擎驅動 360° 視頻會議體驗提升

    全球大流行催化了視頻會議的繁榮,隨著公司采用混合工作模式并尋求更可持續(xù)的業(yè)務溝通方法,減少差旅,視頻會議的繁榮繼續(xù)增長。現(xiàn)在,隨著視頻會議成為現(xiàn)代商業(yè)實踐的基石,系統(tǒng)開發(fā)人員的任務是改
    的頭像 發(fā)表于 11-29 13:54 ?968次閱讀

    可靈AI全球首發(fā)視頻模型定制功能,助力AI視頻創(chuàng)作

    近日,快手旗下的可靈AI在全球范圍內率先推出了視頻模型定制功能,這一創(chuàng)新之舉成功解決了AI視頻生成過程中人物IP穩(wěn)定性不足的難題。 據(jù)了解,用戶現(xiàn)在可以在可靈
    的頭像 發(fā)表于 11-26 14:02 ?1236次閱讀

    AIGC在視頻內容制作的應用前景

    AIGC技術能夠顯著縮短視頻內容的制作周期。通過AI算法,可以快速生成視頻剪輯、特效、字幕和配樂等,減少人工操作的時間。例如,在短視頻制作
    的頭像 發(fā)表于 10-25 15:44 ?1797次閱讀

    LMK0480x低噪聲時鐘抖動消除器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LMK0480x低噪聲時鐘抖動消除器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-22 11:16 ?0次下載
    LMK0480x低噪聲時鐘<b class='flag-5'>抖動</b><b class='flag-5'>消除</b>器數(shù)據(jù)表

    CDCM7005高性能時鐘同步器和抖動消除器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《CDCM7005高性能時鐘同步器和抖動消除器數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-21 11:44 ?0次下載
    CDCM7005高性能時鐘同步器和<b class='flag-5'>抖動</b><b class='flag-5'>消除</b>器數(shù)據(jù)表

    FPGA如何消除時鐘抖動

    在FPGA(現(xiàn)場可編程門陣列)設計消除時鐘抖動是一個關鍵任務,因為時鐘抖動會直接影響系統(tǒng)的時序性能、穩(wěn)定性和可靠性。以下將詳細闡述FPGA
    的頭像 發(fā)表于 08-19 17:58 ?2768次閱讀
    主站蜘蛛池模板: 国产一级免费视频 | 农村妇女野外一级毛片 | 欧美日韩a级a | 久青草国产观看在线视频 | 1024你懂的国产在线播放 | 四虎永久网址影院 | 激情福利 | 欧美一级视频高清片 | 台湾一级毛片永久免费 | 亚洲另类电击调教在线观看 | 5060精品国产福利午夜 | sihu国产午夜精品一区二区三区 | 色婷婷色综合缴情在线 | 日韩欧美一区二区三区视频 | 大量真实偷拍情侣视频野战 | 婷婷丁香六月天 | 夜夜爽免费视频 | 丁香色综合 | 免费观看成年欧美1314www色 | 美女网站色黄 | 黄www片| 免费观看黄色网 | 1024 在线观看视频免费 | 午夜影视啪啪免费体验区深夜 | 国产精品亚洲一区二区三区在线播放 | 色五月激情小说 | 男男全肉高h腐文 | 国产毛片久久久久久国产毛片 | 奇米影视9999 | 天天摸天天添人人澡 | 精品国产免费久久久久久婷婷 | 快色视频免费 | h国产| 久久男人的天堂色偷偷 | 一级毛片真人免费播放视频 | 亚洲综合色婷婷在线观看 | 欧美成人自拍视频 | 丁香婷婷网 | www.亚洲色图.com| xxxxxxxx日本69 | 毛片在线网 |