在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員開(kāi)發(fā)出一個(gè)端到端的機(jī)器學(xué)習(xí)系統(tǒng)Audio2Face

DPVg_AI_era ? 來(lái)源:lq ? 2019-06-15 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

浙江大學(xué)和網(wǎng)易伏羲AI實(shí)驗(yàn)室的研究人員開(kāi)發(fā)出一個(gè)端到端的機(jī)器學(xué)習(xí)系統(tǒng)Audio2Face,可以從音頻中單獨(dú)生成實(shí)時(shí)面部動(dòng)畫,同時(shí)考慮到音高和說(shuō)話風(fēng)格。

我們都知道動(dòng)畫里的人物說(shuō)話聲音都是由后期配音演員合成的。

但即使利用CrazyTalk這樣的軟件,也很難將電腦生成的嘴唇、嘴型等與配音演員進(jìn)行很好地匹配,尤其是當(dāng)對(duì)話時(shí)長(zhǎng)在數(shù)十甚至數(shù)百小時(shí)的情況下。

但不要?dú)怵H,動(dòng)畫師的福音來(lái)了——Audio2Face問(wèn)世!

Audio2Face是一款端到端的機(jī)器學(xué)習(xí)系統(tǒng),由浙江大學(xué)與網(wǎng)易伏羲AI實(shí)驗(yàn)室共同打造。

它可以從音頻中單獨(dú)生成實(shí)時(shí)的面部動(dòng)畫,更厲害的是,它還能調(diào)節(jié)音調(diào)和說(shuō)話風(fēng)格。該成果已經(jīng)發(fā)布至arXiv:

arXiv地址:

https://arxiv.org/pdf/1905.11142.pdf

團(tuán)隊(duì)試圖構(gòu)建一個(gè)系統(tǒng),既要逼真又要低延遲

“我們的方法完全是基于音軌設(shè)計(jì)的,沒(méi)有任何其他輔助輸入(例如圖像),這就使得當(dāng)我們?cè)噲D從聲音序列中回歸視覺(jué)空間的過(guò)程將會(huì)越來(lái)越具有挑戰(zhàn)。”論文共同作者解釋道,“另一個(gè)挑戰(zhàn)是面部活動(dòng)涉及臉部幾何表面上相關(guān)區(qū)域的多重激活,這使得很難產(chǎn)生逼真且一致的面部變形。”

該團(tuán)隊(duì)試圖構(gòu)建一個(gè)同時(shí)滿足“逼真”(生成的動(dòng)畫必須反映可見(jiàn)語(yǔ)音運(yùn)動(dòng)中的說(shuō)話模式)和低延遲(系統(tǒng)必須能夠進(jìn)行近乎實(shí)時(shí)的動(dòng)畫)要求的系統(tǒng)。他們還嘗試將其推廣,以便可以將生成的動(dòng)畫重新定位到其他3D角色。

他們的方法包括從原始輸入音頻中提取手工制作的高級(jí)聲學(xué)特征,特別是梅爾頻率倒譜系數(shù)(MFC),或聲音的短期功率譜的表示。然后深度相機(jī)與mocap工具Faceshift一起,捕捉配音演員的面部動(dòng)作并編制訓(xùn)練集。

深度相機(jī)示意圖

之后研究人員構(gòu)建了帶有51個(gè)參數(shù)的3D卡通人臉模型,控制了臉部的不同部位(例如,眉毛,眼睛,嘴唇和下巴)。最后,他們利用上述AI系統(tǒng)將音頻上下文映射到參數(shù),產(chǎn)生唇部和面部動(dòng)作。

1470個(gè)音頻樣本加持,機(jī)器學(xué)習(xí)模型的輸出“相當(dāng)可以”

團(tuán)隊(duì)使用一個(gè)訓(xùn)練語(yǔ)料庫(kù),其中包含兩個(gè)60分鐘、每秒30幀的女性和男性演員逐行閱讀劇本中臺(tái)詞的視頻,以及每個(gè)相應(yīng)視頻幀的1470個(gè)音頻樣本(每幀總共2496個(gè)維度)。

團(tuán)隊(duì)報(bào)告說(shuō),與ground truth相比,機(jī)器學(xué)習(xí)模型的輸出“相當(dāng)可以”。它設(shè)法在測(cè)試音頻上重現(xiàn)準(zhǔn)確的面部形狀,并且它一直“很好地”重新定位到不同的角色。此外,AI系統(tǒng)平均只需0.68毫秒即可從給定的音頻窗口中提取特征。

該團(tuán)隊(duì)指出,AI無(wú)法跟隨演員的眨眼模式,主要是因?yàn)檎Q叟c言語(yǔ)的相關(guān)性非常弱。不過(guò)從廣義上講,該框架可能為適應(yīng)性強(qiáng)、可擴(kuò)展的音頻到面部動(dòng)畫技術(shù)奠定基礎(chǔ),這些技術(shù)幾乎適用于所有說(shuō)話人和語(yǔ)言。

“評(píng)估結(jié)果顯示,我們的方法不僅可以從音頻中產(chǎn)生準(zhǔn)確的唇部運(yùn)動(dòng),還可以成功地消除說(shuō)話人隨時(shí)間變化的面部動(dòng)作,”他們寫道。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    2955

    瀏覽量

    110421
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    3030

    瀏覽量

    83199
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8499

    瀏覽量

    134295

原文標(biāo)題:浙大研發(fā)AudioFace:隨心錄語(yǔ)音就能實(shí)時(shí)生成3D面部動(dòng)畫

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為何成為各車企智駕布局的首要選擇?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在智能駕駛領(lǐng)域,技術(shù)的提出標(biāo)志著自動(dòng)駕駛系統(tǒng)在架構(gòu)設(shè)計(jì)上的次根本性轉(zhuǎn)變。從傳統(tǒng)的模塊化架構(gòu)將感知、決策
    的頭像 發(fā)表于 06-07 11:52 ?119次閱讀
    為何<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>成為各車企智駕布局的首要選擇?

    文帶你厘清自動(dòng)駕駛架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計(jì)思路也經(jīng)歷了從傳統(tǒng)模塊化架構(gòu)大模型轉(zhuǎn)變。傳統(tǒng)模塊化架構(gòu)將感
    的頭像 發(fā)表于 05-08 09:07 ?223次閱讀
    <b class='flag-5'>一</b>文帶你厘清自動(dòng)駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架構(gòu)差異

    研究人員開(kāi)發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測(cè)瘧疾

    瘧疾曾度在委內(nèi)瑞拉銷聲匿跡,但如今正卷土重來(lái)。研究人員已經(jīng)訓(xùn)練出個(gè)模型來(lái)幫助檢測(cè)這種傳染病。
    的頭像 發(fā)表于 04-25 09:58 ?303次閱讀

    小米汽車智駕技術(shù)介紹

    后起之秀,小米在宣布造車前被非常多的人質(zhì)疑,但在“真香”定律下,小米創(chuàng)下了很多友商所不能及的成就。作為科技企業(yè),小米也在智能駕駛領(lǐng)域也不斷研發(fā)及突破,并推送了自動(dòng)駕駛系統(tǒng)。 小米
    的頭像 發(fā)表于 03-31 18:17 ?3363次閱讀
    小米汽車<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智駕技術(shù)介紹

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    《具身智能機(jī)器系統(tǒng)書由甘鳴、俞波、萬(wàn)梓燊、劉少山老師共同編寫,其封面如圖1所示。 本書共由5部分組成,其結(jié)構(gòu)和內(nèi)容如圖2所示。 該
    發(fā)表于 12-20 19:17

    自動(dòng)駕駛技術(shù)研究與分析

    編者語(yǔ):「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0450,獲取本文參考報(bào)告:《自動(dòng)駕駛行業(yè)研究報(bào)告》pdf下載方式。 自動(dòng)駕駛進(jìn)入2024年,
    的頭像 發(fā)表于 12-19 13:07 ?831次閱讀

    在自動(dòng)泊車的應(yīng)用

    要做到15Hz以上。這樣就對(duì)存儲(chǔ)和算力需求降低很多。 上海交通大學(xué)的五位學(xué)生發(fā)表了自動(dòng)泊車的論文:《ParkingE2E: Cam
    的頭像 發(fā)表于 12-18 11:38 ?899次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>在自動(dòng)泊車的應(yīng)用

    已來(lái),智駕仿真測(cè)試該怎么做?

    智駕方案因強(qiáng)泛化能力、可持續(xù)學(xué)習(xí)與升級(jí)等優(yōu)勢(shì)備受矚目,但這對(duì)仿真測(cè)試帶來(lái)了巨大挑戰(zhàn)。康謀探索了種有效的
    的頭像 發(fā)表于 12-04 09:59 ?3171次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>已來(lái),智駕仿真測(cè)試該怎么做?

    爆火的如何加速智駕落地?

    編者語(yǔ):「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0551,獲取本文參考報(bào)告:《智能汽車技術(shù)研究報(bào)告》pdf下載方式。 “
    的頭像 發(fā)表于 11-26 13:17 ?1032次閱讀
    爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智駕落地?

    智己汽車“”智駕方案推出,老司機(jī)真的會(huì)被取代嗎?

    隨著智能駕駛技術(shù)的發(fā)展,行業(yè)已經(jīng)從早期基于簡(jiǎn)單規(guī)則和模塊化邏輯的自動(dòng)駕駛,逐步邁向依托深度學(xué)習(xí)的高復(fù)雜度智能駕駛解決方案,各車企也緊跟潮流,先后宣布了自己的智駕方案。就在近期,智
    的頭像 發(fā)表于 10-30 09:47 ?760次閱讀
    智己汽車“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智駕方案推出,老司機(jī)真的會(huì)被取代嗎?

    讓智駕強(qiáng)者愈強(qiáng)時(shí)代來(lái)臨?

    到來(lái),智能駕駛技術(shù)也成為眾多車企研究的重點(diǎn)方向。而在這個(gè)過(guò)程中,架構(gòu)(End-to-End, E2E)作為核心技術(shù),逐漸嶄露頭角,成為
    的頭像 發(fā)表于 10-24 09:25 ?917次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>讓智駕強(qiáng)者愈強(qiáng)時(shí)代來(lái)臨?

    Mobileye自動(dòng)駕駛解決方案的深度解析

    強(qiáng)大的技術(shù)優(yōu)勢(shì)。 Mobileye的解決方案概述 1.1 什么是自動(dòng)駕駛?
    的頭像 發(fā)表于 10-17 09:35 ?793次閱讀
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自動(dòng)駕駛解決方案的深度解析

    測(cè)試用例怎么寫

    編寫測(cè)試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是個(gè)詳細(xì)的指南,介紹如何編
    的頭像 發(fā)表于 09-20 10:29 ?926次閱讀

    實(shí)現(xiàn)自動(dòng)駕駛,唯有

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?1422次閱讀
    實(shí)現(xiàn)自動(dòng)駕駛,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    saas模式的套智慧工地云平臺(tái)源碼,支持多端展示:PC、大屏、手機(jī)、平板

    、公司級(jí)、集團(tuán)級(jí)多級(jí)權(quán)限劃分,可根據(jù)企業(yè)的組織架構(gòu)進(jìn)行項(xiàng)目權(quán)限、功能權(quán)限、數(shù)據(jù)權(quán)限設(shè)定。 智慧工地云平臺(tái)功能介紹: 、PC監(jiān)管 1、數(shù)據(jù)統(tǒng)計(jì)分析 工地?cái)?shù)據(jù)分析、項(xiàng)目人員分析、危大工程分析、環(huán)境監(jiān)測(cè)分析、安全隱患分析
    的頭像 發(fā)表于 08-06 16:41 ?635次閱讀
    saas模式的<b class='flag-5'>一</b>套智慧工地云平臺(tái)源碼,支持多端展示:PC<b class='flag-5'>端</b>、大屏<b class='flag-5'>端</b>、手機(jī)<b class='flag-5'>端</b>、平板<b class='flag-5'>端</b>
    主站蜘蛛池模板: 天堂在线看 | 国产成人91青青草原精品 | caoporn97人人做人人爱最新 | 国产色视频网站 | 日韩黄色网址 | 免费欧美黄色网址 | 免费观看欧美成人1314色 | 免费看吻胸亲嘴激烈网站 | 免费亚洲一区 | 天天摸天天做 | 午夜影院在线观看视频 | 黄色午夜 | 日韩三级观看 | 欧洲国产精品精华液 | 91精品国产91久久久久久青草 | 操日本美女视频 | 午夜黄色福利 | 久久精品亚瑟全部免费观看 | 日韩毛片免费在线观看 | 能可以直接看的av网址 | 网站黄色在线观看 | 亚洲视频在线免费看 | 精品国产免费观看一区高清 | 四虎影院在线视频 | 国产成人永久在线播放 | 国产黄在线观看免费观看不卡 | 在线观看二区三区午夜 | ccav在线永久免费看 | 天堂资源在线 | 国产亚洲美女精品久久久2020 | 人人干视频在线观看 | 免费特黄| 四虎影院一区二区 | 亚洲视频一区在线 | 狠狠狠狠狠狠狠狠 | 色视频色露露永久免费观看 | 免费大片黄在线观看日本 | 欧美二级 | aa1在线天堂 | 国产黄色片在线观看 | 国产特级毛片 |