在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

麻省大學研發MakeItTalk:如何讓圖片開口“說話”

如意 ? 來源:新智元 ? 作者:佚名 ? 2020-10-20 16:21 ? 次閱讀

最近,麻省大學Amherst分校的Yang Zhou博士和他的團隊提出了一種具有深度結構的新方法「MakeItTalk」。給定一個音頻語音信號和一個人像圖像作為輸入,模型便會生成說話人感知的有聲動畫圖。

富有表現力的動畫誰都想要!

面部動畫在很多領域都是一項關鍵技術,比如制作電影、視頻流、電腦游戲、虛擬化身等等。

盡管在技術上取得了無數的成就,但是創造逼真的面部動畫仍然是計算機圖形學的挑戰。

一是整個面部表情包含了完整面部各部分之間的相互關系,面部運動和語音之間的協同是一項艱巨的任務,因為面部動態在高維多重影像中占主導地位,其中頭部姿勢最為關鍵。

二是多個說話人會有不同的說話方式,控制嘴唇一致,不足以了解說話的人的性格,還要表達不同的個性。

針對上述問題,Yang Zhou博士和他的團隊提出了一種具有深度結構的新方法「 MakeItTalk」。

這是一種具有深度架構的新方法,只需要一個音頻和一個面部圖像作為輸入,程序就會輸出一個逼真的「說話的頭部動畫」。

下面,我們就來看看,MakeItTalk的是如何讓圖片「說話」的。

都給我開口說話!神奇的 MakeItTalk 是什么?

MakeItTalk是一個新的深度學習為基礎的架構,能夠識別面部標志、下巴、頭部姿勢、眉毛、鼻子,并切能夠通過聲音的刺激使嘴唇發生變化。

模型以LSTM 和 CNN 為基礎,可以根據說話人的音調和內容,讓面部表情和頭部產生隨動。

本質上, MakeItTalk將輸入音頻信號中的內容和說話人分離出來,從產生的抽象表示中提取出對應的動畫。

而嘴唇和相鄰面部的協同也尤為重要。說話者的信息被用來獲取其他面部表情和頭部動作,而這些對于生成富有表現力的頭部動畫是必需的。

MakeItTalk模型既可以生成逼真的人臉說話圖像,也可以生成非逼真的卡通說話圖像。

聲音+圖像=「開口說話」?MakeItTalk是如何做到的?

下面的圖表顯示了生成逼真的說話頭像的完整方法和途徑:

(1)一個音頻剪輯和一個單一的面部圖像可以制作一個與音頻協調的,能感知說話者的頭部動畫。

(2)在訓練階段,使用現成的人臉檢測器對輸入的視頻進行預處理,提取標記,從輸入的音頻中訓練基礎模型,實現語音內容轉動畫和標記的精確提取。

(3)為了獲得高精度的運動,通過對輸入音頻信號的分離內容和說話人嵌入來檢測標記點的估計。為此,采用語音轉換神經網絡對語音內容進行提取,發現語音內容。

(4)內容與說話者無關,并且捕獲了嘴唇和相鄰部位的常見運動,其中說話內容調節了動作的特征和說話者頭部動作的剩余部分。

(5)嘴唇的大小和形狀隨著眼睛、鼻子和頭部的運動而擴大,這取決于誰說了這個詞,也就是說話人身份。

(6)最后,為了生成轉換后的圖像,MakeItTalk采用了兩種算法進行標記到圖像的合成:

對于非真實感的圖像,如畫布藝術或矢量藝術,一個特定的畸變方法是在 Delaunay triangulation 的基礎上部署;

對于真實感圖像,構建一個圖像到圖像的轉換網絡(與 pix2pix 相同) ,直接轉換自然人臉。

最后,混合所有的圖像幀和音頻共同生成頭部動畫。

作者簡介

該項目的作者本科畢業于上海交通大學電子工程系,然后在喬治亞理工學院獲得了碩士學位,現在是馬薩諸塞大學阿默斯特分校計算機圖形學科學研究小組的一名計算機科學博士生。

Yang Zhou在計算機圖形學和機器學習領域工作。主要致力于用深度學習技術來幫助藝術家、造型師和動畫師做出更好的設計。

如果也想給你的設計加點AI的基因,Yang Zhou的論文列表絕對是個不錯的選擇,有很多關于動畫生成和多模態深度學習的研究。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    29

    文章

    3012

    瀏覽量

    82969
  • 模型
    +關注

    關注

    1

    文章

    3479

    瀏覽量

    49931
  • 圖片
    +關注

    關注

    0

    文章

    203

    瀏覽量

    16160
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    大模型“開口說話”,啟英泰倫重塑AI玩具交互新體驗!

    2025年,AI玩具已成為全球消費科技領域最炙手可熱的賽道之一。DeepSeek的崛起,顯著降低了大模型的部署成本和門檻,成功點燃了整個行業以及資本市場對端側AI落地的熱情,進一步推動了AI玩具的熱潮。接入大模型的AI玩具從市場需求來看,AI玩具正在重新定義兒童陪伴與教育的方式,不僅滿足“玩”的基本需求,而且,通過智能“擬人化”交互可為兒童提供豐富的情緒價值
    的頭像 發表于 04-11 18:31 ?288次閱讀
    <b class='flag-5'>讓</b>大模型“<b class='flag-5'>開口說話</b>”,啟英泰倫重塑AI玩具交互新體驗!

    數傳終端:數據飛起來的 “空中快遞員”

    就像一位隱形的 “空中快遞員”,在看不見的電波中穿梭,把海量數據安全、快速地送到目的地。 它的核心使命 :將傳感器、設備、系統產生的數據,通過無線或有線網絡傳輸到云端或控制中心。簡單來說,就是 “啞巴” 設備開口說話
    的頭像 發表于 04-02 23:59 ?223次閱讀
    數傳終端:<b class='flag-5'>讓</b>數據飛起來的 “空中快遞員”

    光伏智慧運維系統電站自己說話和思考

    ?????? 光伏智慧運維系統電站自己說話和思考 ?????? 太陽能電站就像一個大家族,由成千上萬塊太陽能板、逆變器、線路等組成。過去,要管理這么大的家族,只能靠人工每天去現場檢查,效率低還容易
    的頭像 發表于 03-27 17:01 ?223次閱讀
    光伏智慧運維系統<b class='flag-5'>讓</b>電站自己<b class='flag-5'>說話</b>和思考

    深入剖析智芯傳感開口封封裝技術

    封裝是MEMS制造過程的重要環節,決定了MEMS器件的可靠性和成本。開口封封裝技術是智芯傳感在封裝工藝上的一次創新突破。這一創新技術不僅攻克了MEMS壓力傳感芯片一體化塑封的這一世界級難題,還憑借其卓越的性能與高效生產優勢,引領著行業的技術升級。本文將深入剖析開口封封裝技
    的頭像 發表于 03-19 10:39 ?480次閱讀
    深入剖析智芯傳感<b class='flag-5'>開口</b>封封裝技術

    如何DLP4500顯示電腦上的圖片

    手頭有一塊DLP4500,然后有一根USB和mini-HDMI。我想在電腦上選取一些圖片DLP進行顯示。請問需要怎么連線?還有圖片怎么傳給DLP?電腦上有下載DLPLCR4500GUI這個軟件,是通過它來實現的嗎?我是新手
    發表于 02-28 07:49

    中國移動與南京大學合作研發高保真2D數字人說話系統

    近日,中國移動宣布了一項重要合作成果——聯合南京大學團隊成功研發出高保真2D數字人說話驅動系統。 作為全球用戶規模最大的通信運營商,中國移動每年的客戶服務運營成本居高不下。盡管智能語音客服已得到
    的頭像 發表于 12-13 11:32 ?909次閱讀

    開口式電流互感器功能及使用場景

    開口式互感器是一種特殊類型的電流互感器,其主要特點是可以在不切斷電纜或母線的情況下進行安裝,這對于正在運行的電力系統改造項目尤為重要。開口式互感器的設計允許它直接穿過電力系統的導線,無需斷電操作
    的頭像 發表于 12-05 10:28 ?1067次閱讀
    <b class='flag-5'>開口</b>式電流互感器功能及使用場景

    兆元光電與廈門大學攜手,Mini/Micro LED技術將迎新突破

    進行深入合作,推動Mini/Micro LED技術的研發和應用。 圖片來源:兆元光電 此次合作將充分利用廈門大學在電子技術領域的科研優勢和兆元光電在技術應用方面的行業經驗,計劃通過聯合研發
    的頭像 發表于 11-29 09:40 ?492次閱讀
    兆元光電與廈門<b class='flag-5'>大學</b>攜手,Mini/Micro LED技術將迎新突破

    現代起亞聯合大學設立機器人研發實驗室

    據外媒報道,現代汽車集團旗下的現代汽車和起亞汽車于當地時間周三共同宣布,他們已經攜手首爾大學、浦項科技大學以及韓國科學技術研究院,共同創立了一個專注于機器人技術研發的實驗室。
    的頭像 發表于 10-25 16:00 ?631次閱讀

    開口式互感器好不好 開口電流互感器有什么缺點

    安科瑞徐赟杰18706165067 開口式互感器是一種常用于測量電流的傳感器。它通過將導線穿過一個開口,利用線圈中的磁場感應原理來測量電流的強度。本文將以“開口式互感器好不好”和“開口
    的頭像 發表于 09-27 09:22 ?921次閱讀
    <b class='flag-5'>開口</b>式互感器好不好 <b class='flag-5'>開口</b>電流互感器有什么缺點

    安科瑞AKH-0.66系列開口式電流互感器

    概述:?[AKH開口式電流互感器]?是一種專門設計用于低壓電力測量的設備,它屬于[開口式電流互感器]的一種,具有高安全性和方便的安裝特性。這種互感器由一個閉合的璧式鐵芯組成,中間開有一個口,用于容納
    發表于 09-26 10:37

    基于ArkTS語言的OpenHarmony APP應用開發:圖片處理

    1、程序介紹本案例使用TextArea實現多文本輸入,使用mediaLibrary實現在相冊中獲取圖片,使用image生成pixelMap,使用pixelMap的scale(),crop
    的頭像 發表于 09-20 08:07 ?1147次閱讀
    基于ArkTS語言的OpenHarmony APP應用開發:<b class='flag-5'>圖片</b>處理

    2024年芯片行業有多難?用數據說話

    2024年芯片行業有多難?用數據說話
    的頭像 發表于 08-10 18:20 ?5445次閱讀

    日本大學研發出新極紫外(EUV)光刻技術

    近日,日本沖繩科學技術大學大學(OIST)發布了一項重大研究報告,宣布該校成功研發出一種突破性的極紫外(EUV)光刻技術。這一創新技術超越了當前半導體制造業的標準界限,其設計的光刻設備能夠采用更小巧的EUV光源,并且功耗僅為傳
    的頭像 發表于 08-03 12:45 ?1469次閱讀

    藍寶石光纖傳感,廣西大學研發

    ,攜手開創傳感技術的新篇章。 廣西大學藍寶石光纖傳感團隊自2018年成立以來,一直專注于藍寶石光纖傳感技術的研發和應用,并取得了多項具有國際先進水平的研究成果。而此次合作的高科技企業則擁有強大的市場網絡和產業化能力,是國內
    的頭像 發表于 07-30 08:42 ?486次閱讀
    藍寶石光纖傳感,廣西<b class='flag-5'>大學</b><b class='flag-5'>研發</b>!
    主站蜘蛛池模板: a毛片免费观看完整 | 国产精品伦视频观看免费 | 五月婷婷六月激情 | 亚洲欧美色鬼久久综合 | xxxx日本在线播放免费不卡 | 日日插夜夜爽 | 色噜噜噜噜噜在线观看网站 | 极品美女洗澡后露粉嫩木耳视频 | 日本三级网址 | 免费在线观看大片影视大全 | 国产91小视频在线观看 | 狠狠躁夜夜躁人人爽天天3 狠狠躁夜夜躁人人爽天天段 | 日本一道dvd在线中文字幕 | 男女一级特黄a大片 | 黄色大片视频网站 | 爽好舒服快小柔小说 | 欧美日韩亚洲国产 | 最新亚洲一区二区三区四区 | 久久久久国产 | 天天爱夜夜爱 | 嫩草黄色影院 | 中文免费观看视频网站 | 四虎影院com | 日成人网| 免费一级毛片清高播放 | 狠狠色丁香久久婷婷综合丁香 | jizz性欧美12| 四虎永久免费在线观看 | 一区二区三区高清 | 日本黄视频在线观看 | 九色欧美 | 亚洲一区二区三区免费看 | avbobo在线| 久久这里只有精品1 | 欧美久久天天综合香蕉伊 | 久久鬼 | 99久久99久久久精品齐齐鬼色 | 午夜狠狠操 | 4455永久在线毛片观看 | 伊人网视频在线 | 91极品反差婊在线观看 |