91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用語音直接畫出人臉,AI再添新能力

hl5C_deeptechch ? 來源:YXQ ? 2019-07-17 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

聽聲辨人,利用聲紋進行解鎖,這種技術已廣泛應用,人類的聲音含有該個體的一定特征,從而可以進行區分。那么僅通過聲音,能否畫出人像,并且盡可能地與講話者相似呢?

近日,卡內基梅隆大學的Yandong Wen 等人,利用生成對抗網絡模型(generative adversarial networks, GANs)首次對這一問題作出研究,利用講話者的語音生成一些匹配原說話者面部特征的人臉,并用交叉模態匹配(cross-modal matching task)評估了模型表現,可謂是語音畫像領域的一大突破

模型框架

一個人的聲音和骨骼結構、發聲部位的形狀等特征的確有關,但利用語音直接畫出人臉,如何做到?

該由聲音重建人臉的模型框架主要由四個卷積網絡:語音嵌入模型(voice embedding network)、生成器(Generator)、判別器(Discriminator)、分類器(classifier)組成。

語音嵌入模型(voice embedding network)將輸入的語音數據,梅爾倒頻譜(log mel-spectrograms)轉換為含有該聲音特征的向量 e。該模型含有 5 層一維卷積神經網絡,每一層均是經由卷積核為 3、步長為 2、padding 為 1 得到,并且都經過歸一化層處理和 ReLU 單元激活,最后經過平均池化得到一個 64 維的向量。此模型是通過一個語音識別任務預先訓練得到參數,并且參數在生成人臉的訓練過程中保持不變。生成器(Generator)輸入為語音嵌入模型產生的向量 e,輸出是人臉 RGB 圖像 f',由 6 層二維反卷積網絡構成,激活函數采用 ReLU。

判別器(Discriminator)判斷輸入的圖像 f(或 f')是生成器偽造的圖像還是真實的人臉,如果判斷為偽造圖會加大損失 Ld。由 6 層激活單元為 Leaky ReLU 的二維卷積網絡構成,最后經過全連接層得到人臉圖像數據。

分類器(classifier)用來將人臉圖像與說話者匹配,如果匹配錯誤會加大損失 Lc。該模型由 6 層二維卷積網絡和一個全連接層組成。具體的結構如圖表,其中 Conv 3/2,1代表卷積核尺寸為 3,步長為 2,padding 填充為 1。

圖 | 從聲音重建人臉模型的具體結構。(來源:Yandong Wen, et al./CMU)模型通過最小化判別器與分類器的交叉熵損失 Ld 和 Lc 來訓練,以期得到圖像逼真且符合說話者特征的人臉。值得一提的是,此模型的測試集和訓練集以及驗證集相互獨立,即測試時的聲音是未聽過的,人臉也未知。

模型表現

不特意挑選那些人臉和真實講話者完美一致的結果,一般來講,該模型的確能輸出具有講話者特征的人臉,即使不完全一模一樣,從種族以及一些其他典型的面部特征來看,這個模型的確學習到了一些信息,輸出結果和原講話者非常像,并且語音時間越長,匹配的特征越多,兩者越類似

圖 | 從不同時長的正常錄音生成人臉的結果圖,右側Ref為真實講話者的不同臉部照片,從上到下的 4 位 Speaker 分別是 Danica McKellar, Cindy Williams, Damian Lewis, and Eva Green. (來源:Yandong Wen, et al./CMU)當然,性別及年齡特征也可以很好地被學習到,左側輸出結果的年齡和性別與右側真實人臉的年齡性別保持一致。在整個測試集上,生成圖和真實講話者性別相同的概率可以達到 96.5%

圖 | 從性別年齡的人臉重建,(a)是從老年聲音生成的人臉;(b)是男性聲音生成的人臉;(c)是女性聲音生成的人臉。其中左側為生成圖,右側為真實講話者。(來源:Yandong Wen, et al./CMU)如果用同一個人的不同語音片段,推測產生的人臉會保持相同特征嗎?模型結果告訴我們,是這樣。選用同一個講話者的 7 個不同語音片段,不特意挑選完美結果,模型所推測出的大概特征是十分一致的,這也側面說明,模型的確可以從一個人的語音抽取出一些特征,映射成其臉部的某些特征。

圖 | 利用一個人的 7 段不同語音重建人臉,左圖(a)是重建的 7 張人臉圖,右圖(b)是對應的真實人臉在不同情況的照片(來源:Yandong Wen, et al./CMU)進一步來講,如果從語音中學到的特征真的可以映射成面部的特征,那么生成人臉圖必定和真實講話者的臉部是對應匹配的。換句話說,聲音中的特征可以被生成人臉中蘊含的特征替代,那么由聲音重組人臉就變成了人臉識別問題,兩張臉(生成的和真實的)匹配,那么計劃可行,這個匹配率也就成了衡量模型表現的指標。在整個訓練集和測試集上,該模型的匹配率分別是 96.83% 和 76.07%;將訓練集和測試集按照性別分層,排除性別這一特征的助力,也就是直接比較同一性別上,生成的人臉和講話者是否相像,匹配率在訓練集和測試集上分別是 93.98%和 59.69%,這也證明了模型所學到的信息不僅僅是性別,還有其他更詳細的面部特征。該模型表現不僅優于 DIMNets-G,同時,測試集表現不如訓練集,說明模型還有很大提升空間。

圖 | 不同模型在性別分層以及不分層的數據集上的表現。(來源:Yandong Wen, et al./CMU)

展望

該模型雖然表現尚佳,但仍有可提升的地方,比如頭發和圖像背景等與聲音無關的特征,可以進行數據清洗將其去除,而有一些明顯與發聲有關的面部特征也可以加以利用,從而模型會更加精確。

總的來說,由音生貌,語音畫像問題的一塊空白得到了填補。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35194

    瀏覽量

    280293
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2211

    瀏覽量

    76884

原文標題:僅聽聲音就畫出人臉,GAN再添新能力

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【嘉楠堪智K230開發板試用體驗】K230 AI 功能體驗

    。K230 的KPU支持INT8和INT16, 典型網絡下實測推理能力可達K210的13.7倍,MAC利用率超70%。 同時K230提供了大量的AI視覺例程、包含:人體識別、物體檢測、目標跟蹤等多種場合
    發表于 07-15 15:24

    小智AI正式授權!安信可小安派語音AI開發板更新啦

    安信可正式推出 語音AI開發板—— AiPi-PalChatV1 為毛絨玩具、桌搭機器人、 陪伴手辦注入更有溫度的AI對話體驗! ? AiPi-PalChatV1 是一款接入了小智AI
    的頭像 發表于 07-15 15:06 ?120次閱讀
    小智<b class='flag-5'>AI</b>正式授權!安信可小安派<b class='flag-5'>語音</b><b class='flag-5'>AI</b>開發板更新啦

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現智能功能的特性,在一些網絡條件受限或對數據隱私有較高要求的場景中,發揮著不可或缺的作用。本章基于CSK6大模型語音
    發表于 07-04 11:14

    OBOO鷗柏丨AI數字人觸摸屏查詢觸控人臉識別語音交互一體機上市

    OBOO鷗柏丨AI數字人觸摸屏查詢觸控人臉識別語音交互一體機上市分析OBOO鷗柏品牌推出的AI數字人觸摸屏查詢觸控人臉識別
    的頭像 發表于 05-21 20:22 ?308次閱讀
    OBOO鷗柏丨<b class='flag-5'>AI</b>數字人觸摸屏查詢觸控<b class='flag-5'>人臉</b>識別<b class='flag-5'>語音</b>交互一體機上市

    NRK3301 AI語音芯片:玩具語音交互革新方案

    玩具AI語音芯片開發在玩具智能化浪潮中,九芯電子的NRK3301AI語音芯片憑借卓越性能與獨特藍牙連接功能,為玩具行業帶來創新應用方案,重塑玩具與用戶的互動模式。一、NRK3301芯片
    的頭像 發表于 05-09 13:49 ?258次閱讀
    NRK3301 <b class='flag-5'>AI</b><b class='flag-5'>語音</b>芯片:玩具<b class='flag-5'>語音</b>交互革新方案

    90元打造小智AI腕表,語音交互超有趣!

    的右下方。所以,方便左手攜帶。設計這個助手的初衷,就是下班途中,可以和AI聊聊未盡事宜,問問技術、問問天氣,如果AI回答不盡滿意,直接觸摸屏幕,打斷他。 背面視圖 TYPE-C 口,可以充電、固件
    發表于 04-16 14:26

    上線!國產AI語音開發板,定制你的聊天伙伴助手,可直接調用DeepSeek/豆包/通義千問

    AiPi-PalChatV1 ,可直接調用三大國產AI模型(DeepSeek/豆包/通義千問),輕松實現自然語言交互。 01概述 AiPi-PalChatV1 是一款接入了 小智 AI 智能體 的微型
    的頭像 發表于 04-15 17:11 ?442次閱讀
    上線!國產<b class='flag-5'>AI</b><b class='flag-5'>語音</b>開發板,定制你的聊天伙伴助手,可<b class='flag-5'>直接</b>調用DeepSeek/豆包/通義千問

    《DNESP32S3使用指南-IDF版_V1.6》第五十八章 人臉檢測實驗

    第五十八章 人臉檢測實驗 人臉檢測是一種基于人工智能(AI)的計算機技術,用于在數字圖像中查找和識別人臉人臉檢測技術可應用于各個領域,包括
    發表于 03-24 09:34

    安信可AI人臉識別方案

    作為神仙世界的高科技,"無接觸式開鎖",人臉識別技術也被廣泛應用在現代生活中,安信可也有AI人臉識別方案!
    的頭像 發表于 02-25 14:39 ?434次閱讀
    安信可<b class='flag-5'>AI</b><b class='flag-5'>人臉</b>識別方案

    芯波微電子突發模式跨阻放大器產品家族新成員

    近日,芯波微電子的50G線性突發模式跨阻放大器XB1251在客戶測試中得到業界一流性能。芯波微電子的突發模式跨阻放大器家族(XB12產品族)重要新成員!???
    的頭像 發表于 02-24 17:21 ?634次閱讀

    大聯大推出基于MediaTek Genio 130與ChatGPT的AI語音助理方案

    ,為市場帶來了全新的智能交互體驗。 該AI語音助理方案充分利用了MediaTek Genio 130芯片的強大性能與ChatGPT的先進人工智能技術。MediaTek Genio 130芯片作為聯發
    的頭像 發表于 12-11 11:07 ?841次閱讀

    九芯電子NRK330X系列:智能AI用語音識別芯片

    、調節還是關機,用戶只需簡單口述,便能輕松完成操作。NRK330X系列:AI人機交互的高性能語音芯片2022年,九芯電子推出了高性能、低成本語音識別芯片NRK330X
    的頭像 發表于 11-19 01:00 ?738次閱讀
    九芯電子NRK330X系列:智能<b class='flag-5'>AI</b>專<b class='flag-5'>用語音</b>識別芯片

    《DNK210使用指南 -CanMV版 V1.0》第四十五章 人臉識別實驗

    第四十五章 人臉識別實驗 在上一章節中,介紹了利用maix.KPU模塊實現了人臉68關鍵點檢測,本章將繼續介紹利用maix.KPU模塊實現的人臉
    發表于 11-18 14:30

    《DNK210使用指南 -CanMV版 V1.0》第四十四章 人臉68關鍵點檢測實驗

    第四十四章 人臉68關鍵點檢測實驗 在上一章節中,介紹了利用maix.KPU模塊實現了人臉屬性分析,本章將繼續介紹利用maix.KPU模塊實現的人臉
    發表于 11-18 14:28

    深度識別人臉識別在任務中為什么有很強大的建模能力

    深度學習人臉識別技術是人工智能領域中的一個重要分支,它利用深度學習算法來識別和驗證人臉。這項技術在近年來取得了顯著的進展,其強大的建模能力主要得益于以下幾個方面: 數據驅動的學習方式
    的頭像 發表于 09-10 14:53 ?846次閱讀
    主站蜘蛛池模板: 免费无遮挡很爽很污很黄 | 午夜大片网 | 亚洲性人人天天夜夜摸 | 男女交性视频播放视频视频 | 综合丁香 | 波多野结衣一级特黄毛片 | 久久久久国产精品四虎 | 美女牲交毛片一级视频 | 天天插天天爱 | 男人操女人视频免费 | 天堂视频在线免费观看 | 天天插天天射 | 久久国产精品免费网站 | 欧美无遮挡国产欧美另类 | a男人的天堂久久a毛片 | 粗又长好猛好爽 | 一区二区三区四区视频 | 卡2卡三卡四卡精品公司 | 国产aaaaaa| 亚洲欧美一区二区三区在线播放 | 久久视频免费 | 亚洲伊人久久网 | 免费又黄又硬又大爽日本 | 国产特黄1级毛片 | 国产自在自线午夜精品视频在 | 欧美高h | 日本三级免费观看 | 日韩成人毛片高清视频免费看 | 天堂资源在线种子资源 | 欧美成人观看免费全部完小说 | 无人区理论片手机看片 | 日本黄色影片在线观看 | 韩国免费三片在线视频 | 自偷自拍亚洲欧美清纯唯美 | 色综合久久综合 | 前后灌满白浆护士 | 成人免费看黄网站无遮挡 | 日韩美香港a一级毛片 | 91福利网winktv| 青草青草视频2免费观看 | h视频在线观看免费网站 |