在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI使用音頻剪輯對與語音匹配的真實感面部建模

倩倩 ? 來源:新經(jīng)網(wǎng) ? 2020-04-11 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

您是否曾經(jīng)僅僅根據(jù)他們的聲音來構(gòu)造一個從未見過的人的心理形象?人工智能AI)現(xiàn)在可以做到這一點,僅使用簡短的音頻剪輯作為參考即可生成人臉的數(shù)字圖像。

這個名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(luò)(一種以類似于人腦的方式“思考”的計算機)經(jīng)過科學(xué)家培訓(xùn),接受了來自互聯(lián)網(wǎng)的數(shù)百萬個教育視頻,顯示了100,000多個不同的人在說話。

研究人員在一項新研究中寫道,Speech2Face通過該數(shù)據(jù)集學(xué)習(xí)了語音提示與人臉某些物理特征之間的關(guān)聯(lián)。然后,AI使用音頻剪輯對與語音匹配的真實感面部建模。

值得慶幸的是,人工智能還不能僅僅根據(jù)他們的聲音確切地知道特定的人是什么樣。研究作者報告說,神經(jīng)網(wǎng)絡(luò)識別語音中的某些標(biāo)記,這些標(biāo)記指向性別,年齡和種族,是許多人共有的特征。

科學(xué)家寫道:“因此,該模型只會產(chǎn)生看上去普通的面孔。” “它不會產(chǎn)生特定個人的圖像。”

盡管坦率地說,對貓的解釋有點讓人恐懼,但AI已經(jīng)證明它可以產(chǎn)生出異常準(zhǔn)確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是,根據(jù)這項研究,這些圖像通常確實可以捕捉到正確的年齡范圍,種族和性別。

但是,該算法的解釋遠非完美。當(dāng)面對語言變化時,Speech2Face表現(xiàn)出“混合表現(xiàn)”。例如,當(dāng)AI收聽亞洲人講中文的音頻片段時,該程序會產(chǎn)生亞洲人臉的圖像。然而,據(jù)科學(xué)家報道,當(dāng)同一個人用不同的音頻片段講英語時,人工智能產(chǎn)生了白人的面孔。

該算法還顯示出性別偏見,將低音調(diào)的聲音與男性面孔相關(guān)聯(lián),將高音調(diào)的聲音與女性面孔相關(guān)聯(lián)。研究人員寫道,由于訓(xùn)練數(shù)據(jù)集僅代表YouTube上的教育視頻,因此“并不代表整個世界人口。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)字圖像
    +關(guān)注

    關(guān)注

    2

    文章

    120

    瀏覽量

    19085
  • 人工智能
    +關(guān)注

    關(guān)注

    1805

    文章

    48883

    瀏覽量

    247730
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25343
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI玩具爆發(fā),音頻編解碼器如何滿足語音交互需求

    電子發(fā)燒友網(wǎng)綜合報道,在AI玩具已經(jīng)開始逐漸爆發(fā)的當(dāng)下,人機交互已經(jīng)成為標(biāo)配功能,而最重要的便是語音控制。而語音控制的第一步,便需要讓AI玩具聽懂你在說什么這就需要用到
    的頭像 發(fā)表于 06-20 01:07 ?5964次閱讀

    康謀方案 | 高精LiDAR+神經(jīng)渲染3DGS的完美融合實踐

    在自動駕駛仿真測試剛需下,數(shù)字孿生成提升保真度關(guān)鍵。本文介紹傳統(tǒng)與前沿結(jié)合的構(gòu)建流程,先通過數(shù)據(jù)采集、點云聚合等完成高精地圖重建,再以NeRF+3DGS實現(xiàn)神經(jīng)網(wǎng)絡(luò)重建,降本增效,為仿真注入真實感,重塑測試范式。
    的頭像 發(fā)表于 06-11 13:51 ?1028次閱讀
    康謀方案 | 高精LiDAR+神經(jīng)渲染3DGS的完美融合實踐

    90元打造小智AI腕表,語音交互超有趣!

    ,分辨率 240*280,支持觸摸。 語音交互:內(nèi)置麥克風(fēng),支持語音喚醒和語音指令。 音頻播放:1609 8Ω/1W 喇叭。 外殼設(shè)計:智能手表。 鋰電池:302535 320mAh,
    發(fā)表于 04-16 14:26

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    一、功能介紹小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結(jié)合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現(xiàn)
    發(fā)表于 03-29 16:30

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結(jié)合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現(xiàn)人機交互功能
    的頭像 發(fā)表于 03-29 15:33 ?6529次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b>交互系統(tǒng)(<b class='flag-5'>AI</b>小智)開發(fā)教程

    借助Arm技術(shù)革新未來手游體驗

    手游正在不斷得到重塑。隨著內(nèi)容創(chuàng)作、真實感和沉浸式體驗的顯著發(fā)展,移動設(shè)備上的游戲開發(fā)和體驗方式正在發(fā)生快速演變。
    的頭像 發(fā)表于 03-10 09:17 ?634次閱讀

    芯知識 決定語音芯片高音質(zhì)的因素

    語音芯片高音質(zhì)因素包括高分辨率音頻、低失真高動態(tài)范圍、高品質(zhì)音頻編解碼、深度音頻處理及VR/AR音頻體驗,這些因素共同提升
    的頭像 發(fā)表于 02-17 14:56 ?295次閱讀

    用Reality AI Tools創(chuàng)建模

    在第二步采集到的數(shù)據(jù)基礎(chǔ)之上,用Reality AI Tools創(chuàng)建模型。
    的頭像 發(fā)表于 01-22 14:23 ?2182次閱讀
    用Reality <b class='flag-5'>AI</b> Tools創(chuàng)<b class='flag-5'>建模</b>型

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開發(fā)語言創(chuàng)建一個簡單的AI智能語音播報應(yīng)用。 該應(yīng)用能夠接收用戶輸入的文本,并使用TTS
    發(fā)表于 01-06 15:33

    XMOS將亮相CES 2025,展示全新AI音頻技術(shù)

    帶來更加智能、完美、準(zhǔn)確和低延時的音頻體驗。 這些創(chuàng)新技術(shù)包括空間音效、語音捕獲與降噪、音視頻多模態(tài)AI處理等,均由XMOS的xcore.ai系列多核控制器提供支持。xcore.
    的頭像 發(fā)表于 12-13 11:20 ?1504次閱讀

    充電樁語音方案,支持OTA語音升級的音頻芯片NV400F

    1產(chǎn)品市場隨著新能源汽車的普及,充電樁作為其核心配套設(shè)施,其智能化、便捷化的需求日益增長。充電樁語音方案,尤其是支持OTA(Over-The-Air)語音升級的音頻芯片NV400F,正逐步成為市場上
    的頭像 發(fā)表于 11-09 01:03 ?777次閱讀
    充電樁<b class='flag-5'>語音</b>方案,支持OTA<b class='flag-5'>語音</b>升級的<b class='flag-5'>音頻</b>芯片NV400F

    tlv320Ai32在輸出音頻時總有絲絲聲,為什么?

    tlv320Ai32在輸出音頻時總有絲絲聲,即使輸出的濾波將噪聲調(diào)整到90mV以下還是存在。測試發(fā)現(xiàn)HPout的噪聲有將近480mV 請問這是什么原因,Ai32還有什么寄存器要設(shè)置的? 模擬電源的紋波大概60mV,有影響嗎?
    發(fā)表于 11-05 06:09

    NVH-FLASH語音芯片支持平臺做語音—打造音頻IC技術(shù)革新

    隨著科技的飛速發(fā)展,人們對于電子產(chǎn)品的音頻性能要求越來越高。在這種背景下,NVH-FLASH系列語音芯片應(yīng)運而生,作為音頻IC領(lǐng)域的一次重大技術(shù)革新,NVH-FLASH系列語音芯片憑借
    的頭像 發(fā)表于 10-16 08:02 ?567次閱讀
    NVH-FLASH<b class='flag-5'>語音</b>芯片支持平臺做<b class='flag-5'>語音</b>—打造<b class='flag-5'>音頻</b>IC技術(shù)革新

    真實感受,迷你主機到底是不是智商稅?

    我是今年年初把我的臺式主機換成了華碩的迷你主機PN65(主要是我這臺主機太大,我感覺它太礙事),第一次接觸迷你主機是被它 小巧輕便的 外形所吸引的,相比與傳統(tǒng)主機的厚重,迷你主機只有巴掌哪么大 ,對于辦公面積不大的小伙伴來說絕對是一大福音。 直接上圖大家看吧 ? ? 尺寸大小對比 ? ? 都說只有巴掌大小,現(xiàn)實對比只有我半個手掌大 ? 總感覺迷你主機的性能不如臺式主機,買臺式主機到底是不是智商稅? 我手里的這臺迷你主機從購買
    的頭像 發(fā)表于 08-13 18:25 ?555次閱讀
    <b class='flag-5'>真實感</b>受,迷你主機到底是不是智商稅?

    開放式音頻系統(tǒng)引入AI大模型,藍牙音頻SOC邁向高端化

    功能,如今正逐漸成為市場的焦點。 ? 不過智能眼鏡設(shè)備不能忽視的挑戰(zhàn)是其開放式音頻系統(tǒng),音頻作為智能眼鏡最基礎(chǔ)的功能,在完成多種交互體驗之外,如何實現(xiàn)更好的音頻體驗,也是需要不斷突破的技術(shù)難題。 ? ?
    的頭像 發(fā)表于 07-16 09:09 ?4765次閱讀
    開放式<b class='flag-5'>音頻</b>系統(tǒng)引入<b class='flag-5'>AI</b>大模型,藍牙<b class='flag-5'>音頻</b>SOC邁向高端化
    主站蜘蛛池模板: 国产大乳喷奶水在线看 | 亚洲福利一区福利三区 | 亚洲五月激情综合图片区 | 午夜短视频 | 四虎影永久在线观看网址 | 黄色生活毛片 | 美女被草视频 | 久久这里只有精品1 | 国产一区二区三区 韩国女主播 | 无人码一区二区三区视频 | 特级全黄一级毛片免费 | 亚洲狠狠色丁香婷婷综合 | 男女刺激性视频大片 | v视界影院最新网站 | 伊人精品网| www淫| 欧洲精品不卡1卡2卡三卡四卡 | 伊人成年综合网 | 国产精品久久久久网站 | 午夜精品视频在线观看美女 | 久久亚洲综合中文字幕 | 欧美在线小视频 | 国产网站在线免费观看 | 轻点灬大ji巴太粗太长了啊h | 一区二区三区免费 | 日本a级片在线观看 | 久久福利国产 | 亚洲码欧美码一区二区三区 | 美女视频一区二区 | 婷婷久久综合九色综合九七 | 老师下面好湿好紧好滑好想要 | 在线观看日本免费视频大片一区 | 久久性久久性久久久爽 | 国产美女在线精品免费观看 | 日本黄在线观看 | 国产在线视频欧美亚综合 | 国产精品久久久久久影院 | 国产三级精品三级在线观看 | 亚洲人毛茸茸bbxx | 国产女人和拘做受视频免费 | 久久精品久噜噜噜久久 |