在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

中國團隊將計算機“詞匯級唇讀”精度提高到84.41%

獨愛72H ? 來源:DeepTech ? 作者:DeepTech ? 2020-03-19 16:38 ? 次閱讀

(文章來源:DeepTech)

近年來,隨著深度學習的迅速發展和廣泛的潛在應用,基于計算機視覺的唇讀技術受到越來越多的關注,它在實踐中有許多重要的應用,如輔助語音識別、生物認證、幫助聽障人士等。但是唇讀任務的難度非常高,一個關鍵點是如何有效地獲取唇部的運動信息,同時抵抗由姿勢、光線變化引起的識別困難,講話人的外貌、講話速度變化等干擾因素,此外,如何把唇語圖像特征與詞匯文本進行精確關聯或者區分同音詞也挑戰重重。

來自浙江工業大學、中國科學院智能信息處理重點實驗室以及中國科學院計算技術研究所的研究人員針對這些問題,提出在局部特征層和全局序列層引入互信息約束,以增強唇部視覺特征與語音內容的關系。通過在一些主流數據集上測試,該團隊提出的方法有望同時具有較好的鑒別能力和魯棒性,以實現有效的唇讀。

唇讀領域有一個重要技術分支即詞匯級唇讀,對于該任務,需要用單個單詞標簽對每個輸入視頻進行注釋,盡管在同一視頻中也存在其他單詞,如上圖所示:(a)中的視頻樣本總共包括 29 幀,被注釋為 “ABOUT”,但是單詞“ABOUT” 的實際幀僅包括時間步驟 T=1219 的幀,這個間隔前后的幀分別對應于單詞是 “JUST” 和“TEN”,而不是“ABOUT”。在基于唇語視覺的研究中,我們總是很難劃分一個單詞的確切邊界。

這種特性要求一個好的唇讀模型能夠學習到同一個詞標簽下不同視頻中反映的潛在但一致的特性,從而能夠更多地關注有效的關鍵幀,而較少關注其他無關幀。除了不精確的詞匯邊界挑戰外,對應于同一個詞標簽的視頻樣本總是具有極大的多樣化和外觀變化,如(b)所示,所有這些特性都要求唇讀模型能夠抵抗序列中的噪聲,從而在不同的語音條件下捕獲一致的潛在模式。

同時,由于唇部動作的有效面積有限,不同的詞在說話過程中可能表現出相似的現象。特別是,同音詞的存在,不同的詞看起來可能相同或非常相似,增加了許多額外的困難,這些屬性要求模型能夠發現與幀級別中不同單詞相關的細粒度差異,以便區分每個單詞。為了解決上述問題,研究人員在不同層次上引入了互信息最大化(MIM),以幫助該模型學習魯棒性和區分性表示,從而實現有效的唇讀。

一方面,通過施加局部互信息最大化約束(LMIM)來約束每個時間步產生的特征,使其與語音內容之間具有很強的相關性,從而提高了模型發現精細的嘴唇動作的能力,以及發音相似的單詞之間的細微差別,比如 “spend” 和“spending”;另一方面,引入了全局序列水平上的互信息最大化約束(GMIM),使得模型能夠更加注意區分與語音內容相關的關鍵幀,而且在說話過程中出現的各種噪音也較少。

此外,GMIM 迫使模型學習不同樣本中同一個詞標簽的潛在一致全局模式,同時對姿勢、光照和其他不相關條件的變化具有魯棒性;LMIM 可增強每個時間步與單詞相關的細粒度運動,進一步增強不同單詞之間的差異。通過將這兩類約束結合起來,模型可以自動發現和區分目標詞的有效重要幀,而忽略其他無關幀,進一步提高了識別的精準度。

最后,團隊在兩個大規模的單詞級唇讀數據集 LRW 和 LRW-1000 上與同行提出的主流唇語識別模型方法做了對比評估,這兩個數據集的樣本都是從各種不同的電視節目中收集的,并且演講條件也有很大的變化,涵蓋了包括燈光條件、分辨率、姿勢、性別、化妝等在內的多種說話條件。

LRW 于 2016 年發布,包括 500 個單詞的唇形樣本,1000 多個演講者,訓練集中的實例數達到 488766 個,驗證和測試集中的每個實例數為 25000 個;LRW-1000 數據集則是一個大規模的自然分布的字級基準數據集,總共有 1000 個中文詞匯,總計大約 718018 個樣本實例,持續時間約 57 小時,不過該數據集旨在覆蓋不同語音模式和成像條件下的自然變化,以納入實際應用中遇到的挑戰。

在 LRW 數據集上,引入 LMIM 之后,在基線準確率基礎上提高了約 1.19%,LMIM 有望為主要任務捕獲更具區分性和細粒度的特征,同時引入 GMIM 則把精度提高到了 84.41%,主要得益于其對不同幀的不同關注。

不過,在 LRW-1000 數據集上因其語音條件變化較大,包括燈光條件、分辨率、演講者年齡、姿勢、性別、化妝等,此前行業最佳測試結果僅為 38.19%。在這個數據集上獲得良好的識別效果仍是一個挑戰,新的模型方式獲得了 38.79% 的識別精度,略微優于現有的最新結果。

結果表明,該團隊提出的方法在不使用額外數據或額外的預訓練模型的情況下,在兩個具有挑戰性的數據集上相比其他唇語識別模型,呈現出一種新的實時性能狀態。此外,團隊表示,該方法還可以很容易地修改為其他任務的模型,從而為其他任務的研究提供一些有意義的見解。
(責任編輯:fqj)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7549

    瀏覽量

    88707
  • 深度學習
    +關注

    關注

    73

    文章

    5516

    瀏覽量

    121594
收藏 人收藏

    評論

    相關推薦

    量子計算機與普通計算機工作原理的區別

    ? 本文介紹了量子計算機與普通計算機工作原理的區別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然現在的量子
    的頭像 發表于 11-24 11:00 ?535次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區別

    工業中使用哪種類型的計算機

    工業計算機:穩健應用的基本解決方案各行各業對強大計算解決方案的需求日益增長,導致人們高度依賴工業計算機。這些專用系統專為典型消費電腦無法適應的環境而設計。從制造業
    的頭像 發表于 10-22 17:10 ?369次閱讀
    工業中使用哪種類型的<b class='flag-5'>計算機</b>?

    TAS5630B PBTL模式下,將音頻信號幅度提高到1.5倍,后的功放需不需要提高功率?

    我使用的TAS5630B,PBTL模式,之前音頻信號聲音偏小,現在將音頻信號幅度提高到1.5倍,不知道后的功放需不需要提高功率,還是音頻信號幅度提高不影響后
    發表于 10-16 08:08

    計算機存儲系統的構成

    計算機存儲系統是計算機中用于存放程序和數據的設備或部件的集合,它構成了計算機信息處理的基礎。一個完整的計算機存儲系統通常包括多個層次的存儲器,從高速緩存(Cache)
    的頭像 發表于 09-26 15:25 ?1353次閱讀

    晶體管計算機和電子管計算機有什么區別

    晶體管計算機和電子管計算機作為計算機發展史上的兩個重要階段,它們在多個方面存在顯著的區別。以下是對這兩類計算機在硬件、性能、應用以及技術發展等方面區別的詳細闡述。
    的頭像 發表于 08-23 15:28 ?2250次閱讀

    工業控制計算機的特點 工業控制計算機的應用領域

    工業控制計算機是一種專門為工業自動化和控制系統設計的計算機。它具有高度的可靠性、穩定性和實時性,能夠滿足工業生產過程中對控制精度和響應速度的嚴格要求。 工業控制計算機的特點 高可靠性
    的頭像 發表于 06-16 11:30 ?1594次閱讀

    工業計算機與普通計算機的區別

    在信息化和自動化日益發展的今天,計算機已經成為了我們日常生活和工作中不可或缺的工具。然而,在計算機領域中,工業計算機和普通計算機雖然都具備基本的計算
    的頭像 發表于 06-06 16:45 ?1635次閱讀

    本源超導量子計算機自主制造鏈11類產品系列之十:中國首套量子計算機應用軟件與解決方案

    本源超導量子計算機自主制造鏈由11個部分組成,該制造鏈生產的中國自主超導量子計算機已向中國用戶交付多臺,本源基于該制造鏈自主研制的中國第三代
    的頭像 發表于 06-06 08:22 ?579次閱讀
    本源超導量子<b class='flag-5'>計算機</b>自主制造鏈11類產品系列之十:<b class='flag-5'>中國</b>首套量子<b class='flag-5'>計算機</b>應用軟件與解決方案

    《環球時報》中英文刊發中國第三代自主超導量子計算機“悟空”研制團隊主要負責人專訪

    《環球時報》中英文刊發中國第三代自主超導量子計算機“悟空”研制團隊主要負責人專訪
    的頭像 發表于 06-01 08:22 ?429次閱讀
    《環球時報》中英文刊發<b class='flag-5'>中國</b>第三代自主超導量子<b class='flag-5'>計算機</b>“悟空”研制<b class='flag-5'>團隊</b>主要負責人專訪

    如何選擇嵌入式主板或單板計算機

    當尋求將計算平臺嵌入設備、機器或外殼中時,與嵌入式或工業計算平臺相比,消費或業余愛好者主板之間存在一些不容忽視的細微差別。如果沒有深入
    的頭像 發表于 05-21 16:31 ?1108次閱讀
    如何選擇嵌入式主板或單板<b class='flag-5'>計算機</b>

    抵御量子計算機攻擊!中國首個!

     據介紹,PQC技術能夠有效地抵抗量子計算機的攻擊。量子計算機因其超強算力可以對原本的公鑰密碼體系產生嚴重威脅。為抵抗量子計算機的潛在攻擊,世界各國紛紛加速推進PQC遷移以替換原本的公鑰密碼體系。
    的頭像 發表于 04-13 11:36 ?1050次閱讀

    【量子計算機重構未來 | 閱讀體驗】+ 了解量子疊加原理

    ,發現只要是涉及量子計算機原理方面的資料,其中提及最多的就是量子疊加,直接忽視專業大神的那些不太友好的解釋,只看科普性的解釋:量子疊加原理是量子力學的基本原理之一;量子比特可以同時處于多個狀態,這種
    發表于 03-13 17:19

    【量子計算機重構未來 | 閱讀體驗】第二章關鍵知識點

    計算機能夠減少計算和操作的繁瑣程度 作者從如何提高計算機的運算速度上,提出了提高計算速度的兩個方
    發表于 03-06 23:17

    【量子計算機重構未來 | 閱讀體驗】+ 初識量子計算機

    大語言模型訓練會是一個怎樣的情景。。。。。。 希望量子計算機盡快走出實驗室,能夠早日進入尋常百姓家,更希望我國的量子計算機取得突破,蓬勃發展,也能遙遙領先! 今天先研讀至此,后續所所感將繼續分享。 附
    發表于 03-05 17:37

    國產計算機平臺介紹——龍芯

    你了解中國的自主平臺的計算機嗎?不僅是中國制造,而是由中國自主研發,可以持續迭代產品,而且還能夠決定產品用途、決定技術歸屬權的國產計算機才是
    的頭像 發表于 03-05 11:40 ?951次閱讀
    國產<b class='flag-5'>計算機</b>平臺介紹——龍芯
    主站蜘蛛池模板: 午夜一级在线 | 久久夜色精品国产尤物 | 特黄特色的视频免费播放 | 亚洲国内精品 | 福利视频999| 天堂网在线www | 亚洲操操操 | 亚洲一区二区三区播放在线 | 特色一级黄色片 | 国产免费成人在线视频 | 久青草视频免费视频播放线路1 | 一区二区三区四区精品 | 大又大又粗又爽女人毛片 | 中文字幕在线播放一区 | 精品精品国产高清a毛片牛牛 | 黄网站在线观看高清免费 | 欧美三级黄 | 美女黄18以下禁止观看 | 天天伊人网 | 4455ee日本高清免费观看 | 最新版天堂资源8网 | 色综合欧美综合天天综合 | 国产亚洲精品自在久久77 | 夜夜夜夜曰天天天天拍国产 | 天天操天天舔天天干 | 日本在线视频一区二区三区 | 成人淫片 | 最新sss华人 | 亚洲综合视频一区 | 亚洲一区亚洲二区 | 免费看黄视频网站 | 丁香网五月 | 欧美一级欧美三级 | 亚洲一在线 | 国产精品伦理一区二区三区 | 日本三级香港三级三级人!妇久 | 天天夜夜狠狠一区二区三区 | 高清性色生活片欧美在线 | 亚洲国产综合久久精品 | 亚洲午夜精品久久久久久成年 | 狠狠操狠狠 |