91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

推出“唇語識別”技術, 搜狗再上熱門 不出聲也能“聽”懂你

Qp2m_ggservicer ? 2017-12-15 11:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能概念火熱的當下,人機交互的發展方向也正趨于多元化,從最初的鍵盤打字到觸控屏,再到現在的語音交互和手勢交互,無一不是前沿技術落地的結果。

12月14日消息,搜狗今天正式推出全新的人機交互新技術——唇語識別,這也是業內首個公開演示的唇語識別系統,通過機器視覺識別,不用聽聲音,僅靠識別說話人唇部動作,就能解讀說話者所說的內容。

與已有的語音識別產品不同,唇語識別是一項基于機器視覺與自然語言處理于一體的技術,因此在研發難度上比語音識別大得多。

搜狗語音交互中心技術總監陳偉告訴記者,搜狗的唇語識別技術首創了復雜端到端深度神經網絡技術進行中文唇語序列建模,通過數千小時的真實唇語數據訓練,加上搜狗在自然語言處理方面的強大優勢,最終取得了業界領先的唇語識別效果。

按照搜狗方面提供的數據顯示,在非特定人開放口語測試集上,搜狗唇語識別系統已經達到60%以上的準確率,超過google發布的英文唇語系統50%以上的準確率,在垂直場景如車載、智能家居等場景下甚至已經達到90%的準確率。

在這里要著重說明的是,中文唇語識別的難度要高于英文唇語識別。

陳偉解釋到,中文有四個聲調,英文的基本發音單元在50個左右,而如果中文的聲韻母切開來看,建模數量會超過200個。

在剛結束不久的烏鎮世界互聯網大會上,搜狗唇語識別技術亮相,在業內大多數唇語識別技術實用性尚待考證的環境下,成功完成了業內首個中文唇語識別系統的公開演示。

國內大部分企業都扎堆聚集在智能語音、圖像識別等領域,陳偉表示,搜狗開發唇語識別技術是希望解決嘈雜環境下的語音識別準確度問題。

目前有兩種方式可以解決這個問題:一是硬件層面的語音增強,對噪音進行屏蔽;二是增加多模態信息,比如唇語識別的圖像信息。

作為人機交互的形式之一,未來唇語識別技術可以輔助語音交互及圖像識別,在日常生活、安防、公益等各個領域實現廣泛應用。

比如在車載場景下,周圍噪音過大時會對語音指令產生干擾,通過唇語識別技術則可以規避干擾,保證人車交互的準確性和穩定性,日常不便發聲的公共場所也可以保證說話內容的私密性;在安防領域,由于目前多數監控只有攝像頭沒有麥克風,往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識別技術可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。

除此之外,唇語識別技術還能發揮巨大的公益價值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達自己。

搜狗近年來一直在集中資源做自然語言的研究,目前在語音識別、語義理解、機器翻譯等方面均取得了比較領先的成果并實現產品落地,此次推出唇語識別技術,將推動整個AI行業的技術革新。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 搜狗
    +關注

    關注

    0

    文章

    91

    瀏覽量

    14110

原文標題:GGAI 技術前沿 | 搜狗推出“唇語識別”技術:不出聲也能“聽”懂你

文章出處:【微信號:ggservicerobot,微信公眾號:高工智能未來】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    曠世之聲全新無損藍牙發射器支持驍龍暢技術

    近日,曠世之聲正式推出QCC Dongle Pro和QCC Dongle無損藍牙發射器,該系列產品分別搭載第二代高通S5音頻平臺和第二代高通S3音頻平臺,支持Snapdragon Sound 驍龍暢技術,賦
    的頭像 發表于 07-14 15:22 ?153次閱讀

    NRK3502語音識別芯片:開啟自動炒菜機智能烹飪新時代

    "動口不動手"的烹飪革命來了!NRK3502語音芯片讓自動炒菜機聽懂你的每句話,3-5米遠場精準識別,在油煙嘈雜中秒懂指令。從此預熱、炒菜、暫停全語音操控,邊做飯邊處理其他事,廚房
    的頭像 發表于 06-25 13:57 ?112次閱讀

    智能語音新風尚:WTK6900語音識別芯片賦未來家居,讓涼爽觸“聲”可及

    起點,我們開啟一場“解放雙手”的科技革命,讓每一縷涼風都隨“聲”而至。一、核心技術:精準識別,無懼環境挑戰自適應降噪,聽懂你的每一句話WTK6900系列芯片搭載前
    的頭像 發表于 04-08 08:43 ?505次閱讀
    智能語音新風尚:WTK6900語音<b class='flag-5'>識別</b>芯片賦<b class='flag-5'>能</b>未來家居,讓涼爽觸“聲”可及

    中科芯:科技之光溫暖障人群

    樹立行業標桿,講好中國故事,傳遞中國聲音,充分展現騰飛的中國經濟、崛起的民族品牌和向上的企業家精神。近日,“崛起的民族品牌”專題系列節目對話天津中科芯科技有限公司(簡稱:中科芯)的創始人兼總經理
    的頭像 發表于 01-13 10:54 ?546次閱讀
    中科<b class='flag-5'>聽</b>芯:科技之光溫暖<b class='flag-5'>聽</b>障人群

    ADS1255斷電之后再上電就不可以讀取了,是什么原因?

    如題,使用ADS1255芯片做數據采集的時候,STM32F107在下載數據之后第一次正確AD數據采集,在仿真的時候可以一直做AD數據采集。但是斷電之后再上電就不可以讀取了,請教一下什么原因。采集電壓不變,VREF不變。
    發表于 01-10 08:06

    亮亮視野攜者AR字幕眼鏡亮相2024福祉博覽會

    全球康復輔具產業注入新的活力與動力!亮亮視野攜者AR字幕眼鏡亮相展會,以其創新的科技和服務模式,獲得眾多參觀觀眾、機構的一致好評。
    的頭像 發表于 12-05 16:33 ?998次閱讀

    語音識別與自然語言處理的關系

    了人機交互的革命,使得機器能夠更加自然地與人類溝通。 語音識別技術概述 語音識別,稱為自動語音識別(ASR),是指將人類的語音轉換成文本的
    的頭像 發表于 11-26 09:21 ?1490次閱讀

    語音識別技術的應用與發展

    語音識別技術的發展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學習技術的進步,這項技術才真正成熟并廣泛應用于各個領域。語音識別
    的頭像 發表于 11-26 09:20 ?1623次閱讀

    Xiaomi Buds 5耳機支持Snapdragon Sound驍龍暢技術

    近日,小米舉辦旗艦新品發布會,正式推出Xiaomi Buds 5耳機。該款耳機基于第二代高通S3音頻平臺打造,支持Snapdragon Sound驍龍暢和無損音頻技術,在音質表現、連接速度和游戲體驗等方面都提升至全新水平,為用
    的頭像 發表于 11-08 11:27 ?1450次閱讀

    TAS5630強行復位后有時出聲音,但一會就保護了,為什么?

    1.加電后,處于保護,SD低電平,otw1 otw2 高電平 2.強行復位后有時出聲音,但一會就保護了。 請問是何問題?
    發表于 11-05 07:52

    tas5186為什么死活不出聲?

    已經按照電路圖接好了,就是不出聲,reset 一點多伏,SD OTW負幾毫伏,實在不可能,都接好了啊,大神幫我分析下,電壓GVDD12.1V,PVDD33V,死活不出聲
    發表于 11-01 08:26

    使用TAS5630DKD 保護后,再上電怎么不能恢復,為什么?

    用同一塊電路板, 1、使用TAS5630DKD 保護后,再上電怎么不能恢復(依舊保護); 2、使用 TAS5630B DKD保護后再上電可以恢復,但某些時刻不能立刻恢復,得放置一段時間(時間沒有
    發表于 10-25 07:49

    TAS5754M在電腦上Motherboard板弄不出聲,是什么原因?

    大家好,TAS5754M 在電腦上Motherboard板弄不出聲輸入是USB源是USB ,不知什么原因,附件是PurePath設置介面。 我的初始化設置是這樣的 Page0: Reg 0x25
    發表于 10-23 08:19

    使用LM49350做音頻開發,調來調去還是發不出聲音怎么辦?

    使用LM49350做音頻開發,LM49350的寄存器太多了,調來調去還是發不出聲音。 因為項目時間比較緊,想請教一下大家有什么可以參考的LM49350的寄存器配置?
    發表于 10-18 06:47

    PCM1794A I2S 16bit數據不出聲音的原因?

    PCM1794A支持I2S協議的16bit數據嗎?測試時不出聲音,切換到24bit數據就能夠正常出聲了,手冊里I2S協議給了參考波形是24bit數據的,PCM1794A是否支持向下兼容
    發表于 09-30 08:06
    主站蜘蛛池模板: 在线观看日本免费视频大片一区 | 天天色天天看 | 视频二区中文字幕 | 欧美极品另类 | 天天干天天操天天碰 | 欧美成人免费网站 | 亚州一级| 成人欧美精品久久久久影院 | 性欧美www| 真实一级一级一片免费视频 | 亚洲va老文色欧美黄大片人人 | 亚洲国产精品国产自在在线 | 国产激烈无遮挡免费床戏视频 | 国产精品久久久久影院色老大 | 欧美a色 | 国产盗摄女子私密保健视频 | 13日本xxxxxxxxx18| 欧美黄色片一级 | 涩涩涩综合在线亚洲第一 | 激情五月综合综合久久69 | 欧美系列在线播放 | 亚洲欧美日韩一区 | 久久亚洲aⅴ精品网站婷婷 久久亚洲成人 | 久久综合久久精品 | 国产精品永久免费自在线观看 | 久久综合九色综合97_ 久久久 | 免费看黄视频 | 黑色丝袜美女被视频网站 | 婷婷五月小说 | 国产一级特黄 | mide-776中文字幕在线 | 国产精品美女视频 | 男人的午夜 | 一区二区在线观看高清 | 国产乱辈通伦影片在线播放 | 五月六月婷婷 | 西西人体大胆午夜gog0 | 色视频在线观看在线播放 | 99久久综合狠狠综合久久男同 | 精品久久香蕉国产线看观看亚洲 | 黄色18网站 |