在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

研究證明:商業語音識別系統的錯誤率非常高

如意 ? 來源:雷鋒網 ? 作者:楊麗 ? 2020-10-26 16:34 ? 次閱讀

某些語音識別系統(ASR)的準確性可能要比之前假定的差很多。”這是最近約翰·霍普金斯大學、波蘭波茲南工業大學、弗羅茨瓦夫科技大學以及初創公司Avaya的研究人員一項正在進行的研究主要發現。

這項研究對內部創建的數據集上的商業語音識別模型進行了基準測試。共同作者聲稱,詞錯誤率(Word Error Rate, WER)(一種常見的語音識別性能指標)要顯著高于最佳報告結果,這可能表明自然語言處理(NLP)領域存在更多待克服的問題。

據了解,目前ASR已廣泛應用于諸多場景中,如電話會議、電子郵件、智能設備等。ASR模型的綜合基準中,標準語料庫的WER僅有2%~3%,而正是這一統計數據遭到了上述作者的質疑。他們聲稱,大多數ASR的交互場景都是在“類似于聊天機器人”的背景下進行的,說話人往往因為意識到跟他們的交互對象是聊天機器人,因此通常會將命令簡化成結構緊湊的簡短詞語,而非正常的自然對話。作者基于來自1595個供應商和1261個客戶的50個呼叫中心對話數據集對幾套ASR系統進行了評估。其通常時間長達8.5個小時,其中2.2個小時是對話。通過測試,作者發現ASR系統的錯誤率基本在15%以下,這與基準測試中的2%相悖。

研究證明:商業語音識別系統的錯誤率非常高

而基于保險、通信、預定等金融行業的語料庫中,作者發現其WER的測試結果高達23.31%。其中,預定和通信的錯誤率最高,可能是因為對話涉及特定的日期、時間、訂單金額、地點、產品和公司名稱等。但在所有領域的測試中,其錯誤率均高于13.73%。

研究人員將這一問題歸結為領域適應性問題——基準測試使用了單一性語料,例如Librispeech(1000小時英語有聲讀物錄音)、WSJ(新聞口述的談話)和Switchboard(電話交談),這些都可能太過簡單而無法真正挑戰ASR系統的可靠性。

而且,盡管他們試圖刻意模仿真實、自發的對話,但本質上還是受約束的,比如需要配音演員,就某一合適主題進行腳本/半腳本對話,而且正是由于配音演員的存在,幾乎都不需要考慮因性別、母語因素而產生的發音問題。

作為一種補救措施,研究人員建議ASR和NLP社區收集和注釋音頻數據集,使其更好地與ASR系統的實際應用場景保持一致,他們還呼吁建立更具包容性的聲學模型,更廣泛的方言語料庫,這些改變將會促進音頻信號處理的技術改進。

因此,這些問題并非無法克服。“學界和工業界應該深思熟慮,考慮可以創建高質量的測試數據集。我們認為,對ASR準確性的過于樂觀會損害NLP領域下游應用程序的開發。”研究人員最后表示。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 軟件
    +關注

    關注

    69

    文章

    5137

    瀏覽量

    89013
  • 語音識別
    +關注

    關注

    39

    文章

    1774

    瀏覽量

    114010
  • ASR
    ASR
    +關注

    關注

    2

    文章

    44

    瀏覽量

    19052
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    工地AI行為識別系統作用

    等),并即時預警,幫助工地實現從“人防”到“技防”的轉型升級。 為什么工地需要AI行為識別系統? 1、事故頻發,安全難保障 工地環境復雜,工人違規操作、防護缺失等問題頻出,傳統人工巡檢難以及時發現風險。 2、監管成本,效率低 2
    的頭像 發表于 05-08 12:00 ?173次閱讀

    景區AI行為識別系統作用

    景區AI行為識別系統作用 景區AI行為識別系統是什么? 景區AI行為識別系統是利用人工智能技術(如視頻分析、人臉識別)構建的智能管理方案。通過部署攝像頭+AI算法,實時監控游客行為,自
    的頭像 發表于 05-07 15:32 ?206次閱讀
    景區AI行為<b class='flag-5'>識別系統</b>作用

    鐵路車號自動識別系統工作原理#鐵路火車車號識別 #鐵路車號識別系統

    識別系統
    jf_60141436
    發布于 :2025年04月08日 10:05:01

    岸橋箱號識別系統的工作原理 #人工智能 #識別系統

    識別系統
    jf_60141436
    發布于 :2025年03月24日 09:28:11

    OpenAI攻克Sora視頻創建錯誤率高難題

    在人工智能與多媒體技術的交叉領域,OpenAI近期宣布了一項重要進展:成功解決了Sora視頻創建過程中錯誤率的問題。這一突破不僅標志著OpenAI在視頻處理技術上取得了顯著進步,也為廣大用戶帶來
    的頭像 發表于 12-31 10:37 ?488次閱讀

    RFID識別系統

    隨著信息技術的快速發展,RFID(射頻識別)技術在各行各業的應用日益廣泛,其中RFID識別系統作為核心應用,已經成為智能化管理不可或缺的基石。通過無線射頻信號的非接觸式識別與數據傳輸,RFID
    的頭像 發表于 12-06 17:57 ?939次閱讀
    RFID<b class='flag-5'>識別系統</b>

    多目標智能識別系統

    智慧華盛恒輝多目標智能識別系統是一種利用現代計算機視覺技術和人工智能算法,從圖像或視頻中同時識別和分類多個目標物體的系統。這種系統廣泛應用于自動駕駛、智能監控、人機交互、軍事偵察、災害
    的頭像 發表于 07-16 10:42 ?2.9w次閱讀

    基于OpenCV的人臉識別系統設計

    基于OpenCV的人臉識別系統是一個復雜但功能強大的系統,廣泛應用于安全監控、人機交互、智能家居等多個領域。下面將詳細介紹基于OpenCV的人臉識別系統的基本原理、實現步驟,并附上具體的代碼示例。
    的頭像 發表于 07-11 15:37 ?2.6w次閱讀

    車載語音識別系統語音數據采集標注案例

    車載語音識別系統是指利用機器學習算法實現的一種自然語言處理技術,載語音識別系統通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語
    的頭像 發表于 06-19 15:52 ?613次閱讀
    車載<b class='flag-5'>語音</b><b class='flag-5'>識別系統</b><b class='flag-5'>語音</b>數據采集標注案例

    車載語音識別系統語音數據采集標注案例

    車載語音識別系統是指利用機器學習算法實現的一種自然語言處理技術,載語音識別系統通過辨別聲音的語調、語速和音量,將所聽到的語音轉化成可讀取的語
    的頭像 發表于 06-19 15:49 ?828次閱讀
    主站蜘蛛池模板: 免费免播放器在线视频观看 | 五月天欧美| 亚洲第一免费视频 | 女同性进行性行为视频 | 奇米影视五月天 | 成人av在线电影 | 一级毛片一级毛片 | 全部免费特黄特色大片视频 | 狠狠干狠狠艹 | 丁香六月婷婷在线 | 亚洲三级网址 | 亚洲第一区二区快射影院 | 亚洲国产成人精彩精品 | 狠狠色96视频 | 最近2018中文字幕2019高清 | 狠狠的干狠狠的操 | 五月婷婷欧美 | 手机在线小视频 | 亚洲一区二区免费在线观看 | 亚洲一级色 | 69女poren60| 亚洲视频一区在线 | 亚洲大成色www永久网址 | 午夜欧美精品久久久久久久 | 色综合久久98天天综合 | 日本黄色片在线播放 | v天堂网| 国产精品777 | 99色在线播放 | 日本色图网站 | 97影院理论午夜论不卡 | 国产午夜精品片一区二区三区 | 欧美影欧美影院免费观看视频 | 日本黄色的视频 | 国产精品女仆装在线播放 | 黄 色美 女人 | 国产亚洲欧美一区二区 | 亚洲国产香蕉视频欧美 | 国产一区二区中文字幕 | 日本黄色电影在线 | 呦交小u女国产秘密入口 |