語音識別技術原理
語音識別系統提示客戶在新的場合使用新的口令密碼,這樣使用者不需要記住固定的口令,系統也不會被錄音欺騙。文本相關的聲音識別方法可以分為動態時間伸縮或隱馬爾可夫模型方法。文本無關聲音識別已經被研究很長時間了,不一致環境造成的性能下降是應用中的一個很大的障礙。
其工作原理:
動態時間伸縮方法使用瞬間的、變動倒頻。1963年Bogertetal出版了《回聲的時序倒頻分析》。通過交換字母順序,他們用一個含義廣泛的詞匯定義了一個新的信號處理技術,倒頻譜的計算通常使用快速傅立葉變換。
從1975年起,隱馬爾可夫模型變得很流行。運用隱馬爾可夫模型的方法,頻譜特征的統計變差得以測量。文本無關語音識別方法的例子有平均頻譜法、矢量量化法和多變量自回歸法。
平均頻譜法使用有利的倒頻距離,語音頻譜中的音位影響被平均頻譜去除。使用矢量量化法,語者的一套短期訓練的特征向量可以直接用來描繪語者的本質特征。但是,當訓練向量的數量很大時,這種直接的描繪是不切實際的,因為存儲和計算的量變得離奇的大。所以嘗試用矢量量化法去尋找有效的方法來壓縮訓練數據。Montacieetal在倒頻向量的時序中應用多變量自回歸模式來確定語者特征,取得了很好的效果。
想騙過語音識別系統要有高質量的錄音機,那不是很容易買到的。一般的錄音機不能記錄聲音的完整頻譜,錄音系統的質量損失也必須是非常低的。對于大多數的語音識別系統,模仿的聲音都不會成功。用語音識別來辨認身份是非常復雜的,所以語音識別系統會結合個人身份號碼識別或芯片卡。
語音識別系統得益于廉價的硬件設備,大多數的計算機都有聲卡和麥克風,也很容易使用。但語音識別還是有一些缺點的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由于傷風、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統比指紋識別系統有著較高的誤識率,因為人們的聲音不像指紋那樣獨特和唯一。對快速傅立葉變換計算來說,系統需要協同處理器和比指紋系統更多的效能。目前語音識別系統不適合移動應用或以電池為電源的系統。
更多精彩閱讀:
語音識別的兩個方法_語音識別的應用有哪些
語音識別的優缺點_語音識別功能介紹
語音識別算法有哪些_語音識別特征提取方法
怎么實現語音識別_手機語音識別怎么設置
語音識別設置能刪除嗎_語音識別系統工作流程
-
語音識別技術
+關注
關注
0文章
55瀏覽量
12877
發布評論請先 登錄
相關推薦
基于語音識別的智能會議系統具備哪些交互功能
語音識別技術的應用與發展
ASR語音識別技術應用
基于Arm Neoverse N2實現自動語音識別技術
![基于Arm Neoverse N2實現自動<b class='flag-5'>語音</b><b class='flag-5'>識別</b><b class='flag-5'>技術</b>](https://file1.elecfans.com/web1/M00/F5/23/wKgaoWc2wzyAQ6BVAAARC1Ay5Ak930.jpg)
評論