資料介紹
針對聲韻母相同但聲調(diào)不同的近音字識別問題和聲韻母及聲調(diào)都相同的同音字識別問題,提出在語音模型和語言模型中分別引入聲調(diào)和字轉(zhuǎn)移概率,以提高近音字和同音字的識別率。首先將聲調(diào)劃分為 5 種表現(xiàn)形式添加到漢語音節(jié)的最后一個音素中構(gòu)成新音素,使用高斯混合隱馬爾科夫模型建模新音素。然后通過統(tǒng)計方法計算特定語境下的字間轉(zhuǎn)移概率。最后使用 HTK 工具包實現(xiàn)了帶聲調(diào)的語音模型和有字轉(zhuǎn)移概率的語言模型。實驗結(jié)果證明添加聲調(diào)可以提高近音字的識別率,使用特定語境下字間轉(zhuǎn)移概率可以提高同音字的識別率。
語言是人類溝通的重要工具,語音識別是人工智能研究的重要領(lǐng)域。20 世紀(jì) 50 年代,貝爾實驗室設(shè)計了第一個語音識別系統(tǒng),實現(xiàn)了對孤立數(shù)字的語音識別[1]。20 世紀(jì) 60 年代,提出了時間歸一化打分機制、音素動態(tài)跟蹤技術(shù)和動態(tài)規(guī)劃算法,有效地解決了語音信號的特征提取和不等長語音匹配問題[2]。20 世紀(jì) 70 年代,模式識別思想、線性預(yù)測編碼等技術(shù)被應(yīng)用于語音識別中,識別對象從孤立詞轉(zhuǎn)移到連續(xù)語音[3]。20 世紀(jì) 90 年代及以后,隱馬爾科夫模型(hidden markov modol, HMM)、高 斯 混 合 模 型(gaussian mixed model, GMM)被提出[4],基于 GMM-HMM 的語音識別框架得到廣泛使用和研究,文獻(xiàn)[5]通過改進(jìn)語音特征參數(shù)相鄰幀的相關(guān)性,進(jìn)一步提高 GMM-HMM 的準(zhǔn)確度;文獻(xiàn)[6-7]使用 GMM-HMM 識別了連續(xù)語音的聲調(diào)。目前,深度學(xué)習(xí)技術(shù)也被應(yīng)用于語音處理系統(tǒng)[8-11],由于它對訓(xùn)練數(shù)據(jù)和硬件資源有著極高的要求,限制了其使用范圍?,F(xiàn)代漢語是一種有聲調(diào)的特殊語音,音素和聲調(diào)組合可以構(gòu)成無數(shù)個多音字和同音字的發(fā)音。一方面,同一個漢字在不同的聲調(diào)下代表不同的意義,另一方面,相同的讀音可能代表完全不同的漢字,因此,與印歐語系的語言相比,聲調(diào)和上下文信息對漢語語音的識別具有更重要的作用[12]。本文在語音模型中添加聲調(diào),并使用字轉(zhuǎn)移概率捕獲上下文信息,修改 HTK[13]工具包以適應(yīng)漢語語音識別問題,實驗結(jié)果證明了聲調(diào)對近音字識別的重要性,同時字轉(zhuǎn)移概率的引入能有效提高同音字識別的準(zhǔn)確率。
- 基于HMM的文本域數(shù)學(xué)表達(dá)式提取研究 0次下載
- 如何使用深度學(xué)習(xí)實現(xiàn)語音聲學(xué)模型的研究 41次下載
- 如何設(shè)計一個有限狀態(tài)轉(zhuǎn)換器的端到端中文語音識別系統(tǒng) 5次下載
- 如何進(jìn)行馬來語語音合成系統(tǒng)的設(shè)計與實現(xiàn)概述 4次下載
- 如何使用MATLAB進(jìn)行語音識別算法研究的論文資料免費下載 44次下載
- 綜合語音通信平臺的研究與實現(xiàn) 9次下載
- 基于HMM和小波神經(jīng)網(wǎng)絡(luò)混合模型的Web信息抽取_李少天 0次下載
- 基于語音特征聚類的HMM語音識別系統(tǒng)研究姚敏鋒 2次下載
- 隱馬爾可夫模型(HMM)攻略(有具體例子-方便理解) 0次下載
- 對逆合成孔徑雷達(dá)噪聲調(diào)頻預(yù)加重干擾的研究
- 噪聲調(diào)相干擾信號的性能仿真 28次下載
- 基于HMM模型的滾動軸承故障分析
- HMM及其在語音信號處理中的應(yīng)用
- 基于RS的BP-HMM在網(wǎng)絡(luò)入侵檢測中的應(yīng)用
- 基于VQ和HMM的語音識別系統(tǒng)的性能比較
- Transformer模型在語音識別和語音生成中的應(yīng)用優(yōu)勢 1236次閱讀
- 離線語音控制技術(shù)特點 533次閱讀
- 重塑翻譯與識別技術(shù):開源語音識別模型Whisper的編譯優(yōu)化與部署 3759次閱讀
- 基于樹莓派的電話錄音系統(tǒng)研究 899次閱讀
- 語音識別的基本概述、原理及應(yīng)用發(fā)展 9132次閱讀
- 基于AMBE-2000TM編碼器實現(xiàn)加密語音通信系統(tǒng)的設(shè)計 4090次閱讀
- 超低噪聲調(diào)節(jié)器在寬帶通信系統(tǒng)中的應(yīng)用研究 2021次閱讀
- 基于Tacotron實現(xiàn)StoryTime模型 3001次閱讀
- 基于隱馬爾可夫模型( HMM )開發(fā)了一個駕駛行為預(yù)測模型 9724次閱讀
- 利用語音識別技術(shù)和嵌入式系統(tǒng)交叉研究是語音識別的一個重要研究方向 1525次閱讀
- 互聯(lián)網(wǎng)的大腦模型與原子的太陽系模型的研究對比 5008次閱讀
- 語音識別技術(shù)必定會滲透在人們生活的每個角落 8072次閱讀
- 對于谷歌應(yīng)用傳統(tǒng)的自動語音識別(ASR)系統(tǒng)的解析 8825次閱讀
- 一種基于DSP的漢字語音識別系統(tǒng)設(shè)計 3366次閱讀
- GMM-HMM語音識別原理詳解 1.9w次閱讀
下載排行
本周
- 1TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 2開關(guān)電源基礎(chǔ)知識
- 5.73 MB | 11次下載 | 免費
- 3100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 4嵌入式linux-聊天程序設(shè)計
- 0.60 MB | 3次下載 | 免費
- 5DIY動手組裝LED電子顯示屏
- 0.98 MB | 3次下載 | 免費
- 651單片機大棚環(huán)境控制器仿真程序
- 1.10 MB | 2次下載 | 免費
- 751單片機PM2.5檢測系統(tǒng)程序
- 0.83 MB | 2次下載 | 免費
- 8TP4055-500mA線性鋰離子電池充電器數(shù)據(jù)手冊
- 0.27 MB | 2次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設(shè)計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設(shè)計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537797次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191186次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多