在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發(fā)燒友網! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網>電子百科>通信技術>基礎知識>

什么是語音識別技術

2010年03月06日 10:35 m.xsypw.cn 作者:佚名 用戶評論(0

什么是語音識別技術

語音識別技術就是讓機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹母呒夹g,也就是讓機器聽懂人類的語音。

也就是說,如果電腦配置有“語音辨識”的程序組,那么當你的聲音通過一個轉換裝置輸入電腦內部、并以數位方式儲存后,語音辨識程序便開始以你輸入的聲音樣本與事先儲存好的聲音樣本進行對比工作。聲音對比工作完成之后,電腦就會輸入一個它認為最“象”的聲音樣本序號,就可以知道你剛才念的聲音是什么意義,進而執(zhí)行此命令。說起來簡單,但要真正建立辨識率高的語音辨識程序組,卻是非常困難而專業(yè)的,世界各地的學者們也還在努力研究最好的方式。專家學者們研究出許多破解這個問題的方法,如傅立葉轉換、倒頻譜參數等,使目前的語音辨識系統(tǒng)已達到一個可接受的程度,并且辨識度愈來愈高。

計算機語音識別過程與人對語音識別處理過程基本上是一致的。目前主流的語音識別技術是基于統(tǒng)計模式識別的基本理論。一個完整的語音識別系統(tǒng)可大致分為三部分:

(1)語音特征提取:目的是從語音波形中提取隨時間變化的語音特征序列。

(2)聲學模型與模式匹配(識別算法):聲學模型是識別系統(tǒng)的底層模型,并且是語音識別系統(tǒng)中最關鍵的一部分。聲學模型通常由獲取的語音特征通過訓練產生,目的是為每個發(fā)音建立發(fā)音模板。在識別時將未知的語音特征同聲學模型(模式)進行匹配與比較,計算未知語音的特征矢量序列和每個發(fā)音模板之間的距離。聲學模型的設計和語言發(fā)音特點密切相關。聲學模型單元大小(字發(fā)音模型、半音節(jié)模型或音素模型)對語音訓練數據量大小、系統(tǒng)識別率,以及靈活性有較大影響。

(3)語義理解:計算機對識別結果進行語法、語義分析。明白語言的意義以便做出相應的反應。通常是通過語言模型來實現。


所謂“語音識別”,就是利用電子計算機等機械裝置來識別人講話的意義和內容。20世紀50代,就有人提出“口授打印機”的設恕。可以說,這是有關語音識別技術最早構想。

語音識別技術經歷了語音識別、語音合成以及自然語音合成3個階段。從原理上講,似乎讓計算機識別人的語言并不難,其實困難還是不少的。例如,不同的人讀同一個詞所發(fā)出的音在聲學特征上卻不完全相同;即便是同一個人,右不同情況下對同一個字的發(fā)音也不相同。加上人們講話時常有不合語法規(guī)律的情況,有時還夾雜些俗語,或省略一些詞語,而且語速變化不定。所有這些,在我們聽別人講話時似乎都不成為問題,但讓機器理解則很是困難。近年來,由于計算機功能的日益強大,存儲技術、語音算法技術和信號處理技術的長足進步,以及軟件編程水平的提高,語音識別技術已經取得突破性的進展,使它的廣泛應用成為可能。 

語音識別技術的應用主要有以下兩個方面。一是用于人機交流。目前這方面應用的呼聲很高,因為使用鍵盤、鼠標與電子計算機進行交流的這種方式,使許多非專業(yè)人員,特別是不懂英語或不熟悉漢語拼音的人被拒之于門外,影響到電子計算機的進一步普及。語音識別技術的采用,改變了人與計算機的互動模式,人們只需動動口,就能打開或關閉程序,改變工作界面。這種使電腦人性化的結果是使人的雙手得到解放,使每個人都能操作和應用計算機。電話仍是目前使用最為普遍的通信工具,通過電話與語音識別系統(tǒng)的協同工作,可以實現語音撥號、電話購物以及通過電話辦理銀行業(yè)務、炒股、上網檢索信息或處理電子件等。不久,能按主人口令接通電話、打開收音機,以及通過聲紋識別來者身份的安全系統(tǒng)也將獲得應用。

語音識別技術的另一方面應用便是語音輸入和合成語音輸出。現在,已經出現能將口述的文稿輸入計算機并按指定格式編排的語音軟件,它比通過鍵盤輸入在速度上要提高2~4倍。裝有語音軟件的電腦還能通過語音合成把計算機里的文件用各種語言“讀”出來,這將大大推進遠程通信和網絡電話的發(fā)展。

在現階段,語音技術主要用于電子商務、客戶服務和教育培訓等領域,它對于節(jié)省人力、時間,提高工作效率將起到明顯的作用。能實現自動翻譯的語音識別系統(tǒng)目前也正在研究、完善之中。

語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來 10 年內,語音識別技術將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產品等各個領域。

計算機語音識別過程與人對語音識別處理過程基本上是一致的。目前主流的語音識別技術是基于統(tǒng)計模式識別的基本理論。一個完整的語音識別系統(tǒng)可大致分為三部分:

1、 語音特征提取:其目的是從語音波形中提取出隨時間變化的語音特征序列。

2、 聲學模型與模式匹配(識別算法):聲學模型通常將獲取的語音特征通過學習算法產生。在識別時將輸入的語音特征同聲學模型(模式)進行匹配與比較,得到最佳的識別結果。

3、語言模型與語言處理:語言模型包括由識別語音命令構成的語法網絡或由統(tǒng)計方法構成的語言模型,語言處理可以進行語法、語義分析。對小詞表語音識別系統(tǒng),往往不需要語言處理部分.

?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

( 發(fā)表人:admin )

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關規(guī)定!

      ?
      主站蜘蛛池模板: 国产三级在线观看视频 | 天堂网www最新版在线资源 | 一区二区免费在线观看 | 夜夜嗷| 国产在线一卡 | 性视频网址 | 亚洲国产成人va在线观看 | 黄色国产 | 涩涩高清无乱码在线观看 | 欧美巨波霸乳影院67194 | 日本久久久 | av2021天堂网手机版 | 女性私密部位扒开的视频 | 国产亚洲3p一区二区三区 | 久久夜色精品国产亚洲噜噜 | 拍拍拍美女黄色1000视频 | 午夜看一级特黄a大片黑 | 欧美视频亚洲色图 | 四虎国产精品成人永久免费影视 | 欧美另类丰满69xxxxx | 99热这里只有精品一区二区三区 | 额去鲁97在线观看视频 | 国产精品亚洲精品日韩动图 | 又大又粗进出白浆直流动态图 | 天天摸夜夜爽 | 国产色婷婷精品综合在线手机播放 | 欧美黑人性受xxxx喷水 | 五月婷婷婷婷 | 四虎最新紧急入口 | aaa在线观看 | 三级在线观看免播放网站 | 一级特黄aa大片免费播放视频 | 欧美福利二区 | 拍拍拍成人免费高清视频 | 高清不卡毛片免费观看 | 亚洲欧美v视色一区二区 | 人人草人人干 | 在线黄色大片 | 天堂资源在线观看 | 天堂在线精品 | 亚洲宅男天堂a在线 |