在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音識(shí)別的技術(shù)原理是什么?

九芯電子語(yǔ)音芯片 ? 2022-05-10 16:40 ? 次閱讀

自動(dòng)語(yǔ)音辨認(rèn)技術(shù)(ASR,Automatic Speech Recognition)是一種經(jīng)過(guò)讓機(jī)器經(jīng)過(guò)辨認(rèn)和了解的過(guò)程,把人類(lèi)的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)文本的技術(shù)。我們先來(lái)看看語(yǔ)音辨認(rèn)的歷史,其實(shí)早在計(jì)算機(jī)創(chuàng)造之前,有關(guān)ASR技術(shù)的理念就曾經(jīng)降生了,而早期的聲碼器就能夠被視為是語(yǔ)音辨認(rèn)及合成的雛形。而1920年代消費(fèi)的"Radio Rex"玩具狗,可能是早的語(yǔ)音辨認(rèn)器,當(dāng)這只狗的名字被召喚的時(shí)分,它可以從底座上彈出來(lái)。這么看來(lái)論輩分它是阿爾法狗的爺爺……但毫無(wú)疑問(wèn)60年代計(jì)算機(jī)的開(kāi)展推進(jìn)了語(yǔ)音辨認(rèn)技術(shù)技術(shù),這其中重要的一個(gè)里程碑就是動(dòng)態(tài)規(guī)劃技術(shù)(DP)和線性預(yù)測(cè)剖析技術(shù)(LP),后者又開(kāi)展出了更成熟的動(dòng)態(tài)時(shí)間歸正技術(shù)(DTW),包括矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。但這些還都只是單調(diào)又晦澀的算法,換句話說(shuō),工程師看到這些玩意也一頭霧水,基本沒(méi)方法疾速在應(yīng)用到理論里。所以在80年代時(shí),著名的AT&T Bell實(shí)驗(yàn)室經(jīng)過(guò)努力,把本來(lái)深?yuàn)W無(wú)比的HMM純數(shù)學(xué)模型工程化,為應(yīng)用開(kāi)發(fā)打下了重要的基石。到90年代時(shí),深度神經(jīng)網(wǎng)絡(luò)技術(shù)的打破性開(kāi)展,終于把語(yǔ)音辨認(rèn)技術(shù)本來(lái)的難關(guān)攻破了。所以在我們會(huì)發(fā)現(xiàn),從21世紀(jì)后語(yǔ)音辨認(rèn)技術(shù)的開(kāi)展就疾速加快了。其實(shí)看起來(lái)高大上的語(yǔ)音辨認(rèn)技術(shù),原理并沒(méi)有多么復(fù)雜。不管是微軟家的Cortana、三星家的S-voice蘋(píng)果家的Siri,還是國(guó)內(nèi)一些獨(dú)立做語(yǔ)音辨認(rèn)的比方訊飛、Rokid,在原理在實(shí)質(zhì)上沒(méi)有幾差別:就是語(yǔ)音輸入后,停止特征提取,將提取的特征值放進(jìn)模型庫(kù)里,再不時(shí)地停止鍛煉和匹配,終解碼得到結(jié)果。

假如要細(xì)說(shuō)的話就比擬復(fù)雜了,比方模型庫(kù)中又分為聲學(xué)模型和言語(yǔ)模型。其中言語(yǔ)模型是依據(jù)不同品種的言語(yǔ),對(duì)詞串停止統(tǒng)計(jì)建模,目前普遍采用的是基于(n-1)階馬爾可夫鏈統(tǒng)計(jì)的n元語(yǔ)法模型。這里細(xì)致說(shuō)下聲學(xué)建模吧。首先經(jīng)過(guò)前端特征提取取得聲學(xué)特征,再進(jìn)一步對(duì)聲學(xué)特征停止統(tǒng)計(jì)建模。建模運(yùn)用到的貝葉斯統(tǒng)計(jì)建模框架,也就是大后驗(yàn)概率決策原則。這里算法這種深?yuàn)W的東西就不說(shuō)了,除非深度開(kāi)發(fā),否則直接套用就行了,我本人也是博古通今,還是念書(shū)的時(shí)分學(xué)的。說(shuō)說(shuō)提取聲學(xué)特征該如何完成:當(dāng)語(yǔ)音輸入之后,首先停止模電轉(zhuǎn)換,將模仿信號(hào)轉(zhuǎn)變?yōu)?a target="_blank">數(shù)字信號(hào),再停止靜音切除去掉無(wú)關(guān)噪音,然后停止分幀。將此時(shí)的信號(hào)分紅一幀一幀之后(每一幀并不是獨(dú)立存在的而是相互關(guān)聯(lián)的),還要停止一系列的信號(hào)處置,包括預(yù)加重、加窗之后,再停止FFT變換之后,再經(jīng)過(guò)Mel參數(shù)的濾波和取對(duì)數(shù)、離散余弦變換等一系列算法處置后,能夠停止用梅爾頻率倒譜系數(shù)(MFCC)停止特征提取,得到聲學(xué)特征。覺(jué)得越說(shuō)越復(fù)雜了……后面簡(jiǎn)單點(diǎn)說(shuō)吧。前面說(shuō)了言語(yǔ)模型,而聲學(xué)模型就是將聲學(xué)特征統(tǒng)計(jì)建模后得到的。得到了模型庫(kù)之后就能夠停止模型鍛煉和形式匹配了。所謂模型鍛煉就是指依照一定的原則,從大量已知語(yǔ)音形式中獲取一個(gè)具特征的模型參數(shù)。而形式匹配則相反,是依據(jù)一定原則,將未知語(yǔ)音形式與模型庫(kù)中的某一個(gè)模型取得佳匹配后的解碼過(guò)程又能夠分紅動(dòng)態(tài)解碼網(wǎng)絡(luò)和靜態(tài)解碼網(wǎng)絡(luò)兩種:動(dòng)態(tài)網(wǎng)絡(luò)會(huì)編譯一個(gè)狀態(tài)網(wǎng)絡(luò)并構(gòu)成搜索空間,把單詞轉(zhuǎn)換成一個(gè)個(gè)的音素后將其依照語(yǔ)序拆分紅狀態(tài)序列,再依據(jù)音素上下文分歧性準(zhǔn)繩將狀態(tài)序列停止銜接。而靜態(tài)網(wǎng)絡(luò)普通是針對(duì)一些特殊詞(孤立詞)的辨認(rèn)網(wǎng)絡(luò),它的構(gòu)造就簡(jiǎn)單多了:先將每條特殊詞擴(kuò)展成HMM狀態(tài)序列,然后再計(jì)算得分,選擇得分大的作為辨認(rèn)輸出結(jié)果。由于靜態(tài)網(wǎng)絡(luò)是依據(jù)聲學(xué)概率計(jì)算權(quán)重,不需求查詢言語(yǔ)模型概率,因而解碼速度很快。 這樣的一個(gè)流程大致上就是語(yǔ)音辨認(rèn)技術(shù)的主要原理。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    語(yǔ)音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用實(shí)例

    語(yǔ)音識(shí)別技術(shù)也被稱為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR),是通過(guò)計(jì)算機(jī)對(duì)
    的頭像 發(fā)表于 02-21 17:12 ?535次閱讀

    詳解語(yǔ)音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語(yǔ)音識(shí)別技術(shù)也被稱為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR),是通過(guò)計(jì)算機(jī)對(duì)
    的頭像 發(fā)表于 02-21 17:05 ?649次閱讀
    詳解<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>在通信領(lǐng)域中的應(yīng)用

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

    語(yǔ)音命令Q 識(shí)別,適用于智能家居控制、玩具、人機(jī)交互等多個(gè)領(lǐng)域。該模塊以其高識(shí)別率、低功耗和易于集成的特點(diǎn)受到廣大開(kāi)發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、
    發(fā)表于 01-02 18:15

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專(zhuān)注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將語(yǔ)音
    的頭像 發(fā)表于 12-20 10:35 ?494次閱讀

    語(yǔ)音識(shí)別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    語(yǔ)音識(shí)別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)越來(lái)越廣泛,為醫(yī)療服務(wù)帶來(lái)了諸多便利和效率提升。以下是對(duì)語(yǔ)音識(shí)別技術(shù)
    的頭像 發(fā)表于 11-26 09:35 ?945次閱讀

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    在人工智能的快速發(fā)展中,語(yǔ)音識(shí)別和自然語(yǔ)言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語(yǔ)音識(shí)別技術(shù)使
    的頭像 發(fā)表于 11-26 09:21 ?1182次閱讀

    語(yǔ)音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語(yǔ)音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來(lái),隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。
    的頭像 發(fā)表于 11-26 09:20 ?1438次閱讀

    基于語(yǔ)音識(shí)別技術(shù)的智能家居控制系統(tǒng)

    語(yǔ)音識(shí)別的智能控制系統(tǒng)是智能家居的重要組成部分,相比傳統(tǒng)的遙控或觸控方式,基于語(yǔ)音識(shí)別控制的智能家居系統(tǒng)通過(guò)人機(jī)語(yǔ)音交互的方式,實(shí)現(xiàn)對(duì)家居
    的頭像 發(fā)表于 11-19 17:25 ?1066次閱讀
    基于<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>的智能家居控制系統(tǒng)

    ASR與傳統(tǒng)語(yǔ)音識(shí)別的區(qū)別

    識(shí)別技術(shù)。 構(gòu)建更深更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,利用大量數(shù)據(jù)進(jìn)行訓(xùn)練。 提高了語(yǔ)音識(shí)別的準(zhǔn)確率和穩(wěn)定性。 傳統(tǒng)語(yǔ)音
    的頭像 發(fā)表于 11-18 15:22 ?1141次閱讀

    ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語(yǔ)音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類(lèi)語(yǔ)音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個(gè)領(lǐng)域。
    的頭像 發(fā)表于 11-18 15:12 ?1788次閱讀

    什么是離線語(yǔ)音識(shí)別芯片?與在線語(yǔ)音識(shí)別的區(qū)別

    離線語(yǔ)音識(shí)別芯片適用于智能家電等,特點(diǎn)為小詞匯量、低成本、安全性高、響應(yīng)快,無(wú)需聯(lián)網(wǎng)。在線語(yǔ)音識(shí)別功能更廣泛、識(shí)別準(zhǔn)確率高,但依賴穩(wěn)定網(wǎng)絡(luò)。
    的頭像 發(fā)表于 07-22 11:33 ?780次閱讀

    語(yǔ)音識(shí)別和自然語(yǔ)言處理的區(qū)別和聯(lián)系

    Recognition) 1. 定義 語(yǔ)音識(shí)別,又稱為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition, ASR),是指將人類(lèi)的
    的頭像 發(fā)表于 07-05 10:09 ?2647次閱讀

    如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)

    人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門(mén)禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉識(shí)別的關(guān)鍵
    的頭像 發(fā)表于 07-04 09:20 ?994次閱讀

    人臉檢測(cè)與識(shí)別的方法有哪些

    人臉檢測(cè)與識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一個(gè)重要研究方向,具有廣泛的應(yīng)用前景,如安全監(jiān)控、身份認(rèn)證、智能視頻分析等。本文將詳細(xì)介紹人臉檢測(cè)與識(shí)別的方法。 引言 人臉檢測(cè)與識(shí)別技術(shù)在現(xiàn)代社會(huì)中
    的頭像 發(fā)表于 07-03 14:45 ?1135次閱讀

    人工智能的語(yǔ)音識(shí)別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語(yǔ)音識(shí)別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用前景,引起了社會(huì)各界的廣泛關(guān)注。本文將詳細(xì)介
    的頭像 發(fā)表于 07-01 11:39 ?2308次閱讀
    主站蜘蛛池模板: 韩国三级视频 | 久久久久国产成人精品亚洲午夜 | 亚洲毛片网 | 欧美成年网站 | 偷偷狠狠的日日2020 | 亚洲国产日韩欧美在线as乱码 | 国产精品任我爽爆在线播放6080 | 手机福利在线观看 | 手机在线看片国产 | 特黄特级高清免费视频毛片 | 欧洲另类一二三四区 | 扒开双腿爽爽爽视频www | a理论片| 中文字幕在线二区 | 黄色在线视频免费 | 午夜特片网 | jzzjlzz亚洲乱熟在线播放 | 快乐你懂的在线视频免费观看 | 天天摸天天碰成人免费视频 | 欧美美女被日 | 中文字幕网资源站永久资源 | www.av免费| 韩国黄色三级视频 | 永久免费看mv网站入口 | 亚洲第九页 | 特黄特色三级在线观看 | 国产高清片 | 天天做天天爱天天影视综合 | 一级片特黄 | 欧美操穴视频 | 色婷婷综合在线视频最新 | 天天摸天天碰成人免费视频 | 二区久久国产乱子伦免费精品 | 中文字幕精品一区二区2021年 | 成人亚洲电影 | 美女国产精品 | 免费啪视频在线观看免费的 | 午夜寂寞视频在线观看 | 四虎电影院 | 三级视频网站在线观看 | 美女视频网站色 |