在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

行動端及云端的語音辨識的成長推動嵌入式語音技術(shù)

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Todd Mozer ? 2022-10-26 15:17 ? 次閱讀

如今,語音技術(shù)領(lǐng)域的許多最大參與者也是手機(jī)操作系統(tǒng)(OS)市場的重量級人物。微軟是第一個建立語音團(tuán)隊(duì)的軟件/移動操作系統(tǒng)巨頭。在1990年代早期,比爾·蓋茨(Bill Gates)宣揚(yáng)語音用戶界面(VUI)的好處,并預(yù)測它們將在計算機(jī)上的人類界面中發(fā)揮作用。谷歌在21世紀(jì)初通過建立一支由語音技術(shù)專家組成的精英團(tuán)隊(duì)而變得咄咄逼人,并通過其Android版本刺激了移動行業(yè)向語音界面和語音控制的方向發(fā)展。蘋果一直是用戶體驗(yàn)之王,直到最近,由于準(zhǔn)確性方面的挑戰(zhàn),蘋果才避免推動語音技術(shù)。然而,隨著Siri(一種語音禮賓服務(wù))的收購以及該公司的技術(shù)融入iPhone 4S,蘋果可能會通過語音迎來新一代的自然語言用戶體驗(yàn)。

由于各種原因,語音技術(shù)對移動行業(yè)至關(guān)重要,主要是因?yàn)樗却蜃指菀渍f話,而且因?yàn)槭謾C(jī)的外形尺寸是圍繞說話而不是打字而構(gòu)建的。此外,隨著移動搜索的巨大收入潛力,移動操作系統(tǒng)提供商看到了在其技術(shù)組合中添加語音識別的價值。

為什么要嵌入?

VUI 的大部分繁重工作都是在云中完成的。這就是大型操作系統(tǒng)參與者的大部分投資去向的地方。云提供了一個具有幾乎無限的MIPS和內(nèi)存的環(huán)境 - 這是高級語音搜索處理的兩個基本要素。隨著基于云的語音技術(shù)使用的增長,嵌入式領(lǐng)域似乎也出現(xiàn)了類似的趨勢。

嵌入式語音是在無法訪問云時啟用語音控制和輸入的唯一解決方案,這是增加用戶體驗(yàn)的必要功能。嵌入式語音還具有消耗更少M(fèi)IPS和內(nèi)存的能力,從而提高了設(shè)備電池電量的效率。

客戶端/云語音使用的最佳方案需要在客戶端上激活語音,并在云上繁重地破譯文本和含義。這可以實(shí)現(xiàn)設(shè)備始終打開并始終偵聽的方案,因此可以給出并執(zhí)行語音命令,而無需按客戶端上的按鈕。這種“無需手或眼睛”的范例在汽車中特別有用,出于安全目的和在家中的便利性。

例如,在最近推出的Galaxy SII Android手機(jī)中,三星的語音通話利用Sension的TrueHandsfree語音控制(一種嵌入式語音技術(shù))來激活帶有“嘿銀河”字樣的手機(jī)。這個短語調(diào)用了Vlingo基于云的識別服務(wù),該服務(wù)允許用戶在不觸摸手機(jī)的情況下發(fā)出命令和輸入文本。

語音識別可以在具有低至10 MIPS和數(shù)萬字節(jié)內(nèi)存的設(shè)備上實(shí)現(xiàn)。Sensory的語音芯片系列包括基于8位微控制器RISC單芯片和利用小型嵌入式DSP的自然語言處理器。通常,在語音識別中投入的MIPS和內(nèi)存越多,產(chǎn)品可以具有的功能就越多(更快的響應(yīng)時間,更大的詞匯量和更復(fù)雜的語法)。

無論哪個平臺執(zhí)行任務(wù),語音識別的一般方法都是相似的。多年來,隱馬爾可夫建模和神經(jīng)網(wǎng)絡(luò)等統(tǒng)計方法一直是語音識別的主要方法。從客戶端遷移到云允許部署統(tǒng)計語言建模和更復(fù)雜的技術(shù)。

維伊關(guān)卡

要創(chuàng)建真正免提、免眼的用戶體驗(yàn),必須解決幾個技術(shù)階段。

第 1 階段:語音激活

這實(shí)質(zhì)上是取代按鈕按下。識別器需要始終處于打開狀態(tài),準(zhǔn)備好將階段 2 調(diào)用到運(yùn)行狀態(tài),并且能夠在非常嘈雜的情況下激活。第一階段的另一個關(guān)鍵標(biāo)準(zhǔn)是非常快的響應(yīng)時間。鑒于超過幾百毫秒的延遲可能會產(chǎn)生由用戶在識別器偵聽之前與階段 2 交談而導(dǎo)致的準(zhǔn)確性問題,因此語音激活的響應(yīng)時間必須與按鈕的響應(yīng)時間相同,這幾乎是瞬時的。簡單的命令和控制功能可以通過 Stage 1 識別系統(tǒng)或更復(fù)雜的 Stage 2 系統(tǒng)嵌入到客戶端中,該系統(tǒng)可以嵌入或基于云的。

第 2 階段:語音識別和轉(zhuǎn)錄

更耗電且功能更強(qiáng)大的 Stage 2 識別器可將所講的內(nèi)容轉(zhuǎn)換為文本。如果目的是短信或語音撥號,則該過程可以在此處停止。如果用戶希望回答問題或訪問數(shù)據(jù),系統(tǒng)將進(jìn)入第 3 階段。由于 Stage 1 識別器可以響應(yīng)高噪聲,因此它可以降低汽車收音機(jī)或家用 AV 中的音量,以協(xié)助階段 2 識別。

第 3 階段:意圖和意義

這可能是這一過程中最大的挑戰(zhàn)。文本翻譯準(zhǔn)確,但它是什么意思?例如,互聯(lián)網(wǎng)搜索所需的查詢是什么?今天的“智能”可能會嘗試修改搜索,以更好地滿足用戶的需求。然而,計算機(jī)在弄清楚意圖方面非常糟糕。蘋果的Siri智能助手是在國防部資助的CALO項(xiàng)目下開發(fā)的,該項(xiàng)目涉及300多名研究人員,可能是當(dāng)今智能詮釋的最佳典范。

第 4 階段:數(shù)據(jù)搜索和查詢

根據(jù)查詢的不同,搜索數(shù)據(jù)并找到正確的結(jié)果可能很簡單,也可能很復(fù)雜。映射數(shù)據(jù)和方向可能是可靠的,因?yàn)檎Z法很容易理解,并具有地圖搜索的明確目標(biāo)。隨著谷歌和其他搜索提供商在數(shù)據(jù)搜索功能上投入大量資金和時間,這一階段將繼續(xù)改善。

第 5 階段:語音響應(yīng)

對查詢的語音響應(yīng)是顯示響應(yīng)的一個很好的替代方法,這可能會導(dǎo)致駕駛員將視線從道路上移開或給家中帶來不便。當(dāng)今最先進(jìn)的文本到語音轉(zhuǎn)換系統(tǒng)具有高度的可理解性,并且已經(jīng)發(fā)展到比以前的自動語音系統(tǒng)聽起來更自然。

為什么嵌入式識別器在第 1 階段替換按鈕需要這么長時間?

語音識別傳統(tǒng)上需要按鈕激活而不是語音激活。其主要原因是按鈕雖然分散了注意力,但即使在嘈雜的環(huán)境中也是可靠且響應(yīng)迅速的。這些類型的環(huán)境(如汽車或繁忙的家庭)對語音識別器來說可能具有挑戰(zhàn)性。聲控詞必須在汽車(車窗關(guān)閉、收音機(jī)打開和道路噪音)或家中(嬰兒哭泣、音樂或電視打開以及電器運(yùn)行)中創(chuàng)建響應(yīng),而無需用戶為其工作。因此,直到最近,只有當(dāng)用戶處于安靜的環(huán)境中,麥克風(fēng)靠近嘴巴時,語音技術(shù)才是可靠的。

快速響應(yīng)時間的要求使這一挑戰(zhàn)進(jìn)一步復(fù)雜化。語音識別器通常需要數(shù)百毫秒才能確定用戶在開始處理語音之前是否完成了通話。這種時間延遲可能是可以接受的,從識別系統(tǒng)產(chǎn)生答案或回復(fù)給消費(fèi)者。但是,在第 1 階段,激活的響應(yīng)是在階段 2 中調(diào)用另一個更復(fù)雜的識別器,并且使用者不會接受持續(xù)時間遠(yuǎn)遠(yuǎn)超過按下按鈕所花費(fèi)的時間的延遲。延遲時間越長,階段 2 發(fā)生識別失敗的可能性就越大,因?yàn)橛脩艨赡軙陔A段 2 識別器準(zhǔn)備好收聽之前開始說話。

嵌入式語音技術(shù)的最新進(jìn)展,如Sensory的真無握語音接口,無需觸摸設(shè)備即可提供真正的VUI。這些技術(shù)消除了嘈雜環(huán)境中固有的問題以及較長的響應(yīng)時間,使語音激活可行,準(zhǔn)確且更方便。

消費(fèi)電子產(chǎn)品中語音的未來

許多年前,電視觀眾不得不站起來走到他們的單位來改變頻道。遙控器的到來結(jié)束了這一切,今天沒有人會買沒有遙控器的電視。盡管如此,我們?nèi)匀徽酒饋恚叩轿覀兊拇蠖鄶?shù)計算設(shè)備使用它們。隨著語音識別的改進(jìn),這將不再是必需的。

帶有語音觸發(fā)器的免提設(shè)備的快速使用將發(fā)展成為智能設(shè)備,這些設(shè)備可以傾聽我們所說的內(nèi)容,并決定何時適合從客戶端轉(zhuǎn)到云端。他們還將決定何時以及如何回應(yīng),可能會演變成坐在后臺傾聽一切并決定何時提供幫助的助手。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5094

    文章

    19183

    瀏覽量

    307817
  • Android
    +關(guān)注

    關(guān)注

    12

    文章

    3945

    瀏覽量

    127974
  • 計算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7545

    瀏覽量

    88672
收藏 人收藏

    評論

    相關(guān)推薦

    【「嵌入式系統(tǒng)設(shè)計與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語音識別的智能杯墊

    語音命令Q 識別,適用于智能家居控制、玩具、人機(jī)交互等多個領(lǐng)域。該模塊以其高識別率、低功耗和易于集成的特點(diǎn)受到廣大開發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、語音識別、IPS顯示屏
    發(fā)表于 01-02 18:15

    階躍星辰發(fā)布國內(nèi)首個千億參數(shù)語音大模型

    近日,階躍星辰在官方公眾號上宣布了一項(xiàng)重大突破——推出Step-1o千億參數(shù)語音大模型。該模型被譽(yù)為“國內(nèi)首個千億參數(shù)
    的頭像 發(fā)表于 12-17 13:43 ?310次閱讀

    新手怎么學(xué)嵌入式?

    新手怎么學(xué)嵌入式? 在科技飛速發(fā)展的今天,嵌入式技術(shù)已經(jīng)滲透到我們生活的各個角落,從智能手機(jī)到智能家居,從汽車電子到醫(yī)療設(shè)備。對于新手而言,嵌入式
    發(fā)表于 12-12 10:51

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音
    的頭像 發(fā)表于 11-26 09:20 ?757次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?1048次閱讀

    什么是嵌入式?一文讀懂嵌入式主板

    在現(xiàn)代科技浪潮中,嵌入式技術(shù)已成為支撐各種智能設(shè)備和系統(tǒng)運(yùn)行的核心力量。那么,究竟什么是嵌入式嵌入式系統(tǒng),顧名思義,是將計算機(jī)的硬件和軟件嵌入
    的頭像 發(fā)表于 10-16 10:14 ?1609次閱讀

    語音解決方案的Renesas RA8M1語音套件

    應(yīng)用對語音識別技術(shù)的需求。Renesas Electronics RA8M1套件設(shè)有基于RA系列32位MCU的易于使用的語音用戶界面(VUI)。該解決方案支持本地端點(diǎn)語音識別,無需網(wǎng)絡(luò)
    的頭像 發(fā)表于 09-27 16:12 ?6469次閱讀
    <b class='flag-5'>端</b>到<b class='flag-5'>端</b><b class='flag-5'>語音</b>解決方案的Renesas RA8M1<b class='flag-5'>語音</b>套件

    嵌入式系統(tǒng)的未來趨勢有哪些?

    智能家居領(lǐng)域,嵌入式系統(tǒng)可以集成語音識別和自然語言處理技術(shù),去實(shí)現(xiàn)智能家電的語音控制。 2. 更強(qiáng)大的處理能力 在未來的嵌入式系統(tǒng)將具備更加
    發(fā)表于 09-12 15:42

    飛凌嵌入式技術(shù)創(chuàng)新日(深圳站)精彩回顧

    嵌入式技術(shù)發(fā)展的深刻理解和對技術(shù)創(chuàng)新的不懈追求。 未來,飛凌嵌入式將繼續(xù)攜手合作伙伴,以開放的心態(tài)和創(chuàng)新的精神,共同推動
    發(fā)表于 08-28 09:06

    循環(huán)神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用

    語音識別技術(shù)作為人工智能領(lǐng)域的關(guān)鍵應(yīng)用之一,已經(jīng)深刻地改變了人們的日常生活和工作方式。從智能手機(jī)中的語音助手到智能家居系統(tǒng)的語音控制,語音
    的頭像 發(fā)表于 07-08 11:09 ?691次閱讀

    嵌入式系統(tǒng)怎么學(xué)?

    系統(tǒng)設(shè)計與調(diào)試:需要掌握嵌入式系統(tǒng)的設(shè)計方法和調(diào)試技術(shù),包括硬件設(shè)計、軟件設(shè)計、電路調(diào)試等,以確保系統(tǒng)的穩(wěn)定性和可靠性。 隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,嵌入式系統(tǒng)將繼續(xù)發(fā)揮
    發(fā)表于 07-02 10:10

    飛凌嵌入式技術(shù)創(chuàng)新日(北京站)圓滿落幕,共創(chuàng)嵌入式技術(shù)的美好未來

    2024年6月25日下午,飛凌嵌入式技術(shù)創(chuàng)新日(北京站)在北京中關(guān)村皇冠假日酒店盛大舉行。此次活動匯聚了近300位嵌入式技術(shù)領(lǐng)域的專家和企業(yè)代表,共享
    的頭像 發(fā)表于 06-28 11:05 ?786次閱讀
    飛凌<b class='flag-5'>嵌入式</b><b class='flag-5'>技術(shù)</b>創(chuàng)新日(北京站)圓滿落幕,共創(chuàng)<b class='flag-5'>嵌入式</b><b class='flag-5'>技術(shù)</b>的美好未來

    嵌入式軟件工程師如何提升自己?

    相關(guān)的實(shí)驗(yàn)室項(xiàng)目或參加開源項(xiàng)目以積累寶貴的項(xiàng)目經(jīng)驗(yàn)。 4.不斷學(xué)習(xí)與成長 嵌入式軟件領(lǐng)域的技術(shù)更新速度非常快,因此,作為一名嵌入式軟件工程師,需要不斷學(xué)習(xí)與
    發(fā)表于 06-12 11:20

    嵌入式會越來越卷嗎?

    更加智能和高效的嵌入式系統(tǒng)。這種技術(shù)的進(jìn)步可能會不斷推動嵌入式系統(tǒng)的發(fā)展,并賦予其更多能力和應(yīng)用場景。 此外,“卷”也可能暗示著嵌入式系統(tǒng)與
    發(fā)表于 03-18 16:41

    嵌入式fpga是什么意思

    嵌入式FPGA是指將FPGA技術(shù)集成到嵌入式系統(tǒng)中的一種解決方案。嵌入式系統(tǒng)是一種為特定應(yīng)用而設(shè)計的計算機(jī)系統(tǒng),它通常包括處理器、內(nèi)存、外設(shè)接口等組件,并且被
    的頭像 發(fā)表于 03-15 14:29 ?1396次閱讀
    主站蜘蛛池模板: 日本精品一卡二卡≡卡四卡 | 很黄很黄叫声床戏免费视频 | 69日本xxxxxxxxx78| 色人阁综合 | 午夜短视频 | 性欧美视频在线观看 | 欧美一级一一特黄 | 四虎影院观看视频 | 欧美福利片在线观看 | 一区二区三区四区在线观看视频 | 黄 色 录像成 人播放免费 | 福利视频一区二区微拍堂 | 亚洲国产欧美日韩一区二区三区 | 一级爱片| www婷婷| 日本一卡精品视频免费 | 日本不卡视频 | 日剧天堂 | 国产在线美女 | 2022欧美高清中文字幕在线看 | 国产精品资源在线观看 | 五月婷婷俺也去开心 | 伊人五月婷婷 | 国产免费一区二区三区最新 | 伊人狼人在线 | 亚洲一区小说区中文字幕 | 午夜影院一级片 | 五月天婷婷视频在线观看 | 一级特黄aaa大片免费看 | 日日噜噜爽爽狠狠视频 | 男人的天堂黄色 | 欧美拍拍 | 4tube高清性欧美| 日本一区二区免费看 | 波多野结衣在线免费视频 | 日本aaaa级片 | 久久婷婷影院 | 免费看欧美一级特黄a大片 免费看欧美一级特黄a大片一 | 久久视频精品36线视频在线观看 | 99热99热 | 亚洲一区二区色 |