語(yǔ)音助手和集成已在投放市場(chǎng)的大多數(shù)產(chǎn)品,設(shè)備和技術(shù)中實(shí)現(xiàn)。話雖這么說(shuō),這些有用的語(yǔ)音助手始終會(huì)監(jiān)聽(tīng)激活/喚醒單詞(例如“ okay Google”或“ Alexa”),這通常會(huì)消耗大量電量,這已不是什么秘密。在當(dāng)今技術(shù)日新月異的世界中,必須考慮其對(duì)能源消耗的影響。
本文提供了使用語(yǔ)音活動(dòng)檢測(cè)(VAD)的低功耗,始終在線語(yǔ)音命令系統(tǒng)的設(shè)計(jì)注意事項(xiàng)。在選擇創(chuàng)建易于使用,節(jié)能的語(yǔ)音用戶(hù)界面(VUI)所需的組件時(shí),它探討了取舍和注意事項(xiàng)。
VAD功能可在聆聽(tīng)喚醒詞之前檢測(cè)環(huán)境中的人聲,這意味著當(dāng)沒(méi)人在家時(shí),您的語(yǔ)音助手將不會(huì)浪費(fèi)不必要的能量。據(jù)估計(jì),全球使用的數(shù)字語(yǔ)音助手有42億,到2024年,這個(gè)數(shù)字有望翻一番。將該技術(shù)應(yīng)用于語(yǔ)音助手軟件和其他依賴(lài)語(yǔ)音集成的產(chǎn)品,將大大降低其能耗。使用語(yǔ)音助手的人。
有幾種用于實(shí)現(xiàn)VUI系統(tǒng)的硬件體系結(jié)構(gòu)。通常,典型的語(yǔ)音用戶(hù)界面實(shí)現(xiàn)由麥克風(fēng)組成,麥克風(fēng)可以是單個(gè)麥克風(fēng),也可以是與音頻處理器相連的麥克風(fēng)陣列,用于捕獲和處理語(yǔ)音。
可以在邊緣音頻邊緣處理器,具有內(nèi)置音頻邊緣處理器的智能麥克風(fēng)或標(biāo)準(zhǔn)應(yīng)用處理器(AP)上處理輸入的音頻流。邊緣音頻處理器針對(duì)音頻信號(hào)的低功耗和低延遲處理進(jìn)行了優(yōu)化。除了提供對(duì)輸入音頻的專(zhuān)門(mén)處理之外,邊緣音頻處理器還可以用于后處理音頻輸出信號(hào)。如果VUI系統(tǒng)是云連接的,則音頻邊緣處理器還可以通過(guò)具有無(wú)線連接性的主單芯片系統(tǒng)(SoC)與云VUI接口進(jìn)行通信。本文介紹了VUI系統(tǒng)的兩種不同實(shí)現(xiàn),以及它們各自的權(quán)衡。
超低功耗VAD(語(yǔ)音活動(dòng)檢測(cè))
圖1所示的體系結(jié)構(gòu)使用模擬信號(hào)路徑支持超低功耗VUI,該路徑包括模擬麥克風(fēng)和模擬比較器以提供喚醒觸發(fā)。當(dāng)檢測(cè)到聲音活動(dòng)時(shí),模擬信號(hào)鏈會(huì)產(chǎn)生一個(gè)中斷,以喚醒音頻處理器以進(jìn)行語(yǔ)音捕獲。該設(shè)備還可以包括“一鍵通”功能,從而用戶(hù)按下按鈕即可喚醒音頻處理器。
圖1.超低功耗,始終在線的VUI硬件信號(hào)鏈,無(wú)需進(jìn)行前滾動(dòng)緩沖即可進(jìn)行遠(yuǎn)程控制。
模擬喚醒麥克風(fēng)必須始終在聆聽(tīng)環(huán)境,因此該麥克風(fēng)以及比較器必須消耗很少的功率。Knowles IA8201是高效音頻處理器的一個(gè)示例,在最簡(jiǎn)單的喚醒觸發(fā)模式下其功耗小于1mW,并且具有1MB的存儲(chǔ)器用于高級(jí)音頻處理。盡管圖1中所示的方法為設(shè)備(例如,遙控器和可穿戴設(shè)備)中始終在線的VUI提供了一種簡(jiǎn)單的低功耗AAD(聲學(xué)活動(dòng)檢測(cè))方法,但它具有局限性。這種實(shí)現(xiàn)方式會(huì)喚醒音頻處理器的任何聲音信號(hào),并且在嘈雜的情況下會(huì)導(dǎo)致總體系統(tǒng)功耗過(guò)高。還,與云連接的語(yǔ)音用戶(hù)界面系統(tǒng)要求在捕獲喚醒字之前的一段時(shí)間內(nèi)獲取音頻數(shù)據(jù),以提高喚醒字檢測(cè)的準(zhǔn)確性。這通常稱(chēng)為預(yù)滾動(dòng),是支持Alexa的設(shè)備和其他智能揚(yáng)聲器設(shè)備的必備條件。
圖2.支持諸如智能揚(yáng)聲器之類(lèi)的設(shè)備的前置滾動(dòng)緩沖的架構(gòu)。
圖2顯示了一種支持針對(duì)智能揚(yáng)聲器等設(shè)備的前置滾動(dòng)緩沖的體系結(jié)構(gòu)。這些設(shè)備通常具有更大的電池,并且/或者一次充電可能不需要多個(gè)月的電池壽命。VUI系統(tǒng)始終處于打開(kāi)狀態(tài),可以收聽(tīng)環(huán)境并在循環(huán)緩沖區(qū)中記錄預(yù)滾動(dòng)。預(yù)卷的長(zhǎng)度通常約為500毫秒的音頻數(shù)據(jù),用于校準(zhǔn)環(huán)境噪聲水平。
有幾種不同的方法可以設(shè)計(jì)永遠(yuǎn)在線的前端體系結(jié)構(gòu)。音頻處理器的選擇取決于所用麥克風(fēng)的數(shù)量,以及它們是模擬還是數(shù)字。
上面顯示的體系結(jié)構(gòu)使用Knowles IA611進(jìn)行語(yǔ)音活動(dòng)檢測(cè),使用SPH0655LM4H-1 Cornell II數(shù)字麥克風(fēng)進(jìn)行波束成形,并使用Knowles IA8201進(jìn)行音頻處理。Knowles IA611是一款智能麥克風(fēng),可為系統(tǒng)設(shè)計(jì)人員帶來(lái)好處,如以下部分所述。
麥克風(fēng)選擇
對(duì)于圖1所示的體系結(jié)構(gòu),當(dāng)檢測(cè)到聲音活動(dòng)時(shí),將單個(gè)模擬麥克風(fēng)和比較器用作觸發(fā)輸入,以喚醒音頻處理器。喚醒麥克風(fēng)應(yīng)為低功率模擬麥克風(fēng),其信噪比(SNR)最好高于62 dB。Knowles SiSonic MEMS麥克風(fēng)產(chǎn)品組合為喚醒麥克風(fēng)提供了多種選擇。例如,SPV1840LR5H-B Kaskade模擬麥克風(fēng)是一個(gè)不錯(cuò)的選擇,當(dāng)打開(kāi)時(shí)僅消耗45μA。包括麥克風(fēng),放大器和比較器在內(nèi)的始終在線的模擬路徑消耗的電流小于67μA。市場(chǎng)上有一些壓電麥克風(fēng),它們的始終接通功率很低(10μA),但是它們通常具有低SNR,這會(huì)影響系統(tǒng)性能。
對(duì)于圖2所示的具有預(yù)卷緩沖功能的體系結(jié)構(gòu),具有嵌入式音頻處理器和足夠內(nèi)存以在2秒的循環(huán)緩沖區(qū)中連續(xù)捕獲語(yǔ)音數(shù)據(jù)的麥克風(fēng)(例如Knowles IA611)是始終在線語(yǔ)音活動(dòng)的可行選擇。檢測(cè)。它還帶有移植語(yǔ)音觸發(fā)器和命令的生態(tài)系統(tǒng),例如亞馬遜的Alexa。當(dāng)檢測(cè)到關(guān)鍵字時(shí),預(yù)滾動(dòng)緩沖區(qū)和發(fā)出的語(yǔ)音音頻都會(huì)發(fā)送到云自動(dòng)語(yǔ)音識(shí)別(ASR)引擎。IA611的始終開(kāi)啟的語(yǔ)音喚醒功率為0.39 mA(電池1.8V,效率為90%),使其成為電池供電設(shè)備(如藍(lán)牙揚(yáng)聲器)中語(yǔ)音用戶(hù)界面的理想選擇。該設(shè)備還接受來(lái)自數(shù)字麥克風(fēng)的PDM輸入,
雖然這種始終接通的功率對(duì)于預(yù)卷式應(yīng)用是可以接受的,但對(duì)于圖1所示的非預(yù)卷式架構(gòu),也值得考慮。如前所述,模擬喚醒麥克風(fēng)將觸發(fā)任何傳入聲音并打開(kāi)揚(yáng)聲器。音頻處理器。在嘈雜的環(huán)境中(例如在電視開(kāi)機(jī)時(shí)),這可能會(huì)成問(wèn)題,因?yàn)槟抢飼?huì)有許多虛假的喚醒,導(dǎo)致功率的大量浪費(fèi)。如果使用語(yǔ)音活動(dòng)檢測(cè)而不是低功率模擬喚醒麥克風(fēng),則系統(tǒng)僅在檢測(cè)到關(guān)鍵字時(shí)才打開(kāi)。從邏輯上看,為什么在嘈雜的環(huán)境中使用語(yǔ)音活動(dòng)檢測(cè)麥克風(fēng)可能比簡(jiǎn)單的模擬喚醒麥克風(fēng)更有效。
圖3顯示了模擬數(shù)據(jù),該數(shù)據(jù)比較了使用IA611上的VAD的典型電視遙控器與競(jìng)爭(zhēng)性的壓電低功率AAD麥克風(fēng)和音頻處理器在不同聲活動(dòng)開(kāi)啟時(shí)間下的電池壽命天數(shù)。當(dāng)電視或其他家用電器打開(kāi)時(shí),或在其他情況下,如鼓鼓聲等時(shí),可能會(huì)出現(xiàn)聲音活動(dòng)。如圖3所示,在大約3小時(shí)處有一個(gè)交叉點(diǎn),因此使用模擬AAD的功率優(yōu)勢(shì)競(jìng)爭(zhēng)對(duì)手的麥克風(fēng)上的IA611上的語(yǔ)音活動(dòng)檢測(cè)消失了。
在聲音活動(dòng)開(kāi)啟時(shí)間為五個(gè)小時(shí)的情況下,語(yǔ)音活動(dòng)檢測(cè)解決方案比基于競(jìng)爭(zhēng)的基于AAD的解決方案多了八天的電池壽命。為了充分發(fā)揮這一優(yōu)勢(shì),根據(jù)尼爾森(Nielsen)在2017年發(fā)布的一項(xiàng)研究,美國(guó)成年人每天看電視的時(shí)間將近八小時(shí)。隨著對(duì)聯(lián)網(wǎng)設(shè)備(例如智能電視,游戲機(jī)和其他多媒體設(shè)備)的需求不斷增加,在典型的美國(guó)家庭中,聲音活動(dòng)的小時(shí)數(shù)也可能會(huì)繼續(xù)增加。使用基于智能VAD的喚醒將幫助系統(tǒng)設(shè)計(jì)人員開(kāi)發(fā)更節(jié)能的VUI系統(tǒng)。
圖3. VAD與AAD的遠(yuǎn)程控制電池壽命。
結(jié)論
從智能家居,酒店,數(shù)字工作場(chǎng)所,語(yǔ)音支付,智能能源管理,邊緣語(yǔ)音和醫(yī)療保健,一直到改變廠房的工業(yè)物聯(lián)網(wǎng)應(yīng)用,語(yǔ)音都為新技術(shù)增加了靈活性,效率,可持續(xù)性和采用接受性。
用于語(yǔ)音用戶(hù)界面設(shè)計(jì)的各種硬件體系結(jié)構(gòu)以及麥克風(fēng)部分,根據(jù)最終設(shè)備的應(yīng)用程序和設(shè)計(jì)人員的喜好,各自滿(mǎn)足的需求略有不同。例如,支持Alexa的設(shè)備和智能揚(yáng)聲器需要具有預(yù)卷緩沖功能的體系結(jié)構(gòu)。
電子工程師和設(shè)計(jì)師必須仔細(xì)評(píng)估終端設(shè)備將如何利用語(yǔ)音,他們希望訪問(wèn)的功能,并據(jù)此確定正確的架構(gòu)和麥克風(fēng)組件,這一點(diǎn)很重要。
Raj Senguttuvan 在面向消費(fèi)者和工業(yè)應(yīng)用的新技術(shù)開(kāi)發(fā),早期業(yè)務(wù)開(kāi)發(fā)以及為Analog Devices和Texas Instruments等公司提供的項(xiàng)目管理方面擁有超過(guò)15年的經(jīng)驗(yàn)。在擔(dān)任Knowles戰(zhàn)略營(yíng)銷(xiāo)總監(jiān)期間,他指導(dǎo)系統(tǒng)級(jí)開(kāi)發(fā),推動(dòng)風(fēng)險(xiǎn)投資和合作伙伴關(guān)系以及IoT和消費(fèi)者技術(shù)(包括音頻處理器,算法,麥克風(fēng),傳感器和接收器)的營(yíng)銷(xiāo)策略。Raj擁有康奈爾大學(xué)(Cornell University)的MBA學(xué)位和佐治亞理工學(xué)院(Georgia Institute of Technology)的電氣工程博士學(xué)位。
編輯“hfy”
-
麥克風(fēng)
+關(guān)注
關(guān)注
15文章
659瀏覽量
55658 -
模擬信號(hào)
+關(guān)注
關(guān)注
8文章
1160瀏覽量
53373 -
智能家居
+關(guān)注
關(guān)注
1934文章
9776瀏覽量
190079 -
語(yǔ)音系統(tǒng)
+關(guān)注
關(guān)注
1文章
28瀏覽量
13164 -
智能揚(yáng)聲器
+關(guān)注
關(guān)注
0文章
32瀏覽量
6384
發(fā)布評(píng)論請(qǐng)先 登錄
DA16600MOD超低功耗Wi-Fi低功耗藍(lán)牙組合模塊數(shù)據(jù)手冊(cè)

電機(jī)溫度監(jiān)測(cè)系統(tǒng)低功耗無(wú)線節(jié)點(diǎn)模塊設(shè)計(jì)
Nordic nRF52840 | Dialog DA14695 等可穿戴平臺(tái)超低功耗振蕩器芯片應(yīng)用方案

超低功耗MCU軟件設(shè)計(jì)技巧與選型

蜂窩物聯(lián)網(wǎng)的超低功耗特性
DA14531-00000FX2 超低功耗藍(lán)牙5.1 SOC芯片介紹
恒玄科技超低功耗藍(lán)牙可穿戴平臺(tái)BES2700iBP系列概述

NXP MCX L微控制器 搭載超低功耗感應(yīng)域,功耗比其他MCX MCU低3倍
電子鎖語(yǔ)音芯片方案,低功耗語(yǔ)音播報(bào)ic,NV256H

利用相對(duì)濕度傳感器增強(qiáng)功能實(shí)現(xiàn)超低功耗系統(tǒng)

超低功耗和動(dòng)態(tài)性能的線性電源

利用超低功耗單片機(jī) MSP430 作為系統(tǒng)伴隨芯片應(yīng)用報(bào)告

適用于超低功耗和低功耗應(yīng)用的獨(dú)特高效隔離式DC/DC轉(zhuǎn)換器

杭州國(guó)芯微AIoT產(chǎn)品系列及方案列表
超低功耗 AT方案說(shuō)明文檔 新增716s/718p芯片模塊的固件獲取以及測(cè)試方法

評(píng)論