在一個癡迷于互聯網隱私的世界里,令人驚訝的是,我們很少談論像 Amazon Echo 這樣的始終在聽的設備。畢竟,一家想要了解你生活中的私密細節以便向你推銷更多東西的公司會在你的廚房里永久打開一個麥克風。
如果您擁有 Echo 并且不知道此功能,請打開您的 Alexa 應用程序,選擇“設置”菜單,然后選擇“歷史記錄”。聽一聽。所有這些錄音都是為 Echo 準備的嗎?
我想隱私是現代消費主義中便利的代價。事情將變得更加方便。
雜音、雞尾酒會、便利和圣誕節
XMOS 是一家從布里斯托大學分離出來的無晶圓半導體公司,專注于語音和音樂處理 IC。在這些 IC 中,基于 32 位 xCORE MCU 架構的設備在語音識別市場上取得了顯著的成功,提供了 16 個可編程內核(分為 8 個內核的兩個區塊,每個內核共享一個地址空間),DSP 功能集成在相同的芯片。
XMOS 將 xCORE 架構加入到用于亞馬遜 Alexa 語音服務 (AVS) 的 VocalFusion 4-Mic 開發套件中。該套件圍繞英飛凌的 VocalFusion XVF3000 集成遠場語音處理器和四個高信噪比 (SNR) MEMS 麥克風而設計。XMOS 聲稱該套件是市場上第一個遠場線性麥克風陣列解決方案。
在范圍之外,在解決“雞尾酒會”問題或平臺需要將單個揚聲器的聲音與嘈雜環境隔離的情況時,遠場語音處理變得非常有趣。在 5 m 或更遠的距離處,VocalFusion 4-Mic 開發套件使用聲學回聲消除 (AEC)、自適應波束形成、動態去混響和自動增益控制 (AGC) 的組合來隔離和提取聲音信號主講者。除此之外,事情開始變得令人毛骨悚然。
今年早些時候,XMOS 收購了馬薩諸塞州波士頓的 Setem Technologies, Inc.,該公司開發了用于盲源信號分離的大規模傅立葉變換。這些盲源分離算法在數學上從一組信號中分解源信號的元素,然后單獨或作為組重構它們(圖 1)。在語音識別中,這可以應用于單個說話者,甚至是對話。
圖 1.現在隸屬于 XMOS 的 Setem Technologies 開發了盲源分離算法,可用于隔離嘈雜環境中的一個或多個揚聲器。
現在,在理論上(或許在實踐中),盲源分離可用于隔離房間內多個說話者的語音頻率,從而為每個說話者建立生物識別身份。正如你可以想象的那樣,這種技術的應用可能會很廣泛,不僅僅是亞馬遜想知道你的每個家庭成員想要什么圣誕節。例如,監視立即浮現在腦海中。
這讓我們回到了 VocalFusion 4-Mic Dev Kit 的線性麥克風陣列。雖然 Amazon Echo 和 Google Home 等許多平臺使用圓形陣列的全向麥克風來提供 360 度的房間覆蓋,但線性陣列設計用于 180 度的弧度。這很有趣,因為語音識別領域的領導者設想了一個未來,今天基于塔的虛擬助手將退居電視、冰箱、沙發、墻壁等日常物品中——你可以說出來。
這個未來被設計為超級方便,通過音節提供服務。但小心點。你可能不知道誰或什么在聽。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19843瀏覽量
234083 -
dsp
+關注
關注
556文章
8152瀏覽量
356170 -
揚聲器
+關注
關注
29文章
1339瀏覽量
64003
發布評論請先 登錄
芯知識|廣州唯創電子WTR096錄音語音芯片IC深度解析

芯知識|廣州唯創電子高品質錄音IC語音芯片技術解析與應用指南

評論