基于語音識別技術用于錄音應用

在一個癡迷于互聯網隱私的世界里，令人驚訝的是，我們很少談論像 Amazon Echo 這樣的始終在聽的設備。畢竟，一家想要了解你生活中的私密細節以便向你推銷更多東西的公司會在你的廚房里永久打開一個麥克風。

如果您擁有 Echo 并且不知道此功能，請打開您的 Alexa 應用程序，選擇“設置”菜單，然后選擇“歷史記錄”。聽一聽。所有這些錄音都是為 Echo 準備的嗎？

我想隱私是現代消費主義中便利的代價。事情將變得更加方便。

雜音、雞尾酒會、便利和圣誕節

XMOS 是一家從布里斯托大學分離出來的無晶圓半導體公司，專注于語音和音樂處理 IC。在這些 IC 中，基于 32 位 xCORE MCU 架構的設備在語音識別市場上取得了顯著的成功，提供了 16 個可編程內核（分為 8 個內核的兩個區塊，每個內核共享一個地址空間），DSP 功能集成在相同的芯片。

XMOS 將 xCORE 架構加入到用于亞馬遜 Alexa 語音服務（AVS）的 VocalFusion 4-Mic 開發套件中。該套件圍繞英飛凌的 VocalFusion XVF3000 集成遠場語音處理器和四個高信噪比（SNR） MEMS 麥克風而設計。XMOS 聲稱該套件是市場上第一個遠場線性麥克風陣列解決方案。

在范圍之外，在解決“雞尾酒會”問題或平臺需要將單個揚聲器的聲音與嘈雜環境隔離的情況時，遠場語音處理變得非常有趣。在 5 m 或更遠的距離處，VocalFusion 4-Mic 開發套件使用聲學回聲消除（AEC）、自適應波束形成、動態去混響和自動增益控制（AGC）的組合來隔離和提取聲音信號主講者。除此之外，事情開始變得令人毛骨悚然。

今年早些時候，XMOS 收購了馬薩諸塞州波士頓的 Setem Technologies， Inc.，該公司開發了用于盲源信號分離的大規模傅立葉變換。這些盲源分離算法在數學上從一組信號中分解源信號的元素，然后單獨或作為組重構它們（圖 1）。在語音識別中，這可以應用于單個說話者，甚至是對話。

圖 1.現在隸屬于 XMOS 的 Setem Technologies 開發了盲源分離算法，可用于隔離嘈雜環境中的一個或多個揚聲器。

現在，在理論上（或許在實踐中），盲源分離可用于隔離房間內多個說話者的語音頻率，從而為每個說話者建立生物識別身份。正如你可以想象的那樣，這種技術的應用可能會很廣泛，不僅僅是亞馬遜想知道你的每個家庭成員想要什么圣誕節。例如，監視立即浮現在腦海中。

這讓我們回到了 VocalFusion 4-Mic Dev Kit 的線性麥克風陣列。雖然 Amazon Echo 和 Google Home 等許多平臺使用圓形陣列的全向麥克風來提供 360 度的房間覆蓋，但線性陣列設計用于 180 度的弧度。這很有趣，因為語音識別領域的領導者設想了一個未來，今天基于塔的虛擬助手將退居電視、冰箱、沙發、墻壁等日常物品中——你可以說出來。

這個未來被設計為超級方便，通過音節提供服務。但小心點。你可能不知道誰或什么在聽。

審核編輯：郭婷

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

處理器

處理器

+關注

關注
68

文章
19843

瀏覽量
234083
dsp

dsp

+關注

關注
556

文章
8152

瀏覽量
356170
揚聲器

揚聲器

+關注

關注
29

文章
1339

瀏覽量
64003

星星科技指導員
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 使用microchip參考設計開發您的下一個基于USB-C PD的充電器
Hot 所有IC中半導體噪聲的特性如何估算基準電壓源的噪聲

New 微電網系統控制方法和原理
New 飛輪儲能系統的核心及優勢分析

精選推薦
更多

文章

資料

帖子

園區智變時刻，網絡該如何為企業撐腰？

腦極體
9小時前

301 閱讀

不是8萬也不是13萬，高速風筒為什么偏偏是11萬轉速呢？--【其利天下】

其利天下技術
11小時前

231 閱讀

基于瑞薩64位MPU RZ/G2L進行32位應用軟件開發

瑞薩MCU小百科
11小時前

222 閱讀

移動AI一周年，5G-A和AI究竟把世界變成什么樣？

腦極體
12小時前

336 閱讀

芯對話|CBM53D系列?4路同步+12位高精度DAC小能手

芯佰微電子
15小時前

365 閱讀

部分單片機芯片手冊

chenbowen012
6925KB

3積分

12下載

人工智能（AI）學習：從Python到AI編程

ah此生不換
1.66 MB

1積分

0下載

openharmony移植可設置間隔的自動滑動pagerslider組件

姚小熊27
1.36 MB

免費

1下載

minimesos Mesos框架的測試平臺

mintsy
13.48 MB

2積分

2下載

simdjson高性能JSON解析庫

回頭太晚
1.75 MB

免費

0下載

【飛凌T527N開發板試用】開箱曬圖查看配置設置屏參

jf_69121293
1天前

198 閱讀

【微五科技CF5010RBT60開發板試用體驗】打印串口無輸出問題解決(更正，原理圖中使用的是USART1不是UART4)

jf_1137202360
1天前

169 閱讀

初級工程師PCB設計技巧（PPT版）

yuu_cool
1天前

174 閱讀

【微五科技CF5010RBT60開發板試用體驗】開發環境搭建之——使用J-Link調試

jf_69121293
1天前

308 閱讀

【微五科技CF5010RBT60開發板試用體驗】開發板介紹與開發環境搭建

jf_1137202360
1天前

321 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

基于語音識別技術用于錄音應用

評論