在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音

倩倩 ? 來源:百度粉絲網 ? 作者:百度粉絲網 ? 2021-01-22 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最新研究表明,蘋果公司正在研究HomePod或其他設備如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音。

Apple的HomePod已經非常擅長于聽到您的聲音,即使它正在大聲播放音樂。蘋果公司有兩項單獨的新專利申請表明,蘋果公司希望將其改進,并將設備的聆聽能力提高到一個新水平。

其中之一,“基于學習的距離估計”,不僅涉及使用音頻來識別用戶,而且要弄清楚他們在哪里。

專利申請說:“通常希望設備使用[其]緊湊型麥克風陣列來估算從設備到用戶的距離。” “例如,該設備可以基于用戶到該設備的估計距離來調整播放音量或來自智能輔助設備的響應。”

繼續說:“因此,如果用戶離設備非常近,則不會大量播放音樂或語音。” 或者,如果用戶離得很遠,則可以將媒體播放或來自智能助手設備的響應調整為更大的音量。”

同樣的想法也意味著將其引入蘋果公司目前令人印象深刻但有些瑕疵的系統,在該系統中,所有設備都會嘗試確定您對“嘿,Siri”說的是什么。

蘋果公司說:“在有多個設備的應用程序中,這些設備可以在彼此之間進行協調或仲裁,以根據從每個設備到用戶的距離來決定應回答一個或多個設備的查詢。”

蘋果公司提出了簡單和更復雜的解決方案,它們都可以同時使用。更簡單的方法是讓設備先執行HomePod的工作并首先繪制其環境圖。

然后,它實際上具有“在聲學環境中的測量點或模擬點的網格”。在這種情況下,可以將聲音與此“網格”進行比較,以大致了解說話者所在的位置。

但是,Apple認為這本身并不足夠好,并且還說它與Siri最少一起使用。那是因為一個人說話時可能會動彈,而且他們要求快速回應-此提議不適合。

備選地,然后,“如果至少兩個麥克風陣列可用”,則“可以使用三角測量方法來估計語音源的距離”。

但是,這里的關鍵部分是至少需要兩個帶麥克風的設備。因此,Apple提供了另一個涉及更多的解決方案,其中涉及“基于學習的系統,如深度神經網絡(DNN)”,并且不需要多個設備。

專利申請說:“深度學習系統可以根據緊湊型麥克風陣列接收到的語音信號來估計每個時間幀的語音源距離。”

這個DNN系統可以做的是確定什么是語音,什么是背景噪聲。然后,它可以計算“有關直接信號傳播的信息”以及“混響效果和噪聲”。

該申請歸功于三位發明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關工作包括已獲專利的如何使用比普通麥克風少的聲音來錄制完整空間聲音的專利。

這特別涉及Apple AR中的音頻,該最新專利申請涉及真實環境中的物理設備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。

該專利申請說:“例如,助聽器之類的輔助和增強型助聽器可以根據語音源的距離來增強音頻信號。”

這也是第二個新公開的專利申請重點關注的內容。

識別重要的聲音

“基于觀察到的聲音識別聲源的系統和方法”,是關于讓一些設備識別其他聲音并為我們做出反應。

“許多家用電器,例如微波爐,洗衣機,洗碗機和門鈴,會發出聲音來提醒用戶該器具的狀況已經改變,”該專利申請開始。

它繼續說:“但是,由于各種原因,用戶可能無法聽到家用電器發出的聲音警報。” “例如,用戶可能有聽力障礙,用戶可能在外面或在另一個房間里,或者設備可能發出被家庭聲學場景遮擋的聲音。”

也不必是您的煮蛋計時器關閉。該專利同樣涉及“公共場所(政府大樓),半公共場所(辦公室大廳)和私人場所(住宅或辦公大樓)”中的聲音。

它說:“(這些)也有聲學場景,可以包含帶有信息的聲音。” “例如,鈴,鈴或蜂鳴器可能指示門已經打開或關閉,或者警報器可能發出警報聲或其他聲音,警告附近的人有危險(例如,煙,火或一氧化碳)。”

總體而言,該專利申請主要詳述了可以“訓練”設備以識別“常見聲音”的方法。然后,它將繼續偵聽其中的任何一個,并且當聽到一個聲音時,可以發出“響應于確定聲音存在于聲學場景中的選定輸出”。

換句話說,如果是您的煮蛋計時器關閉,則該設備可能會使您的Apple Watch在手腕上輕按。或者,如果是防盜警報,則該設備可以通知當局。

蘋果公司表示:“聲音中包含大量的上下文信息。” “識別常見的聲音可以使電子設備響應于觀察到的環境(例如,根據觀察到的聲音確定)來適應其行為或提供服務,從而增加它們對用戶的相關性和價值,同時需要更少的用戶幫助或輸入。”

第二項專利申請歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內的四位發明家。他先前的工作包括一項專利申請,該專利用于通過HomePod或其他設備進行安全的電話呼叫。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 音頻
    +關注

    關注

    29

    文章

    3030

    瀏覽量

    83217
  • 蘋果公司
    +關注

    關注

    2

    文章

    448

    瀏覽量

    23321
  • 深度學習
    +關注

    關注

    73

    文章

    5557

    瀏覽量

    122642
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電機、變頻器之間距離多少為宜?·

    在工業自動化領域,電機與變頻器作為驅動系統的核心組件,其性能與穩定性直接影響到生產線的效率與安全性。而電機與變頻器之間距離,作為影響這一系統性能的關鍵因素之一,往往被工程師們所重視。本文將從理論
    的頭像 發表于 04-17 16:44 ?290次閱讀
    電機、變頻器<b class='flag-5'>之間</b>的<b class='flag-5'>距離</b>多少為宜?·

    CLRC663如何增強對RFID標簽ic的識別距離

    我現在在使用clrc663通過ISO15693協議識別rifd標簽 ic無線圈(尺寸5*5mm),我現在的方案識別距離很短接近0時才能識別,我這邊需要將
    發表于 03-17 07:50

    TIKOOL太酷信息無線內部通話系統允許多個人一起講話,頻道內會不會很吵?

    傳統的對講機聲音采樣率普遍是4K,音質差,往往音量大但稍有干擾就聽不清內容;TIKOOL太酷無線內部通話系統音頻采樣率可達16K,音質數倍的提升,具備極高的聲音還原度,如同面對面聊天,多人講話
    發表于 12-18 09:07

    音頻功放芯片:音頻設備的核心驅動力

    音頻功放芯片是音頻設備核心,放大音頻信號精準控制音質、音量。高保真、穩定、易集成,但面臨散熱和成本問題。盡管如此,它仍是呈現高品質聲音不可
    的頭像 發表于 12-17 16:37 ?882次閱讀
    <b class='flag-5'>音頻</b>功放芯片:<b class='flag-5'>音頻</b>設備的核心驅動力

    TLV320aic3104怎么設置使耳機能聽到人講話聲音

    我公司有項目正在使用TLV320AIC3104 這顆TI codec IC,已拿到這顆IC的開發套件,但是現在用TLV320aic3104評估板有些問題請教。從電腦里面輸出聲音,耳機能正常收聽。但是還不知道怎么設置使耳機能聽到人講話
    發表于 11-07 06:44

    8127+tlv320aic3104設置立體聲采集到音頻播放是快進音頻聲音,怎么解決?

    8127+tlv320aic3104設置單通道采集到的音頻播放正常流暢的聲音,設置立體聲采集到音頻 播放出來是快進音頻聲音就是
    發表于 11-05 06:31

    用PCM1804做音頻轉換,輸出聲音很難聽是什么原因導致的?

    。 目前還不確定問題在哪里,就TTS和PCM之間檢測,有幾個可能,TTS輸出到PCM的信號需要調制到2.5V的中心電壓(已測試,無效果);TTS輸出到PCM的聲音信號峰值需放到2.5V。PCM
    發表于 10-28 08:01

    系統靜音時發現aic3254出音頻有隨機的pop音,pop音來自右聲道較強較明顯,為什么?

    問題1:系統靜音時發現aic3254出音頻有隨機的pop音,pop音來自右聲道較強較明顯。 問題2:系統軟重啟后音頻不正常,斷電重啟后恢復正常。軟重啟時aic3254不斷電,軟重啟時示波器
    發表于 10-28 06:51

    FSA8049連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒有從FSA8049_B1腳輸出來是為什么?

    請工程幫忙確認一下圖中FSA8049連接是否正確,現在遇到的問題是連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒有從FSA8049_B1腳輸出來,測量B1腳MIC_BIAS電壓2.5v正常,B3腳連接耳麥正極就沒有電壓。
    發表于 10-25 11:07

    TLV320AIC3100做手持設備的音頻聲音出不來,請問下還需要注意哪些配置?

    目前我采用TLV320AIC3100 做手持設備的音頻,有成功的配置聲音從ATMEL 的CPU A5 里通過I2S 到TLV320AIC3100,沒有聲音從speak出來, 目前用
    發表于 10-22 06:41

    TLV320DAC3100音頻播放偶爾出一聲比正常聲音響的聲音是怎么回事?

    板子使用揚聲器播放一個按鍵音的時候,偶然出現一聲較正常聲音響亮的聲音,這種情況好像也不叫破音,只是比正常音量大。 在linux執行以下命令,大概20-30次里面就會出現一個比正常響亮的聲音
    發表于 10-10 06:38

    物聯網系統中聲音拾取音頻方案_咪頭

    捕捉周圍聲音信號,并將其轉換為電信號,以供后續處理或傳輸。 廣泛應用:由于聲音是信息傳遞的重要方式之一,咪頭在物聯網系統中的應用非常廣泛。無論是智能家居、安防監控、遠程會議,還是語音識別
    的頭像 發表于 09-23 15:49 ?1265次閱讀
    物聯網系統中<b class='flag-5'>聲音</b>拾取<b class='flag-5'>音頻</b>方案_咪頭

    音頻信號通常包括哪些聲音信號

    音頻信號是指通過聲音傳輸的信號,它包含了各種不同的聲音信號。以下是對音頻信號中常見的聲音信號的介紹: 語音信號 語音信號是人類通過聲帶振動產
    的頭像 發表于 08-25 15:43 ?2774次閱讀

    用opa1671做麥克風前置放大器做音頻ADC采樣時,距離聲音太小怎么解決?

    在用opa1671做麥克風前置放大器做音頻ADC采樣時,距離聲音太小,距離聲音太大,有沒有推薦的自動AGC電路(參考電路),(由于功耗
    發表于 08-08 08:23

    ESP32-LyraT v4.3 HFP模式中聽筒噪音嚴重,MIC聲音對方聽不清怎么解決?

    描述: 1.直接在安卓手機端播放音樂,ESP32-LyraT開發板的喇叭輸出聲音,完美無雜音。 2.對著ESP32-LyraT開發板上的MIC講話,并在手機端錄音,錄音回放完美無雜音。 3.在安
    發表于 06-28 07:53
    主站蜘蛛池模板: 欧美成人影院 | 激情天堂| 无毒不卡在线播放 | 色偷偷.com | 免费在线观看你懂的 | 深夜视频在线播放视频在线观看免费观看 | 亚洲视频一区二区三区 | 成人午夜性视频欧美成人 | 骚淫| 午夜免费一级片 | 国产亚洲一区二区三区啪 | 91视频www| 日本成人黄色网址 | 自拍偷拍福利视频 | 国产在线精品观看一区 | 久操视频网站 | 2021精品国产综合久久 | 久久久噜噜噜久久网 | 国内精品久久久久影 | 亚洲 欧美 日韩 在线 中文字幕 | 日本网络视频www色高清免费 | 婷婷午夜天 | 亚洲最新视频 | 美女毛片免费 | 在线视频这里只有精品 | 婷婷六月综合网 | 深夜视频免费在线观看 | 理论在线看 | 深夜视频在线播放视频在线观看免费观看 | 免费观看欧美一级高清 | 欧美午夜视频一区二区三区 | 国产特黄特色的大片观看免费视频 | 久久精品国产99国产精品免费看 | 亚洲成a人片在线网站 | 色老头在线视频 | 天天草天天干 | 操你啦网站| 51精品国产| 四虎8848精品永久在线观看 | 色网站综合 | 免费一级特黄特色大片在线观看 |