在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

重慶大學(xué):研究用于語(yǔ)音識(shí)別和交互的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

傳感器專家網(wǎng) ? 2025-03-14 14:59 ? 次閱讀

背景介紹

人體會(huì)產(chǎn)生豐富的生物信號(hào),這些信號(hào)可以被人體檢測(cè)、數(shù)字化、分析并與外界設(shè)備交互。其中,人類的語(yǔ)音尤其具有豐富的時(shí)域、頻域和幅度信息傳輸能力。這種豐富的信息承載能力使聲音成為生物通信、人機(jī)交互(HMI)和物聯(lián)網(wǎng)IoT)應(yīng)用(包括智能家居、遠(yuǎn)程控制、身份識(shí)別和語(yǔ)音系統(tǒng))的重要組成部分。然而,基于空氣振動(dòng)的語(yǔ)音通信容易受到背景噪聲(如路邊、商場(chǎng)、車站等嘈雜環(huán)境)和聲學(xué)介質(zhì)(如火災(zāi)、醫(yī)院、水下等特殊場(chǎng)景)的干擾和阻礙。此外,發(fā)聲過程依賴于器官的協(xié)調(diào)系統(tǒng),任何因肌萎縮側(cè)索硬化癥(ALS)、中風(fēng)、帕金森病或喉癌等疾病引起的損傷都會(huì)嚴(yán)重影響語(yǔ)音清晰度和識(shí)別效率。為了應(yīng)對(duì)這些挑戰(zhàn),研究人員開發(fā)了先進(jìn)的降噪算法和多麥克風(fēng)系統(tǒng)來(lái)增強(qiáng)語(yǔ)音處理能力。然而,這些解決方案的有效性受到聲音信號(hào)質(zhì)量和多特征參數(shù)復(fù)雜性的限制。例如,單麥克風(fēng)系統(tǒng)無(wú)法捕捉空間特征,難以提供高信噪比的音頻信號(hào)。雖然多麥克風(fēng)系統(tǒng)和相關(guān)算法可以改善語(yǔ)音信號(hào)處理,但它們需要復(fù)雜的工程設(shè)計(jì)并占用更多空間。

最近,基于面部和嘴唇運(yùn)動(dòng)的視覺語(yǔ)音識(shí)別已成為一種在嘈雜環(huán)境中增強(qiáng)語(yǔ)音感知的方法。雖然這種方法可以在具有挑戰(zhàn)性的聲學(xué)條件下提高語(yǔ)音感知質(zhì)量,但它需要額外的攝像頭,這增加了系統(tǒng)的復(fù)雜性并降低了實(shí)用性。近年來(lái),直接監(jiān)測(cè)面部運(yùn)動(dòng)狀態(tài)的可連接傳感器作為無(wú)聲語(yǔ)音識(shí)別的解決方案引起了人們的關(guān)注。雖然面部特征可以在一定程度上補(bǔ)充音頻信號(hào),但它們?cè)诓蹲揭舾摺⒁羯吐曇魪?qiáng)度等聲學(xué)參數(shù)方面存在很大的局限性。相反,將傳感器直接放置在發(fā)聲器官區(qū)域是一種實(shí)現(xiàn)全面聲音信息收集的有效方法。用于監(jiān)測(cè)聲音信號(hào)的傳統(tǒng)可穿戴設(shè)備通常使用綁帶或粘性貼片附著在身體上。然而,它們的剛性和扁平形狀限制了實(shí)際應(yīng)用。柔性材料和傳感技術(shù)的發(fā)展為隱形皮膚可穿戴設(shè)備鋪平了道路。目前,安裝在發(fā)聲器官中的柔性傳感技術(shù)主要包括石墨烯、柔性表面肌電圖電極、壓阻和摩擦電。與傳統(tǒng)的剛性麥克風(fēng)相比,這些技術(shù)佩戴更舒適,可以無(wú)縫融入日常活動(dòng)中。盡管這些傳感器有諸多優(yōu)勢(shì),但它們通常依賴于有線硬件,限制了它們?cè)谌粘J褂弥械倪m應(yīng)性。

為了克服這些挑戰(zhàn),集成信號(hào)處理和傳輸單元的柔性可穿戴設(shè)備對(duì)于充分利用各種機(jī)電特性的潛力至關(guān)重要。微機(jī)電系統(tǒng) (MEMS) 制造技術(shù)的進(jìn)步為改善可穿戴設(shè)備的集成帶來(lái)了希望。一項(xiàng)值得注意的創(chuàng)新是將商用 MEMS 加速度計(jì)芯片整合到可穿戴設(shè)備中,從而能夠連續(xù)監(jiān)測(cè)機(jī)械聲音信號(hào),例如語(yǔ)音、吞咽、呼吸和心臟運(yùn)動(dòng)。然而,目前的傳感器無(wú)法滿足寬頻帶范圍和平坦度的要求,限制了信號(hào)頻譜的能量分布。此外,檢測(cè)皮膚加速度只能提供肌肉運(yùn)動(dòng)模式數(shù)據(jù),而忽略了發(fā)聲器官的關(guān)鍵振動(dòng)信息。由于缺乏生物特征信息,在監(jiān)測(cè)小幅度肌肉運(yùn)動(dòng)時(shí),機(jī)械聲音信號(hào)相對(duì)較弱。這種限制對(duì)于皮膚組織較厚(例如甲狀腺腫大)或喉部受傷的用戶尤其不友好。因此,有必要開發(fā)一種新的便攜式語(yǔ)音交互系統(tǒng)來(lái)解決這些問題并提高用戶體驗(yàn)和HMI。

本文亮點(diǎn)

1. 本工作提出了一種可穿戴無(wú)線柔性貼膚聲學(xué)傳感器(SAAS),能夠捕捉發(fā)聲器官的振動(dòng)和皮膚運(yùn)動(dòng),從而實(shí)現(xiàn)惡劣聲學(xué)環(huán)境下的語(yǔ)音識(shí)別和人機(jī)交互(HMI)。

2. 該系統(tǒng)采用壓電微機(jī)械超聲換能器(PMUT),具有高靈敏度(-198 dB)、寬帶寬(10 Hz-20 kHz)和優(yōu)異的平坦度(±0.5 dB)等特點(diǎn)。柔性封裝提高了佩戴時(shí)的舒適性和適應(yīng)性,同時(shí)與殘差網(wǎng)絡(luò)(ResNet)架構(gòu)的集成顯著提高了喉部語(yǔ)音特征的分類,準(zhǔn)確率超過 96%。

3. 在多個(gè) HMI 場(chǎng)景中展示了 SAAS 的數(shù)據(jù)收集和智能分類能力。語(yǔ)音識(shí)別系統(tǒng)能夠通過深度學(xué)習(xí)模型以 99.8% 的準(zhǔn)確率識(shí)別參與者所說(shuō)的日常句子。

圖文解析

wKgZPGfSu-SAWa47ABLWJVRB1_s612.png

圖1. 用于惡劣聲學(xué)環(huán)境下語(yǔ)音識(shí)別的無(wú)線、柔性、可附著式聲學(xué)傳感器。

a 實(shí)現(xiàn)HMI的語(yǔ)音識(shí)別系統(tǒng)示意圖。b 可附著式聲學(xué)傳感系統(tǒng)爆炸圖。c PMUT結(jié)構(gòu)示意圖。d 處理發(fā)聲器官振動(dòng)和肌肉運(yùn)動(dòng)信號(hào)的步驟流程圖,包括信號(hào)處理、控制、無(wú)線通信和顯示終端。e SAAS在語(yǔ)音識(shí)別與交互中的應(yīng)用示意圖。

wKgZPGfSu-WARauxAAuLGS6ykyc681.png

圖2. 裝置設(shè)計(jì)原理及特性描述。

a 基于SOI晶片的聲學(xué)傳感器三維結(jié)構(gòu)剖面圖。b PZT、AlN、ScAlN及對(duì)應(yīng)三種形狀的聲學(xué)傳感器相關(guān)參數(shù)的有限元仿真對(duì)比。c PMUT正面(I)和背面(II)的照片。d 制備的聲學(xué)芯片的光學(xué)顯微鏡圖像和微元件的特寫細(xì)節(jié)。e 制備的聲學(xué)芯片的Mo/ScAlN/Mo薄膜結(jié)構(gòu)的SEM剖面圖。f 空氣中MEMS芯片的電阻抗幅值與相位的諧振頻率響應(yīng)。g 水中封裝后的MEMS傳感器在低頻寬帶范圍內(nèi)的靈敏度測(cè)試曲線。h 柔性器件在未變形(I)、扭曲(II)、彎曲(III)和拉伸(IV)下的圖像顯示。

wKgZPGfSu-WACEl5ABBU5EYCH4Y496.png

圖3. 惡劣聲學(xué)環(huán)境下的語(yǔ)音檢測(cè)對(duì)比實(shí)驗(yàn)。

a 安靜環(huán)境(I)、嘈雜環(huán)境(II)和戴口罩(III)下同一項(xiàng)對(duì)比測(cè)試的照片。b 當(dāng)受試者在安靜環(huán)境(I)、嘈雜環(huán)境(II)和戴口罩(III)下說(shuō)“CQU”時(shí),SAAS顯示聲音信號(hào)的時(shí)域波形和頻譜信息。c 當(dāng)受試者在安靜環(huán)境(I)、嘈雜環(huán)境(II)和戴口罩(III)下說(shuō)“CQU”時(shí),商用參考麥克風(fēng)顯示聲音信號(hào)的時(shí)域波形和頻譜信息。d 受試者在9種喉部附著位置和動(dòng)作下的照片。e 通過 SAAS 在 9 個(gè)喉嚨附著位置和動(dòng)作中說(shuō)“完美”時(shí)獲得的時(shí)域波形。

wKgZPGfSu-WAJ8vgAAlAGkSij_k494.png

圖4. 基于SAAS的身份識(shí)別演示。

a–c音素、聲調(diào)、同音詞分類任務(wù)的混淆矩陣。d通過數(shù)據(jù)采集、深度學(xué)習(xí)和實(shí)時(shí)顯示實(shí)現(xiàn)的身份識(shí)別系統(tǒng)示意圖。e不同參與者說(shuō)“hello world”時(shí)的聲音信息。f身份識(shí)別的混淆矩陣。

wKgZPGfSu-aAIWdTAA7IXHVlAYs643.png

圖5. 使用SAAS控制虛擬游戲和機(jī)器狗。

a實(shí)時(shí)無(wú)線HMI控制系統(tǒng)示意圖。b吃豆人游戲中語(yǔ)音指令上下左右命令演示。c遠(yuǎn)程無(wú)線控制機(jī)器狗通過語(yǔ)音命令執(zhí)行動(dòng)作:“站起來(lái)”、“跳舞”、“側(cè)翻”、“爬樓梯”。

wKgZPGfSu-aAbuxFAAnSMkFICqY403.png

圖6. 基于SAAS的語(yǔ)音識(shí)別系統(tǒng)在人機(jī)交互中的應(yīng)用。

a通過數(shù)據(jù)處理、分類和實(shí)時(shí)顯示實(shí)現(xiàn)的交互系統(tǒng)示意圖。b 使用卷積神經(jīng)網(wǎng)絡(luò)從參與者的日常對(duì)話中收集到的 10 個(gè)句子樣本的波形和相應(yīng)的頻譜圖。c 句子識(shí)別任務(wù)的混淆矩陣。d 60 個(gè) epoch 迭代過程中訓(xùn)練和測(cè)試數(shù)據(jù)的歸一化準(zhǔn)確率。e 經(jīng)過 60 次 T-SNE 算法迭代處理后的特征向量矩陣。f 經(jīng)過 60 次 T-SNE 算法迭代處理后的特征向量矩陣。

來(lái)源:柔性傳感及器件

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    明遠(yuǎn)智睿SSD2351開發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語(yǔ)音機(jī)器人運(yùn)行過程中的復(fù)雜任務(wù)。語(yǔ)音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)語(yǔ)音
    發(fā)表于 05-28 11:36

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    免與行人發(fā)生碰撞,為旅客提供安全、舒適的引導(dǎo)服務(wù)。 智能交互系統(tǒng) 語(yǔ)音識(shí)別與理解 :智能指路機(jī)器人利用先進(jìn)的
    發(fā)表于 05-10 18:26

    北京理工大學(xué)研究眼機(jī)界面智能傳感硬件——從可穿戴到仿生

    ? 眼機(jī)交互界面(Eye-machine interface, EMI)作為沉浸式人機(jī)交互的重要一環(huán),已被應(yīng)用于VR/AR、自動(dòng)駕駛、腦機(jī)接口、生物醫(yī)學(xué)等領(lǐng)域。但現(xiàn)有EMI傳感硬件正在
    的頭像 發(fā)表于 04-25 18:42 ?142次閱讀
    北京理工<b class='flag-5'>大學(xué)</b>:<b class='flag-5'>研究</b>眼機(jī)界面智能<b class='flag-5'>傳感</b>硬件——從<b class='flag-5'>可穿戴</b>到仿生

    max30100用于可穿戴健康的脈搏血氧儀和心率傳感器IC手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《max30100用于可穿戴健康的脈搏血氧儀和心率傳感器IC手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 03-24 09:49 ?3次下載

    基于WTVxxx語(yǔ)音芯片的智能清潔機(jī)器人語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

    集成度、低功耗、多控制模式及傳感器擴(kuò)展能力,為智能清潔機(jī)器人提供了高效的語(yǔ)音交互解決方案。核心需求分析:1、實(shí)時(shí)狀態(tài)反饋:工作模式切換、電量提醒、故障報(bào)警等
    的頭像 發(fā)表于 03-06 08:27 ?310次閱讀
    基于WTVxxx<b class='flag-5'>語(yǔ)音</b>芯片的智能清潔<b class='flag-5'>機(jī)器人語(yǔ)音</b><b class='flag-5'>交互</b><b class='flag-5'>系統(tǒng)</b>設(shè)計(jì)方案介紹

    清華大學(xué):軟體機(jī)器人柔性傳感技術(shù)最新研究進(jìn)展

    隨著機(jī)器人技術(shù)的發(fā)展,配備柔性傳感功能的軟體機(jī)器人在醫(yī)療輔助康復(fù)、水下資源勘探、陸地災(zāi)難救援等領(lǐng)域發(fā)揮著重要作用,如何設(shè)計(jì)高性能柔性傳感器,
    的頭像 發(fā)表于 02-14 14:31 ?657次閱讀
    清華<b class='flag-5'>大學(xué)</b>:軟體<b class='flag-5'>機(jī)器</b>人柔性<b class='flag-5'>傳感</b>技術(shù)最新<b class='flag-5'>研究</b>進(jìn)展

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

    語(yǔ)音命令Q 識(shí)別,適用于智能家居控制、玩具、人機(jī)交互等多個(gè)領(lǐng)域。該模塊以其高識(shí)別率、低功耗和易于集成的特點(diǎn)受到廣大開發(fā)者的青睞。 主要技
    發(fā)表于 01-02 18:15

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議
    的頭像 發(fā)表于 12-20 10:35 ?544次閱讀

    語(yǔ)音芯片賦能可穿戴設(shè)備:開啟個(gè)性化音頻新體驗(yàn)

    語(yǔ)音芯片與可穿戴設(shè)備合作,帶來(lái)定制化音效、智能降噪、個(gè)性化推薦、語(yǔ)音交互及跨設(shè)備共享等,引領(lǐng)個(gè)性化音頻時(shí)代,提升用戶聽覺體驗(yàn)。
    的頭像 發(fā)表于 12-14 15:44 ?870次閱讀

    藍(lán)牙可穿戴方案,藍(lán)牙手環(huán),藍(lán)牙戒指,方案

    可穿戴
    必爾易半導(dǎo)體
    發(fā)布于 :2024年12月13日 20:20:09

    語(yǔ)音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語(yǔ)音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來(lái),隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。
    的頭像 發(fā)表于 11-26 09:20 ?1543次閱讀

    用于可穿戴設(shè)備的感應(yīng)式觸摸按鈕

    電子發(fā)燒友網(wǎng)站提供《用于可穿戴設(shè)備的感應(yīng)式觸摸按鈕.pdf》資料免費(fèi)下載
    發(fā)表于 09-23 11:32 ?1次下載
    <b class='flag-5'>用于</b><b class='flag-5'>可穿戴</b>設(shè)備的感應(yīng)式觸摸按鈕

    AFE4404用于可穿戴光學(xué)心率監(jiān)測(cè)和生物傳感的超小型集成AFE數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《AFE4404用于可穿戴光學(xué)心率監(jiān)測(cè)和生物傳感的超小型集成AFE數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 07-31 11:14 ?3次下載
    AFE4404<b class='flag-5'>用于</b><b class='flag-5'>可穿戴</b>光學(xué)心率監(jiān)測(cè)和生物<b class='flag-5'>傳感</b>的超小型集成AFE數(shù)據(jù)表

    離線語(yǔ)音識(shí)別芯片在智能生活中的應(yīng)用

    離線語(yǔ)音識(shí)別芯片廣泛應(yīng)用于智能音箱、家居、醫(yī)療、交通、安防、教育、家電和可穿戴設(shè)備等領(lǐng)域,帶來(lái)前所未有的智能體驗(yàn),讓生活更便捷、安全、高效。
    的頭像 發(fā)表于 07-12 10:39 ?709次閱讀

    基于一種AI輔助可穿戴微流控比色傳感系統(tǒng)

    存在的挑戰(zhàn)限制了這項(xiàng)技術(shù)的實(shí)際應(yīng)用。 據(jù)麥姆斯咨詢報(bào)道,為了克服這些挑戰(zhàn),來(lái)自中國(guó)石油大學(xué)(華東)的研究人員開發(fā)了一種人工智能(AI)輔助可穿戴微流控比色
    的頭像 發(fā)表于 06-29 10:57 ?1.1w次閱讀
    基于一種AI<b class='flag-5'>輔助</b><b class='flag-5'>可穿戴</b>微流控比色<b class='flag-5'>傳感</b>器<b class='flag-5'>系統(tǒng)</b>
    主站蜘蛛池模板: 亚洲午夜网| 天天摸天天添人人澡 | 欧美大胆一级视频 | 亚洲免费区 | 国产色视频一区 | 在线观看www妖精免费福利视频 | 国产福利在线观看你懂的 | 久久久久久久国产精品电影 | 亚洲男女免费视频 | 色五月激情五月 | 亚洲精品美女久久久 | 欧美综合天天夜夜久久 | 天堂资源bt| 韩国三级hd | 日本xxxxxxxxx68 | 久久精品国产精品亚洲人人 | 亚洲成人在线免费 | 第一页综合| 在线二区 | 狠狠色噜噜狠狠狠狠97不卡 | 69国产视频| 亚洲成在人天堂一区二区 | 午夜欧美电影 | 欧美一区二区三区精品 | 在线天堂资源 | 四虎精品永久在线网址 | 九九视频这里只有精品 | 久久久久大香线焦 | 大乳妇女bd视频在线观看 | 婷婷丁香在线观看 | 99视频网址 | 台湾av| 亚洲美女视频一区二区三区 | 亚洲一区视频 | 在线免费一区 | 狠狠色丁香婷婷久久综合不卡 | 求毛片网站 | 视频在线观看一区二区 | 免费h视频 | 国产精品三级视频 | 精品一区二区影院在线 |