AI可能很快就會成為盟友,以消除語音助手的喚醒詞。卡內基梅隆大學的研究人員開發了一種機器學習模型,該模型可以估計語音的發出方向,無需特殊的短語或手勢即可表明您的意圖。該方法依賴于聲音在房間周圍反彈時的固有特性。
系統認識到,第一個,最響亮和最清晰的聲音始終是直接針對給定對象的聲音。其他任何事情都傾向于安靜,延遲和悶悶不樂。該模型還知道,人類的語音頻率會根據您所面對的方向而變化。較低的頻率傾向于全向。
研究人員補充說,這種方法基于軟件“輕巧”,不需要將音頻數據發送到云。
盡管團隊已經公開發布了代碼和數據來幫助其他人繼續工作,但是您可能還需要一段時間才能看到使用的技術。至少很容易看出這可能導致什么。您可以告訴智能揚聲器播放音樂,而無需使用喚醒詞或引起大量其他連接設備的騷擾。它可能需要您的身體狀態,而無需使用注視檢測相機,從而有助于保護隱私。換句話說,它將更接近“星際迷航”中語音助手的愿景,后者始終會在您與他們交談時知道。
責任編輯:lq
-
代碼
+關注
關注
30文章
4885瀏覽量
70174 -
機器學習
+關注
關注
66文章
8487瀏覽量
133975 -
語音助手
+關注
關注
7文章
238瀏覽量
27035
發布評論請先 登錄
研究人員開發出基于NVIDIA技術的AI模型用于檢測瘧疾
NanoEdge AI Studio 面向STM32開發人員機器學習(ML)技術

【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型
研究人員利用激光束開創量子計算新局面

NaVILA:加州大學與英偉達聯合發布新型視覺語言模型
一種信息引導的量化后LLM微調新算法IR-QLoRA

名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型算力中心建設指南
【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書
日本九州大學開發了名為QDyeFinder的人工智能(AI)工具
研究人員提出一種電磁微鏡驅動系統
基于一種AI輔助可穿戴微流控比色傳感器系統

研究人員利用人工智能提升超透鏡相機的圖像質量

評論