AI可能很快就會成為盟友,以消除語音助手的喚醒詞。卡內基梅隆大學的研究人員開發了一種機器學習模型,該模型可以估計語音的發出方向,無需特殊的短語或手勢即可表明您的意圖。該方法依賴于聲音在房間周圍反彈時的固有特性。
系統認識到,第一個,最響亮和最清晰的聲音始終是直接針對給定對象的聲音。其他任何事情都傾向于安靜,延遲和悶悶不樂。該模型還知道,人類的語音頻率會根據您所面對的方向而變化。較低的頻率傾向于全向。
研究人員補充說,這種方法基于軟件“輕巧”,不需要將音頻數據發送到云。
盡管團隊已經公開發布了代碼和數據來幫助其他人繼續工作,但是您可能還需要一段時間才能看到使用的技術。至少很容易看出這可能導致什么。您可以告訴智能揚聲器播放音樂,而無需使用喚醒詞或引起大量其他連接設備的騷擾。它可能需要您的身體狀態,而無需使用注視檢測相機,從而有助于保護隱私。換句話說,它將更接近“星際迷航”中語音助手的愿景,后者始終會在您與他們交談時知道。
責任編輯:lq
-
代碼
+關注
關注
30文章
4899瀏覽量
70638 -
機器學習
+關注
關注
66文章
8501瀏覽量
134537 -
語音助手
+關注
關注
7文章
241瀏覽量
27150
發布評論請先 登錄
無刷直流電機雙閉環串級控制系統仿真研究
輪式移動機器人電機驅動系統的研究與開發
研究人員開發出基于NVIDIA技術的AI模型用于檢測瘧疾
NanoEdge AI Studio 面向STM32開發人員機器學習(ML)技術

機器學習模型市場前景如何
【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型
【「具身智能機器人系統」閱讀體驗】+初品的體驗
研究人員利用激光束開創量子計算新局面

NaVILA:加州大學與英偉達聯合發布新型視覺語言模型
一種信息引導的量化后LLM微調新算法IR-QLoRA

AI大模型與深度學習的關系
名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型算力中心建設指南
一種新型全光學智能光譜儀

評論