語音交互按部署方式可以分為兩種:離線語音交互和在線語音交互。
在線語音交互是將數(shù)據(jù)儲存在云端,其具備足夠大的存儲空間和算力,可以實現(xiàn)海量的語音數(shù)據(jù)處理。
離線語音交互是以語音芯片為載體,語音數(shù)據(jù)的采集、計算、決策均在芯片中進行。其弊端是語音芯片的存儲空間畢竟有限,這就限制了能夠存儲和處理詞條的數(shù)量,大大降低了用戶與設(shè)備之間的語音交互體驗。

傳統(tǒng)離線語音交互與在線語音交互對比
近日,啟英泰倫新推出「離線自然說」——一種輕量級的離線NLP技術(shù)。通過該技術(shù),語音芯片可支持數(shù)萬條離線詞條,泛化能力強,幾乎可涵蓋用戶日常所有說話習慣,可以為用戶提供更自然、更豐富、更靈活的離線語音交互新體驗。

在實現(xiàn)原理上,「離線自然說」通過語義協(xié)議和語音識別構(gòu)圖結(jié)合,在進行語音識別的同時對指令所包含的意圖和槽位進行解析(NLU)。這意味著設(shè)備不僅能夠聽懂用戶說的話,還能深度理解用戶的意圖和需求。這種綜合性的理解使得設(shè)備可以更好地掌握用戶的語音指令,實現(xiàn)功能操作的精準執(zhí)行和智能反饋。
同時,「離線自然說」支持生成控制指令和反饋播報,形成一個完整的閉環(huán)過程。它不僅可以識別和理解用戶的語音指令,還能以語音或其他形式向用戶提供即時反饋和回應(yīng)。這種閉環(huán)機制確保了用戶與設(shè)備之間的有效溝通和互動,提供更加流暢和無縫的語音交互體驗。

「離線自然說」原理
為了滿足多樣化的用戶需求,「離線自然說」采用矩陣分解、權(quán)重共享等技術(shù),在保持低資源消耗的同時提高模型的建模能力,這使得系統(tǒng)能夠支持數(shù)萬種不同語言表達的識別和理解。用戶不再需要記憶固定詞條,可以根據(jù)個人習慣或舒適的表達方式與設(shè)備進行交互。
「離線自然說」技術(shù)的推出標志著離線語音交互邁向了一個全新的階段,打破傳統(tǒng)離線語音識別的局限性,為用戶提供一種前所未有的離線智能交互新方式。立即體驗「離線自然說」,開啟全新的智能語音交互新體驗!你說的,我都懂!
審核編輯 黃宇
-
語音識別
+關(guān)注
關(guān)注
39文章
1774瀏覽量
113957 -
智能語音
+關(guān)注
關(guān)注
11文章
797瀏覽量
49397 -
nlp
+關(guān)注
關(guān)注
1文章
490瀏覽量
22503
發(fā)布評論請先 登錄
讓大模型“開口說話”,啟英泰倫重塑AI玩具交互新體驗!

新品發(fā)布|啟英泰倫聯(lián)合啟明云端推出離在線語音大模型方案

離線語音芯片讓家電變得智能

語音識別ic賦能烤箱,離線對話操控,引領(lǐng)智能廚房新體驗
離線語音控制模塊,讓生活更懂你!

成都市科技局局長丁小斌一行調(diào)研啟英泰倫

成都市經(jīng)信局市新經(jīng)濟委黨組書記趙春淦一行調(diào)研啟英泰倫

啟英泰倫引領(lǐng)智能語音技術(shù)革新,閃耀2024上海MWC展會

評論