2025年,AI玩具已成為全球消費(fèi)科技領(lǐng)域最炙手可熱的賽道之一。DeepSeek的崛起,顯著降低了大模型的部署成本和門檻,成功點(diǎn)燃了整個行業(yè)以及資本市場對端側(cè)AI落地的熱情,進(jìn)一步推動了AI玩具的熱潮。
從市場需求來看,AI玩具正在重新定義兒童陪伴與教育的方式,不僅滿足“玩”的基本需求,而且,通過智能“擬人化”交互可為兒童提供豐富的情緒價值。數(shù)據(jù)顯示,2024年全球AI玩具市場規(guī)模已達(dá)181億美元,并以16%的年復(fù)合增長率持續(xù)擴(kuò)張,預(yù)計(jì)2033年將突破600億美元。越來越多的廠商正在積極布局AI玩具領(lǐng)域,然而,如何在激烈的市場競爭中脫穎而出,打造一款功能全面、用戶體驗(yàn)卓越的差異化產(chǎn)品,成為企業(yè)成功突圍的關(guān)鍵。
離在線語音大模型方案演示
啟英泰倫深耕智能語音行業(yè)十年,現(xiàn)重磅推出AI玩具離在線語音大模型方案,相比行業(yè)現(xiàn)有方案具有以下五大優(yōu)勢:
01
語音喚醒,自然交互與隱私保護(hù)兼得
目前,大部分AI玩具還需要依賴觸摸按鍵發(fā)起對話,交互生硬,影響用戶體驗(yàn);或者持續(xù)監(jiān)聽數(shù)據(jù)上傳云端泄露用戶隱私,難以獲得家長信賴。
而本方案通過融入基于DNN的端側(cè) VAD (語音活動檢測)算法,可直接通過語音喚醒,避免了復(fù)雜的操作。AI玩具實(shí)時檢測用戶語音輸入,僅在檢測到有效語音時才上傳大模型進(jìn)行云端處理,兼顧自然交互與隱私保護(hù)。
02
實(shí)時性強(qiáng),交互流暢
延遲是影響用戶體驗(yàn)的關(guān)鍵因素。當(dāng)語音交互延遲超過1秒時,用戶將感覺到明顯的滯后感,會顯著降低交互流暢性和增加用戶焦慮情緒。
本方案通過基于DNN的端側(cè)VAD算法及深度降噪算法,將語音數(shù)據(jù)處理部署到芯片端,能夠保證傳到云端的是經(jīng)過處理的、高質(zhì)量的語音數(shù)據(jù),避免云端處理冗余數(shù)據(jù)及大規(guī)模計(jì)算任務(wù)帶來的響應(yīng)延遲,滿足兒童與設(shè)備實(shí)時互動需求。
03
高識別準(zhǔn)確度,適應(yīng)復(fù)雜噪聲環(huán)境
目前,大部分AI玩具缺乏語音降噪功能,導(dǎo)致在嘈雜環(huán)境中語音識別準(zhǔn)確率低,兒童需重復(fù)指令,影響使用體驗(yàn)。本方案采用基于DNN的深度降噪技術(shù),具備更強(qiáng)的自適應(yīng)性和泛化能力,能夠在不同的噪音環(huán)境中保持優(yōu)異的降噪效果,為云端大模型提供了更干凈的語音,極大提升了云端大模型的語音識別準(zhǔn)確率。
04
隨時打斷,提升交互效率
目前,大部分AI玩具必須等待回答結(jié)束后才能響應(yīng)新的指令,交互效率低。本方案基于回聲消除技術(shù),結(jié)合VAD算法,可有效抑制回聲,實(shí)現(xiàn)實(shí)時打斷功能,讓兒童無需漫長等待即可繼續(xù)進(jìn)行語音指令輸入,保障了用戶體驗(yàn)的流暢性與即時性。
05
指向性交互,打造沉浸式人機(jī)互動體驗(yàn)
一般AI玩具缺乏對聲源方向的感知,無法與用戶建立自然的關(guān)注互動,互動體驗(yàn)單一。本方案基于DNN聲源定位算法,可實(shí)現(xiàn)多場景下的指向性交互,設(shè)備可感知兒童的聲音方向并主動“看向”用戶或向用戶方向移動,模擬真實(shí)互動場景,增強(qiáng)互動的自然性與趣味性。

AI玩具離在線語音大模型方案功能框圖啟英泰倫現(xiàn)已推出適用于CI1302、CI1303、CI1306離線AI語音芯片和CI2305、CI2306 AI語音Wi-Fi Combo芯片的AI玩具離在線語音大模型方案。
●CI1302、CI1303
基于該芯片,啟英泰倫提供基于DNN的本地語音喚醒及語音識別、語音深度降噪、端點(diǎn)檢測、命令詞自學(xué)習(xí)、回聲消除,另還提供Speex、Opus數(shù)據(jù)壓縮、MP3流媒體播放等功能。啟英泰倫提供前端功能SDK,用戶可基于自主選型的WIFI進(jìn)行云端開發(fā)。

該方案采用單麥克風(fēng),對結(jié)構(gòu)要求相對較低,適用于各類AI玩具。
●CI1306
基于該芯片,啟英泰倫提供基于DNN的本地語音喚醒及語音識別、語音深度降噪、端點(diǎn)檢測、聲源定位、回聲消除,另還提供Speex、Opus數(shù)據(jù)壓縮、MP3流媒體播放等功能。啟英泰倫提供前端功能SDK,用戶可基于自主選型的WIFI進(jìn)行云端開發(fā)。

該方案采用雙麥克風(fēng),可實(shí)現(xiàn)聲源定位,適用于需要指向性交互的AI玩具、桌面寵物等。
●CI2305、CI2306
基于該芯片,啟英泰倫提供語音和WIFI相關(guān)功能。語音功能包括基于DNN的本地語音喚醒及語音識別、語音深度降噪、端點(diǎn)檢測、聲源定位、回聲消除,另還提供Speex、Opus數(shù)據(jù)壓縮、MP3流媒體播放等功能。WIFI功能包括錄音數(shù)據(jù)和播放數(shù)據(jù)轉(zhuǎn)發(fā)、BLE藍(lán)牙配網(wǎng)、產(chǎn)品部分功能邏輯,支持TCP/MQTT/UDP網(wǎng)絡(luò)傳輸協(xié)議。啟英泰倫提供芯片對接云平臺服務(wù)商的SDK,用戶可基于此SDK進(jìn)行端上功能開發(fā)。

該方案集成WIFI,可降低整個方案的成本。包括單麥克風(fēng)、雙麥克風(fēng)兩種方案,雙麥克風(fēng)可實(shí)現(xiàn)指向性交互。
啟英泰倫AI玩具離在線語音大模型方案,基于啟英泰倫神經(jīng)網(wǎng)絡(luò)語音芯片,支持OTA升級,也可用于智能家電、AI教育、養(yǎng)老陪護(hù)、機(jī)器人等產(chǎn)品,全面解決行業(yè)痛點(diǎn),為廠商提供極具競爭力的差異化解決方案。
-
AI
+關(guān)注
關(guān)注
88文章
34588瀏覽量
276213 -
交互
+關(guān)注
關(guān)注
1文章
71瀏覽量
15126 -
啟英泰倫
+關(guān)注
關(guān)注
1文章
54瀏覽量
1570 -
大模型
+關(guān)注
關(guān)注
2文章
3062瀏覽量
3908
發(fā)布評論請先 登錄
啟英泰倫亮相成都人工智能專場路演,發(fā)布具身智能新戰(zhàn)略!

涂鴉WuKong AI 2.0開發(fā)框架發(fā)布!情緒感知+多模態(tài)交互,重新定義AI玩具新體驗(yàn)

移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型,重塑智能交互新體驗(yàn)

移遠(yuǎn)通信智能模組全面接入多模態(tài)AI大模型,重塑智能交互新體驗(yàn)

新品發(fā)布|啟英泰倫聯(lián)合啟明云端推出離在線語音大模型方案

移遠(yuǎn)通信AI玩具整體解決方案全面升級:融合火山引擎RTC大模型,打造實(shí)時交互新體驗(yàn)

移遠(yuǎn)通信AI玩具整體解決方案全面升級:融合火山引擎RTC大模型,打造實(shí)時交互新體驗(yàn)

啟英泰倫新推出多意圖自然說,重塑離線人機(jī)交互新標(biāo)準(zhǔn)!

成都市科技局局長丁小斌一行調(diào)研啟英泰倫

啟英泰倫獲評國家級專精特新“小巨人”企業(yè)!

佛山市市委常委、常務(wù)副市長劉杰一行到啟英泰倫考察

成都市經(jīng)信局市新經(jīng)濟(jì)委黨組書記趙春淦一行調(diào)研啟英泰倫

評論