近年來(lái),由于機(jī)器學(xué)習(xí)以及大數(shù)據(jù)的迅猛發(fā)展,讓圖像識(shí)別、語(yǔ)音交互、生物醫(yī)療、交通運(yùn)輸?shù)阮I(lǐng)域發(fā)展迅速,機(jī)器也逐步朝著真正能夠理解人、幫助人的愿望發(fā)展,功能單一的家電設(shè)備甚至不聯(lián)網(wǎng)也可以聽懂命令、自動(dòng)操控,比如小編近期了解到的一盞臺(tái)燈,它只需要用關(guān)閉、打開、調(diào)暗、調(diào)亮等簡(jiǎn)短的語(yǔ)音命令,就可對(duì)其進(jìn)行控制,甚至無(wú)需喚醒詞、不用經(jīng)過(guò)云端的大數(shù)據(jù)匯集。
語(yǔ)音交互的云平臺(tái)和本地端應(yīng)用
語(yǔ)音交互技術(shù)作為人工智能重要的一個(gè)分支領(lǐng)域,從最初由聲控虛擬助手來(lái)補(bǔ)充云端的語(yǔ)音信息庫(kù),到大量的誤聽、誤解命令的服務(wù)機(jī)器人、智能音箱等產(chǎn)品的出現(xiàn),發(fā)展到現(xiàn)在的,一盞臺(tái)燈、一個(gè)晾衣架、一臺(tái)風(fēng)扇,更多本地端的語(yǔ)音交互應(yīng)用也逐漸被細(xì)分出來(lái),但是否這樣的端智能就會(huì)是機(jī)器智能交互的最終形態(tài)呢?
(歡迎補(bǔ)充,數(shù)據(jù)持續(xù)更新…)
就目前來(lái)講,做語(yǔ)音交互云平臺(tái)的數(shù)量是要多于做端智能的企業(yè),兩者的區(qū)別在技術(shù)本身除了聯(lián)網(wǎng)之外,并沒(méi)有太大的差別,可是反饋到終端產(chǎn)品以及應(yīng)用場(chǎng)景中,就會(huì)帶來(lái)一些不同的體驗(yàn)感,其一是功能性,端智能的功能更加明確,錯(cuò)誤理解率會(huì)小于云智能,命令反應(yīng)時(shí)間也會(huì)快于云智能,但端智能能夠滿足的產(chǎn)品功能種類會(huì)比較單一,目前還只適用于簡(jiǎn)單的家電控制,像臺(tái)燈、風(fēng)扇、空調(diào)等。
其二是趣味性,這也是功能性的延伸,由于云端不受資源的限制,可以有更大的數(shù)據(jù)庫(kù),更強(qiáng)大的語(yǔ)義理解功能,除了可以增添家電控制、天氣、交通、時(shí)勢(shì)信息的查詢等硬性功能外,陪伴聊天、娛樂(lè)也成為了云端智能的新穎噱頭以及未來(lái)可能的發(fā)展方向。簡(jiǎn)單點(diǎn)來(lái)說(shuō)就是在端智能和云智能的優(yōu)缺點(diǎn)中做一些取舍,假如我們需要更多種類的軟性趣味功能,就勢(shì)必會(huì)有一些硬性的功能方面的小瑕疵。
互問(wèn)以AM1032作為分布式家居中的智能節(jié)點(diǎn),和現(xiàn)在形態(tài)還不確定的家庭中控實(shí)現(xiàn)分布式智能家居平臺(tái)。
處理語(yǔ)音數(shù)據(jù)的技術(shù)趕不上其增長(zhǎng)的速度
目前很大一部分選擇發(fā)展云智能的原因都不外乎兩點(diǎn),一是技術(shù)上還不能夠滿足明確的應(yīng)用場(chǎng)景,這里的技術(shù)具體是指前端的語(yǔ)音處理,如遠(yuǎn)距離拾音、降噪、回聲消除、去混響、聲紋識(shí)別、音源定位、音源跟蹤,小size算法模型,麥克風(fēng)陣列等,據(jù)小編了解目前市面上存在的智能音響,只有相對(duì)安靜的環(huán)境下使用一般說(shuō)話的聲音大小(大概60分貝左右),能夠達(dá)到3到5米的拾音距離。
前端語(yǔ)音的處理或許在比較安靜穩(wěn)定的環(huán)境里面體現(xiàn)不出來(lái)太大的差別,但是如果在汽車、室外等并不穩(wěn)定的環(huán)境里,設(shè)備的“聽力”就會(huì)變得格外重要,畢竟聽不到又怎么能聽懂,何況就現(xiàn)實(shí)來(lái)看,不穩(wěn)定的環(huán)境因素是必然存在的,所以無(wú)論是云智能還是端智能,想要有更多的應(yīng)用場(chǎng)景、更好的智能體驗(yàn)效果,都是需要不斷提升前端語(yǔ)音處理技術(shù)的。
目前市面上有提出兩種解決方案,都是利用高性能數(shù)字信號(hào)處理芯片DSP(Digital Signal Process)技術(shù)來(lái)實(shí)時(shí)進(jìn)行語(yǔ)音識(shí)別,互問(wèn)的圓形麥克陣列板是其中之一,這是一個(gè)將軟硬件結(jié)合的方案,它的拾音距離是10米范圍內(nèi)(連續(xù)可調(diào)),具備回聲抵消、聲源測(cè)向、混響消除、噪聲抑制、可調(diào)拾音方向、可調(diào)拾音距離等一系列功能。還有一種解決方案是美國(guó)的Synaptics公司提出,是可以通過(guò)軟件的方式來(lái)處理,目前可達(dá)到在噪音較大的環(huán)境下進(jìn)行遠(yuǎn)至5米的無(wú)縫語(yǔ)音控制。
Synaptics的官網(wǎng)圖片
選擇云智能的第二個(gè)原因,是布局大數(shù)據(jù)。數(shù)據(jù)的價(jià)值已經(jīng)被等同于能源,而當(dāng)前我國(guó)90%的數(shù)據(jù)是來(lái)源于近兩年的積累,畢竟大數(shù)據(jù)的發(fā)展是依靠互聯(lián)網(wǎng)以及移動(dòng)互聯(lián)網(wǎng)的應(yīng)用推動(dòng)。而語(yǔ)音交互云平臺(tái)只有積累更多的語(yǔ)音信息數(shù)據(jù),才能運(yùn)行更大更多的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
百度在15年開發(fā)出的“深度語(yǔ)音識(shí)別系統(tǒng)”(Deep Speech 2),它就是在擁有一個(gè)非常大的、“深”的神經(jīng)網(wǎng)絡(luò)的同時(shí),不斷的學(xué)習(xí)、引入數(shù)以萬(wàn)計(jì)的轉(zhuǎn)錄語(yǔ)音,目前Deep Speech 2在口語(yǔ)識(shí)別的準(zhǔn)確度方面十分驚人,有時(shí)在識(shí)別漢語(yǔ)語(yǔ)音片段方面比人為識(shí)別還要準(zhǔn)確。但還是有部分人認(rèn)為目前的深度學(xué)習(xí)更傾向于蠻力計(jì)算,處理語(yǔ)音數(shù)據(jù)的技術(shù)是趕不上數(shù)據(jù)增長(zhǎng)速度的。
從中心化過(guò)渡到去中心化,是否任意端都可以成為中心?
由于上面的兩個(gè)原因,BAT企業(yè)大都會(huì)首先選擇發(fā)展云智能,提供云平臺(tái)服務(wù),盡管應(yīng)用領(lǐng)域的側(cè)重點(diǎn)不同,但并不影響他們建立自己的云端數(shù)據(jù)中心,最終這些數(shù)據(jù)細(xì)分輸入到不同的領(lǐng)域的應(yīng)用場(chǎng)景中,成為一個(gè)個(gè)能夠進(jìn)行語(yǔ)音交互的機(jī)器設(shè)備,可能是會(huì)像文章一開頭所講的臺(tái)燈、風(fēng)扇一樣,也有可能是某個(gè)類似智能音響一樣的中央控制器。
從現(xiàn)在發(fā)展的趨勢(shì)來(lái)看,從中心化過(guò)渡到去中心化,似乎是必然的發(fā)展規(guī)律,但如果想要構(gòu)建一個(gè)像科幻電影里面一樣:可以掌握聽、說(shuō)、讀等多種能力、適應(yīng)更多可變化的場(chǎng)景和環(huán)境、能自我完成多數(shù)任務(wù)的機(jī)器人管家,一個(gè)真正的人工智能集合體,就一定是建立在大數(shù)據(jù)共享的條件之下。
這就需要每個(gè)端智能都成為一個(gè)中心,或者說(shuō)是將端智能和云智能的方式相結(jié)合,這目前是一個(gè)嘗試,畢竟目前的技術(shù)已經(jīng)解決了部分的簡(jiǎn)單任務(wù),像單一的家電控制,這些清晰而簡(jiǎn)明的數(shù)據(jù)信號(hào)。但是如果有那么一天我們需要面對(duì)更為復(fù)雜智能化,以及其背后更具生命性的特征時(shí),我們是否就會(huì)有取舍和決斷。畢竟有些觀點(diǎn)是說(shuō),如果我們想要絕對(duì)的智能我們也將不再會(huì)有隱私。
-
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280117 -
語(yǔ)音交互
+關(guān)注
關(guān)注
3文章
307瀏覽量
28624
原文標(biāo)題:一盞臺(tái)燈開啟AI的端智能時(shí)代
文章出處:【微信號(hào):Iotchannel,微信公眾號(hào):聯(lián)動(dòng)原素】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代
誠(chéng)邁科技、智達(dá)誠(chéng)遠(yuǎn)隆重推出ArraymoAIOS 2.0 端側(cè)AI操作系統(tǒng),開啟智能體協(xié)作新時(shí)代

首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開啟 AI 推理新時(shí)代
AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
廣和通開啟端側(cè)AI新時(shí)代
基于STM32設(shè)計(jì)的智能臺(tái)燈

智能無(wú)處不在:安謀科技“周易”NPU開啟端側(cè)AI新時(shí)代

端到端讓智駕強(qiáng)者愈強(qiáng)時(shí)代來(lái)臨?

評(píng)論