“比做語音的公司更懂車,比做車的公司更懂語音。”這或許是車載語音交互戰(zhàn)場的殺手锏。
2017年4月,大眾汽車集團(tuán)(中國)與人工智能初創(chuàng)公司出門問問正式建立合作伙伴關(guān)系,雙方確定將共同成立一家合資企業(yè),在汽車領(lǐng)域展開合作。
這家名為問眾智能的合資公司,基于出門問問領(lǐng)先的語音識別、自然語言處理、垂直搜索和主動式搜索技術(shù),以及大眾汽車集團(tuán)在汽車和移動出行領(lǐng)域的地位,為未來的智能移動出行提供解決方案。
“公司成立之后比較低調(diào),”1月15日下午,在2018高工智能汽車年會開幕式環(huán)節(jié),來自問眾智能的CEO張亞登臺亮相,“大眾汽車大家都比較熟悉,出門問問則是一家AI語音企業(yè),也是在可穿戴式設(shè)備,比如手表、耳機(jī)以及智能音箱等領(lǐng)域有比較好積累的AI獨(dú)角獸。”
這樣的行業(yè)組合背后,是快速增長的車載語音市場需求。有數(shù)據(jù)顯示,全球車載語音助理市場預(yù)計將在2017到2023年間以39.27%的年復(fù)合增長率增長,到2023年將達(dá)到78億美元市場規(guī)模。而根據(jù)高工智能產(chǎn)業(yè)研究院(GGAI)發(fā)布報告稱,到2020年中國前裝車載語音年均市場規(guī)模將達(dá)到25億元左右。
此外,車載語音交互市場的競爭也在從后裝市場向前裝蔓延。目前,各家汽車OEM廠商推出的2019年新車都將配置智能語音交互系統(tǒng),前裝車型的市場爭奪戰(zhàn)也在悄然打響。
一、技術(shù)公司沒有商業(yè)邊界
之所以過去一年多時間公司一直沒有太多信息披露,張亞表示,做前裝的車載項目需要花很多的精力,這是一個比較漫長的過程,它和互聯(lián)網(wǎng)開發(fā)一個APP是不一樣的。
問眾智能從2017年初成立以來,其語音全棧式解決方案正在覆蓋大眾集團(tuán)旗下多個乘用車品牌,包括一汽大眾、上汽大眾、江淮大眾,奧迪等等。去年8月,問眾智能成為南北大眾五百萬輛級車聯(lián)網(wǎng)系統(tǒng)的語音方案提供商。
“按照正在進(jìn)行中的項目裝機(jī)覆蓋率計算,到2020年問眾智能在前裝語音市場的占有率將位居市場NO.1。”張亞表示。
不過,問眾智能并沒有局限于內(nèi)部客戶。“我們以開放的心態(tài),做技術(shù)的公司不太會介意自己的商業(yè)邊界,只要我們的產(chǎn)品和技術(shù)是過硬的,一定會贏得更多客戶的親睞。”張亞對此信心滿滿。
二、從標(biāo)準(zhǔn)化到差異化
車載語音,這并不是新鮮的細(xì)分市場應(yīng)用,語音和汽車的捆綁是在3、4年前就開始了。張亞表示,曾經(jīng)問自己一個問題,車載語音這個行業(yè)是不是需要多一家像問眾智能這樣的公司?我們認(rèn)為自己對這個問題有答案。
傳統(tǒng)的語音供應(yīng)商,接觸那么多潛在客戶之后,發(fā)現(xiàn)它只能提供標(biāo)準(zhǔn)化的語音服務(wù)方案,如果所有的客戶都是用同一種語音方案,顯然無法做到差異化的用戶體驗(yàn)。
業(yè)內(nèi)人士表示,雖然國內(nèi)能夠提供語音交互方案的公司眾多,但真正應(yīng)用到車載領(lǐng)域,獲得規(guī)模化用戶的企業(yè)并不多。通用的語音平臺一般功能相對完善,但是對應(yīng)到車企的定制化需求,用戶的體驗(yàn)就千差萬別了。
在張亞看來,問眾智能愿意與客戶做更多定制化的產(chǎn)品設(shè)計。像BAT互聯(lián)網(wǎng)巨頭進(jìn)入到這個行業(yè),很多OEM客戶在考慮要不要跟BAT合作。BAT真正的問題是不太懂車廠,車廠的開發(fā)流程,質(zhì)量要求,包括產(chǎn)品的體驗(yàn)。
往往對于BAT而言,則是希望把自己的一整套系統(tǒng)方案(不僅僅是語音)放在車上去用。而AI初創(chuàng)公司,對于車載上面的技術(shù)積累比較淺薄。
對于語音技術(shù)公司來說,產(chǎn)品效果,客戶服務(wù)能力和方案的穩(wěn)定性是決定成敗的關(guān)鍵因素,尤其是客戶服務(wù)能力。
對此,問眾智能堅定認(rèn)為作為一家全棧式智能網(wǎng)聯(lián)解決方案提供商,在車載語音方面,能夠獲得最后勝利的企業(yè)定位就是要深耕整個車載語音市場。
三、語音智能也有自己的邊界
“我們本身是做語音的,但是并不能自大的認(rèn)為汽車加語音就能夠讓人機(jī)交互變得無所不能。”在張亞看來,語音智能也有自己的邊界。
過去幾年時間,語音識別成為功能日益復(fù)雜的汽車信息娛樂系統(tǒng)相結(jié)合的最安全的交互方式之一。但根據(jù)J.D. Power的數(shù)據(jù),盡管汽車的語音識別系統(tǒng)的缺陷不斷改善,但它已經(jīng)成為車主對汽車新技術(shù)體驗(yàn)的最大抱怨之一。
張亞表示,現(xiàn)在行業(yè)里面有兩個普遍現(xiàn)象,讓他感到比較疑惑。
一方面是堆砌的低頻功能,比如有些客戶會提出來,能不能用語音來支持預(yù)定酒店,航班,或者查航班狀態(tài)。作為車主、終端用戶,這些服務(wù)一年里面能用到多少次?我們統(tǒng)稱為堆砌低頻功能,包括訂西餐廳,買票等等。
還有化簡為繁,違背初衷。比如說語音用在車控環(huán)節(jié),車窗、雨刷,或者打開后備廂等等。在車內(nèi),通過按鍵操作就可以順利完成的功能,未必一定需要用語音去做交互。
總結(jié)起來,整個行業(yè)在走向的方向,要么是純粹用技術(shù)驅(qū)動思維、考慮車載人機(jī)交互,工程師認(rèn)為這些事情我能干,我就干了。
二是忽略場景,直接把語音搬到車載場景當(dāng)中。目前搭載在量產(chǎn)車上的語音交互系統(tǒng)存在不少用戶差評,主要集中在識別準(zhǔn)確度(方言),識別的速度,語音喚醒不靈敏,語音控制車輛功能較少,語音系統(tǒng)的升級更新速度慢等問題。
四、回歸本質(zhì),回歸到車
在張亞看來,問眾智能的定位和立足之本還是要回歸本質(zhì),回歸到車。
一是,深耕在駕駛場景下的語音交互,有它的特殊性,比如把車窗打開的時候,有車外、車內(nèi)噪音,車外風(fēng)噪,胎噪,車內(nèi)包括發(fā)動機(jī)的聲音,如何在車載混雜環(huán)境下把噪音能夠降低,并且在高噪狀態(tài)下(85分貝)做到正常識別,順利執(zhí)行命令,需要工程優(yōu)化。
這對車載語音的拾音和降噪能力提出了很高的要求,而這也正是車載語音當(dāng)前比較難以攻克的問題。車載語音面臨的技術(shù)難關(guān)遠(yuǎn)不止這些,比如,在拾音后要如何識別語義進(jìn)行解析?包括對聲紋、性別和場景的識別等等。
而問眾智能在過去一年多時間里,就是一直在做這方面的技術(shù)與工程經(jīng)驗(yàn)的積累,在張亞看來,這會是未來和競爭對手形成差異化的一個點(diǎn)。
二是,真正車載語音的核心指標(biāo),在實(shí)車環(huán)境下,強(qiáng)調(diào)喚醒,數(shù)據(jù)量、準(zhǔn)確率,要考慮到無論是哪個指標(biāo)都要在實(shí)車環(huán)境之下來測。
同時,要基于車內(nèi)采集的大量語料,大量數(shù)據(jù)來訓(xùn)練模型。比如,在線ASR準(zhǔn)確率還有響應(yīng)時間,沒有用戶愿意等(響應(yīng))很長的時間,最后很重要的一環(huán)就是對于服務(wù)生態(tài)的連接。
此外,在車載語音交互上面,如何區(qū)別于像音箱這樣的一些其他場景的智能語音應(yīng)用。
在車載環(huán)境當(dāng)中有一些是定制的,比如說司機(jī)一直處在和(語音)系統(tǒng)相對固定的距離,而且是長時間保持相對的位置。同時對于服務(wù)的喚醒,有些時候比較頻繁,相當(dāng)于音箱來講。
這里面當(dāng)然涉及到自然語音理解,多輪對話,自定義喚醒詞,離線語音識別,這些都是最基礎(chǔ)的語音交互體驗(yàn)。
同時,問眾智能還在做一些其他技術(shù)研發(fā),比如全場景打斷,長時間的偵聽,跨場景上下文交互,免喚醒熱詞或者句式。
這些都是在真正的降低用戶交互成本。
五、做前裝,非常不容易
經(jīng)過這一年多時間的打磨之后,問眾智能也看到了和傳統(tǒng)互聯(lián)網(wǎng)公司,或者技術(shù)公司之間的區(qū)別。
“從事車載市場并不容易,相比其他行業(yè)技術(shù),質(zhì)量,服務(wù)的要求都更為嚴(yán)格,而且要不斷完善,經(jīng)常會被OEM考核。”對此,張亞深有體會,比如說軟件的質(zhì)量,開發(fā)的周期,開發(fā)的復(fù)雜度要和各方溝通。
“我們從一個坑里爬出來再填另外一個坑,直到今天為止,很有信心的跟業(yè)界朋友說,我們已經(jīng)成為一家真正能夠懂得車的AI科技公司。”在張亞看來,這也是一件非常不容易的事情。
在語音公司爭奪車廠前裝市場訂單的過程中,相關(guān)從業(yè)人員表示,車廠對于方案公司的服務(wù)達(dá)成率比較看重,也就是說,語音公司如果能夠較快的響應(yīng)車廠需求,更好的服務(wù)好車廠,那么在跟同行競爭的時候,會有一定的優(yōu)勢。
張亞表示,問眾智能是一家擁有車載語音全棧技術(shù)的公司,從DSP模組,到HMI、TTS、NLU、DM、ASR、NLG、VAD等等,同時提供靈活、高效、標(biāo)準(zhǔn)化的解決方案。
經(jīng)過這一年多時間與車廠項目的錘煉,問眾智能對于語音SDS,DSP方案整合,適配到各個車載操作系統(tǒng)當(dāng)中的量產(chǎn)經(jīng)驗(yàn),對于其他OEM潛在客戶也是非常重要的。
-
人工智能
+關(guān)注
關(guān)注
1802文章
48336瀏覽量
244082 -
智能語音
+關(guān)注
關(guān)注
11文章
793瀏覽量
49266 -
車載語音
+關(guān)注
關(guān)注
0文章
20瀏覽量
10417
原文標(biāo)題:做前裝不易,這家公司卻“喊出”到2020年成為前裝語音市場No.1 | GGAI頭條
文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
表面貼裝技術(shù)(SMT):推動電子制造的變革
車載語音高階功能裝配率飆升,趨向認(rèn)知交互發(fā)展

鎧裝網(wǎng)線需要接地嗎
鎧裝光纖是什么意思
線纜鎧裝什么意思
鎧裝光纜可以直接埋地嗎
網(wǎng)線有鎧裝的嗎
如何在SOT-563封裝和SOT-236封裝之間實(shí)現(xiàn)共同布局

鎧裝光纜光纜VS非鎧裝光纜區(qū)別在哪里
廣和通出售車載前裝無線通信模組業(yè)務(wù)
廣和通擬以1.5億美元出售車載前裝無線通信模組業(yè)務(wù)
詳解表面貼裝技術(shù)和通孔插裝技術(shù)

評論