從 CES(國際消費類電子產(chǎn)品展覽會 International Consumer Electronics Show)的進(jìn)展來看,Google 現(xiàn)在確實在把語音互動這件事搞砸,而越來越變成一家很能折騰但不太能干好事的公司。Google 在公有云上不太可能超過 Amazon 了,自動駕駛折騰了好多年但看起來失敗的可能性非常大,而在語音互動上 Google 很可能會再一次敗給 Amazon。
語音助手上的大 PK今年 CES 上最有意思的事情是語音互動型產(chǎn)品泛濫,從英偉達(dá)到聯(lián)想,各大巨頭對此達(dá)成了共識,紛紛殺入。這里面比較核心的兩家分別是 Amazon 和 Google,前者的代表產(chǎn)品是 Echo 和內(nèi)建的語音助手 Alexa,后者則是 Google Home 和內(nèi)建的語音助手 Google Assistant。
正常來講不管從那個角度來看都是 Google 有足夠的優(yōu)勢,有技術(shù)、有資源、有積累,但具體看下來 Google 實際上落后甚遠(yuǎn),甚至可能難以挽回。
要想看懂語音互動這方向的走勢,那么需要深度理解與之相關(guān)的產(chǎn)品和技術(shù)的本質(zhì)特征。
Echo 這類產(chǎn)品的核心特征是多層技術(shù)高度融合(聲學(xué)、語音辨識、語義、搜索、內(nèi)容)。其中聲學(xué)是軟硬件的分割點,向下關(guān)聯(lián)產(chǎn)品 ID 以及內(nèi)部架構(gòu),向上影響語音辨識。而語義之后的部分則是純軟件與內(nèi)容。
對于 Amazon 和 Google 這樣的公司,它們先天把自己定義為做生態(tài)和平臺的公司,所以其核心一定不是 Echo 這個硬件產(chǎn)品本身,而是背后的語音助手比如 Alexa,因為只有 Alexa 才代表新的生態(tài)。
Alexa 這種語音助手很多人覺得是像 Android 一樣的操作系統(tǒng),但實際上看成是一個操作系統(tǒng)+超級 App 更為合適。
要把 Alexa 這樣的語音助手裝載到各種硬件里事實上有兩種途徑:
一種是純軟性方式。我就把語音助手做好,不管誰要用裝進(jìn)去就可以了。這種型態(tài)下在技術(shù)層次上最多需要下探到語音辨識,核心則是語義和對話。這型態(tài)最明顯的參照是搜索引擎。
另一種則是軟硬融合的方式。我做一個標(biāo)竿型的硬件產(chǎn)品,然后再把硬件產(chǎn)品中的助手開放出去。這型態(tài)最明顯的參照是 Android 這樣的操作系統(tǒng)。
純互聯(lián)網(wǎng)公司會傾向第一種方式,因為這種型態(tài)最輕,而后一種型態(tài)要組織生產(chǎn)和銷售,還要下探到聲學(xué)這樣的層次,無疑重很多。
但型態(tài)一的核心問題有兩個:
語音互動很難在現(xiàn)有平臺上啟動(手機(jī)、平板、電腦),而直接把近場的語音互動遷移到遠(yuǎn)場效果會很差,誰來解決落地過程中各種坑坑洼洼的問題?
不知道硬件上的需求,如何設(shè)計出與各種硬件適配的 API,如何知道怎么提供對硬件廠商最便利的方案?把這種苦累活完全下放給各個硬件廠商自己摸索嗎?
Google 開放 ASR 和 NLP 的 API 其實已經(jīng)許久了,但從 CES 的結(jié)果來看,顯然 Alexa 這種系統(tǒng)整合型的方案更受歡迎,它既解決了與下層硬件的適配問題,也解決了后端內(nèi)容整合問題。
提高一層來看整件事情,我們可以講做語音助手這事,事實上有幾個關(guān)鍵控制點:
做標(biāo)竿型的硬件產(chǎn)品,但不與已有用戶習(xí)慣對立。直接講就是新品類必須避開手機(jī)和 PAD,否則一定會被覆寫掉。
豐富后端內(nèi)容,對于語音助手而言,硬件、音樂甚至打電話都是內(nèi)容。內(nèi)容需要從頭部開始逐漸填補(bǔ)長尾內(nèi)容。引申就是要把 Alexa 和 Echo 這個產(chǎn)品分割開來,讓它后面的東西盡可能多。
樹立技術(shù)優(yōu)勢,在這里技術(shù)既包含深度學(xué)習(xí)這樣的純演算法也包含聲學(xué)等與物理緊密相連的網(wǎng)域。當(dāng)內(nèi)容沒多到一定程度時,前端技術(shù)(聲學(xué)和語音辨識)要比語義重要。因為它們更影響速度和精度。
亞馬遜做對了什么?在上一節(jié)提到的幾個點上亞馬遜幾乎每個都做對了。
第一亞馬遜沒回避硬件的煩難,花了 4、5 年打造了 Echo,這樣一來亞馬遜就掌握了一個很難被超越的制高點。
這看著很詭異,但事實就會這樣,否則的話 Google 直接把 Google Assistant 開放出來就行了,根本不需要自己打造什么 Google Home。但實際上硬件和背后 Assistant 的耦合程度遠(yuǎn)高于搜索和瀏覽器,搜索和瀏覽器的耦合程度事實上是便利不便利,但 Alexa 和前端硬件的耦合程度則牽涉好不好用的問題。而 Google 則是迫于 Echo 的壓力才開始做 Google Home。
第二亞馬遜在 Echo 獲得初步成功后迅速開始分離 Echo 和 Alexa,具體動作就包括完整 SDK(ASK&AVS)的檔案和案例,成立 Alexa Fund,積極搜索戰(zhàn)略合作伙伴等。最終結(jié)果之一就是所謂的 7,000 項技能。7,000 項技能是非常可怕的事,完全足以覆寫技術(shù)和某些內(nèi)容上的劣勢。這就好比淘寶上商家數(shù)一旦超過某個臨界值,QQ 流量再大也搞不定了。
那現(xiàn)在 Google 有幾個第三方伙伴呢?1 個。而且 Google 似乎還在神游,它做為后來者本應(yīng)該上來就把這一家族的東西都做了,這樣才體現(xiàn)后發(fā)優(yōu)勢,但它并沒有。
第三是用可靠的方案打造更優(yōu)異的體驗。可靠的方案是說前端至少要和亞馬遜持平,后端再體現(xiàn)語義和內(nèi)容連線上的優(yōu)勢,這樣就可以在整體上反超。但 Google Home 很有意思的選了只裝兩支麥克風(fēng)的方案,直接導(dǎo)致互動效果很差。這實在是大昏招,從便宜的角度解釋是合理的,但你在做的是個標(biāo)竿型產(chǎn)品,便宜與否真的那么關(guān)鍵嗎?
這意味著什么?
這意味著 Google 可能很難追上 Amazon 了。
Google 和 Amazon 相比,無疑在技術(shù)層面會有優(yōu)勢,但是如果對技術(shù)進(jìn)行分解,我們會發(fā)現(xiàn)實際上 Google 真正可能具優(yōu)勢只有 NLP 和搜索部分。這就非常可怕,因為 NLP 部分不存在質(zhì)的差異,你并無法在這個點上單憑演算法明顯拉開體驗,且內(nèi)容沒多到一定程度的時候,搜索的優(yōu)勢根本體現(xiàn)不出來。一旦技術(shù)突破,亞馬遜在這部分就會累積足夠的資料。請注意這里的資料是完全和場景符合的資料,而不是符合度低的網(wǎng)頁公開資料,其中還包含了用戶的各種偏好。
這時候沒人會扮演陪練 Google 的角色,一起從頭玩一遍。
在過去漫長的時間里,Google 這個公司有點被神話了,讓人潛意識覺得它無所不能,但 Google 實在不是一個做產(chǎn)品的公司,我們也許可以把它定義為做演算法的公司或?qū)ρ菟惴òV迷的公司。如果 Google 真的在語音互動這事上玩大了,那核心原因很可能就在這里。
做演算法的時候技術(shù)是第一角度,但做產(chǎn)品的時候體驗是第一角度,你無法掉過來玩:我這項技術(shù)很厲害,所以我要把它放進(jìn)產(chǎn)品里,用戶要為此買單;是要反過來思考,比如延遲、回應(yīng)率和對答準(zhǔn)確率在這類產(chǎn)品上影響用戶體驗,所以我要在現(xiàn)有技術(shù)上把這體驗做到極致。
從表現(xiàn)出來的行為來看,Google 正好屬于前一種。
上面說到的只裝兩支麥克風(fēng)方案來達(dá)到 Google Home,從這個角度來解釋也是合理的。比如說如果想在云端用深度學(xué)習(xí)等處理前端訊號問題,并堅信能做好,那這么選取前端方案就完全沒問題,后端持續(xù)改善演算法就行了。
但這樣一來產(chǎn)品體驗上打折扣就非常厲害。如果 Google 是第一個發(fā)布這種產(chǎn)品,可用時間很多,那也問題不大,關(guān)鍵它不是,它需要這樣一款產(chǎn)品來和亞馬遜的 Echo 競爭,這就可怕了。你是后發(fā),哪怕做到一樣的水準(zhǔn)也沒啥優(yōu)勢,何況你還差一截。挑戰(zhàn)新技術(shù)這事在工程師思惟下是合理的,但在產(chǎn)品思惟下就錯得離譜。
這類的問題點還有很多,比如你喚醒詞叫什么不好非叫“OK Google”,做智能助理顯然 Alexa 更適合這種擬人一點的情景。
Google Home 出來后本應(yīng)該使勁推廣 Google Assistant 到各大廠商,而不是躺在既有的優(yōu)勢上睡大覺(Google 在技術(shù)、不同設(shè)備關(guān)聯(lián)、內(nèi)容上是有優(yōu)勢的,畢竟它有 YouTube 等),但從 CES 上來看,Google 并沒有忙著做這事,至少到現(xiàn)在為止我們還看不到 Google 版的 Alexa Service Kit 和 Alexa Voice Service。
這樣看來 Google 和亞馬遜之間差了至少一年的差異。對打造產(chǎn)品的用戶來講選擇哪家甚至是個不用考慮的問題,一邊是有開放 API 很多第三方用戶,一邊是沒有開放 API 只有一個第三方用戶。換你也會這么選吧!(把軟硬打通,API 封裝到這個程度還是很費勁的,如果你不信,看看這里的文件吧。)
小結(jié)Google 的業(yè)務(wù)最依賴云端,但事實上在云服務(wù)敗于亞馬遜,Google 自動駕駛啟動最早,但看趨勢似乎會起個大早趕晚集;Google 人工智能投入最多,但從現(xiàn)在的進(jìn)展來看,很可能會再次敗給亞馬遜。
如果說前兩次失敗不動搖根本,那這次很不一樣,因為在 AI 這里互動即是搜索,它其實輸不起,輸了就會變成另一個微軟。
評論