在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓萬(wàn)物聽說(shuō):亞馬遜Alexa語(yǔ)音交互系統(tǒng)背后的聲音

姚小熊27 ? 來(lái)源:與非網(wǎng) ? 作者:夏珍 ? 2020-06-17 14:41 ? 次閱讀

“宿命”之說(shuō)

“目前音頻壓縮算法的碼率日趨降低,研究空間相對(duì)較窄,主要是在某種算法的基礎(chǔ)上對(duì)特定應(yīng)用的改進(jìn)和定制。音頻信號(hào)的研究還可以在下列更廣闊的方向開展下去:基于信號(hào)模型的音頻內(nèi)容描述、特征提取、分類與檢索。這些研究可以作為多媒體數(shù)據(jù)庫(kù)研究的一個(gè)子課題,實(shí)現(xiàn)音頻數(shù)據(jù)庫(kù)的組織和管理,基于內(nèi)容的音頻點(diǎn)播等。在人機(jī)交互方面,音頻內(nèi)容的描述可以用于音頻一視頻信號(hào)處理(Audio 一 Visual Signal Processing),實(shí)現(xiàn)音視頻信號(hào)交互、信號(hào)對(duì)應(yīng)、信號(hào)關(guān)連等應(yīng)用?!?/p>

這段文字來(lái)源于 2003 年一篇題為《基于正弦+噪聲模型的寬帶音頻信號(hào)的表示與壓縮》的文章,是今天筆者要介紹的主人公——宋少鵬的碩士畢業(yè)論文節(jié)選。細(xì)讀這段文字,一個(gè)即將畢業(yè)的學(xué)生對(duì)音頻信號(hào)未來(lái)的發(fā)展是有積極想法的,我們似乎就可以清晰地看到這個(gè)年輕人將走上的職業(yè)生涯道路。

時(shí)間是最好的證明,這個(gè)從華南理工大學(xué)無(wú)線電系畢業(yè)的小伙子近 20 年來(lái)真的就只做了一件事,這件事就是音頻信號(hào)處理。常有人問(wèn)他為什么喜歡這個(gè)領(lǐng)域、認(rèn)定這個(gè)方向的時(shí)候,他都會(huì)笑著答道,“兒時(shí)的興趣,我一直對(duì)聲波、電波充滿興趣,小時(shí)候聽黑膠唱片,聽磁帶,就一直想鉆進(jìn)去看看是誰(shuí)在里面唱歌。此外,我的中文名字宋少鵬的拼音首字母縮寫是 SSP,而音頻信號(hào)處理(Sound Signal Processing)的英文首字母縮寫也是 SSP,因此這是一種宿命,很早就注定了的?!?/p>

我的職業(yè)生涯一路向前,沒(méi)有轉(zhuǎn)折

上面講到 2003 年宋少鵬碩士畢業(yè),這一年他放棄了大公司的 offer,選擇進(jìn)入一家以色列芯片公司 Zoran 做軟件開發(fā),鉆研音頻 DSP 技術(shù)。值得一提的是,全球第一個(gè)全套杜比單芯片解決方案就來(lái)自這家公司。

2010 年,他又去了微軟亞洲硬件中心,從事硬件產(chǎn)品的研發(fā)制造,經(jīng)手產(chǎn)品包括智能攝像頭、Kinnet 體感設(shè)備等。

就在 2012 年左右,他發(fā)現(xiàn)智能手機(jī)、電視、汽車都在向聯(lián)網(wǎng)化發(fā)展,由于給用戶帶來(lái)了豐富的內(nèi)容、社交和娛樂(lè)體驗(yàn),這些產(chǎn)業(yè)得到蓬勃發(fā)展。與此同時(shí),音頻設(shè)備卻還沒(méi)有聯(lián)網(wǎng),這在一個(gè)專業(yè)音頻從業(yè)者眼中,便是機(jī)遇。而眼前急切要弄清楚的是:如何聯(lián)網(wǎng)?如何承載娛樂(lè)和社交?

帶著這些思考,還在微軟供職的宋少鵬便尋找機(jī)會(huì)開始嘗試,這次嘗試不算成功,在他看來(lái),原因有兩點(diǎn),一是當(dāng)時(shí)行業(yè)環(huán)境還不太成熟,二是大公司的體制存在一定的限制。

宋少鵬在后來(lái)接受利器的采訪時(shí)被問(wèn)到職業(yè)生涯的轉(zhuǎn)折點(diǎn),他直言不諱地說(shuō):“我的職業(yè)生涯一路向前,沒(méi)有轉(zhuǎn)折?!币虼耍厮莸缴鲜瞿谴尾惶晒Φ膰L試,摸清原因,認(rèn)準(zhǔn)方向也是他職業(yè)道路上的收貨,當(dāng)然不止于此,他還結(jié)識(shí)了一幫志同道合的朋友。于是在 2013 年的某一天,他帶著這個(gè)團(tuán)隊(duì)毅然決然的開始了他們的創(chuàng)業(yè)闖蕩。

2014 年,米唐在深圳這個(gè)遠(yuǎn)離中國(guó)的政治和經(jīng)濟(jì)中心的灣區(qū)成立了,他喜歡那里自發(fā)式、民營(yíng)式、創(chuàng)新型的經(jīng)濟(jì)模式,大家都來(lái)自江西、湖南、江蘇、四川、中國(guó)各地,移民所帶來(lái)的一些共同的特質(zhì),比如說(shuō)勇敢、不屈服、創(chuàng)新,這些都與他的團(tuán)隊(duì)惺惺相惜。

從產(chǎn)品到解決方案,都在用心做“耳朵”

公司成立初期,產(chǎn)業(yè)的不成熟,加上創(chuàng)業(yè)公司交付能力的有限,使得米唐沒(méi)辦法短時(shí)間內(nèi)在語(yǔ)音交互領(lǐng)域拿出產(chǎn)品化的東西,基于訊飛 SDK 和谷歌 SDK 的嘗試又均不能滿足這個(gè)團(tuán)隊(duì)對(duì)產(chǎn)品體驗(yàn)的要求,而一家公司要生存下去就必須要有良好的資金回流,于是他們的第一款產(chǎn)品“方糖音箱”放棄了語(yǔ)音的交互,只保留了兩項(xiàng)特殊的“體感”操作方式:輕拍音箱頂部開始播放音樂(lè)或暫停,向左或向右傾斜切換上下曲目。

這款音箱通過(guò) WiFi 連接上網(wǎng),可脫離手機(jī)獨(dú)立工作,并內(nèi)置了不少音樂(lè)電臺(tái),比如豆瓣電臺(tái)、荔枝 FM、還有一些國(guó)際電臺(tái),同時(shí)它還能記錄個(gè)人喜好,進(jìn)行智能推薦。若是用戶在互動(dòng)中能會(huì)心一笑,那在宋少鵬的眼中,除了趣味更是一種關(guān)懷帶來(lái)的暖意。

“產(chǎn)品就像藝術(shù)品,源于生活,高于生活,要從生活中抽象提煉需求,發(fā)掘人性。”這與宋少鵬以人性、人文觀點(diǎn)來(lái)思考產(chǎn)品設(shè)計(jì)的觀點(diǎn)高度契合。但生活要繼續(xù),公司更需發(fā)展,經(jīng)濟(jì)基礎(chǔ)決定上層建筑,即使方糖在 2015 年就開始銷往海外,并推出了同樣設(shè)計(jì)的藍(lán)牙音箱,以謀取更多的利潤(rùn),一年數(shù)萬(wàn)臺(tái)的銷量還是顯得捉襟見肘。

作為一家始終觀察著這個(gè)領(lǐng)域的創(chuàng)業(yè)企業(yè),2015 年底,他們看到了亞馬遜的 Echo 和背后的 Alexa 語(yǔ)音交互系統(tǒng)。最初亞馬遜 Echo 以 MVP(最小可用原型)的形態(tài)交付用戶,語(yǔ)音識(shí)別和語(yǔ)義理解都僅能滿足流媒體播放的簡(jiǎn)單需求,但是經(jīng)過(guò)一兩年的打磨,到了 2016 年,Echo 的體驗(yàn)就好了很多,它既可以提供音頻內(nèi)容,也可以提供生活服務(wù),包括音樂(lè)、電臺(tái)、有聲書、新聞、天氣、鬧鐘、日程等。這時(shí)候亞馬遜也將 Alexa 語(yǔ)音交互平臺(tái)開放出來(lái),于是米唐團(tuán)隊(duì)在第一時(shí)間找到了亞馬遜。大概花了三四個(gè)月的時(shí)間,在眾多想接入 Alexa 的競(jìng)爭(zhēng)者中,方糖成為首個(gè)通過(guò)亞馬遜認(rèn)證的第三方音箱產(chǎn)品。

“通過(guò)亞馬遜的認(rèn)證后,Alexa 團(tuán)隊(duì)的人就主動(dòng)找到了我,問(wèn)我一年能夠賣多少,我說(shuō)幾萬(wàn)臺(tái),亞馬遜就說(shuō)做他們的技術(shù)方案商,可以幫米唐一年賣幾百萬(wàn)個(gè)解決方案”,宋少鵬回憶稱這是亞馬遜幫團(tuán)隊(duì)找到了方向。于是,一個(gè)擅長(zhǎng)做技術(shù)的團(tuán)隊(duì),開始從做 C 端產(chǎn)品轉(zhuǎn)向做 B 端的方案,并決意將自己定位為聚焦海外市場(chǎng)的語(yǔ)音交互解決方案提供商。

“讓萬(wàn)物聽說(shuō)”是使命所在

目前,米唐的業(yè)務(wù)已擴(kuò)展到家用電器、汽車和消費(fèi)電子產(chǎn)品等多個(gè)領(lǐng)域,而其核心競(jìng)爭(zhēng)力是他們的遠(yuǎn)場(chǎng)語(yǔ)音交互算法,在響應(yīng)速度、識(shí)別率、去噪、聲源定位和產(chǎn)品良率方面均做得還不錯(cuò)。

“作為創(chuàng)業(yè)狗,在哪都能工作。出差路上的飛行和堵車時(shí)的 YY 是獲得靈感的方式,出差的時(shí)候會(huì)帶一本書,和一個(gè)趁早筆記本。”宋少鵬如是說(shuō),“當(dāng)你做一個(gè)事情,真正站在場(chǎng)景和用戶的角度去思考,才有可能在價(jià)值上有所突破,而當(dāng)你受制于既得利益時(shí),其實(shí)會(huì)做很多束縛手腳的事情?!?/p>

未來(lái)的米唐會(huì)發(fā)展成怎樣,沒(méi)人可以預(yù)判,但“讓萬(wàn)物聽說(shuō)”會(huì)成為它和它背后的這個(gè)團(tuán)隊(duì)不變的使命。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2956

    瀏覽量

    119252
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    305

    瀏覽量

    28553
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2692

    瀏覽量

    84501
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    芯資訊|廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片:以技術(shù)創(chuàng)新賦能智能語(yǔ)音交互

    萬(wàn)物互聯(lián)的智能化時(shí)代,語(yǔ)音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語(yǔ)音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列
    的頭像 發(fā)表于 05-21 08:45 ?137次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語(yǔ)音</b>芯片:以技術(shù)創(chuàng)新賦能智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>

    從智能穿戴到智能家居:晶振如何賦能萬(wàn)物互聯(lián)

    當(dāng)你輕觸智能手表查看心率,或是通過(guò)語(yǔ)音指令智能家居開啟燈光,背后都有一個(gè)微小卻至關(guān)重要的元件在默默發(fā)力——晶振。在萬(wàn)物互聯(lián)的時(shí)代浪潮下,從貼身的智能穿戴設(shè)備到全屋智能生態(tài)
    的頭像 發(fā)表于 04-22 11:08 ?187次閱讀
    從智能穿戴到智能家居:晶振如何賦能<b class='flag-5'>萬(wàn)物</b>互聯(lián)

    智能語(yǔ)音交互方案在客服領(lǐng)域的應(yīng)用

    在當(dāng)今數(shù)字化浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語(yǔ)音交互方案憑借其高效、便捷的特性,成為推動(dòng)這一變革的核心力量。其中,語(yǔ)音識(shí)別模型優(yōu)化私部署方案與語(yǔ)音合成
    的頭像 發(fā)表于 04-11 14:35 ?242次閱讀

    麻了!6440萬(wàn)物聯(lián)網(wǎng)智慧路燈,我會(huì)……

    麻了!6440萬(wàn)物聯(lián)網(wǎng)智慧路燈,我會(huì)……
    的頭像 發(fā)表于 04-10 08:43 ?236次閱讀
    麻了!6440<b class='flag-5'>萬(wàn)物</b>聯(lián)網(wǎng)智慧路燈,我會(huì)……

    WT3000T8-32N語(yǔ)音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語(yǔ)音交互體驗(yàn)

    萬(wàn)物互聯(lián)的智能化浪潮中,語(yǔ)音交互已成為人機(jī)交互的核心入口。廣州唯創(chuàng)電子推出的WT3000T8-32N語(yǔ)音合成芯片,憑借其4×4mm超小封裝
    的頭像 發(fā)表于 03-21 09:20 ?356次閱讀
    WT3000T8-32N<b class='flag-5'>語(yǔ)音</b>合成TTS芯片:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>體驗(yàn)

    重慶大學(xué):研究用于語(yǔ)音識(shí)別和交互的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

    生物通信、人機(jī)交互(HMI)和聯(lián)網(wǎng)(IoT)應(yīng)用(包括智能家居、遠(yuǎn)程控制、身份識(shí)別和語(yǔ)音系統(tǒng))的重要組成部分。然而,基于空氣振動(dòng)的語(yǔ)音通信
    的頭像 發(fā)表于 03-14 14:59 ?1020次閱讀
    重慶大學(xué):研究用于<b class='flag-5'>語(yǔ)音</b>識(shí)別和<b class='flag-5'>交互</b>的機(jī)器學(xué)習(xí)輔助可穿戴傳感<b class='flag-5'>系統(tǒng)</b>

    DeepSeek加持,宇視科技升級(jí)發(fā)布“萬(wàn)物X”全鏈路智能引擎

    近日,宇視繼去年在全行業(yè)率先推出“萬(wàn)物搜”后,基于AIoT行業(yè)大模型-“梧桐”多模態(tài)大模型技術(shù)底座,再度重磅升級(jí)發(fā)布「萬(wàn)物X」,大模型能力價(jià)值落地廣泛真實(shí)場(chǎng)景。 「萬(wàn)物X」以梧桐大模
    的頭像 發(fā)表于 03-13 15:36 ?444次閱讀

    【智能語(yǔ)音交互新標(biāo)桿】WTK6900HC語(yǔ)音識(shí)別芯片:重新定義離線語(yǔ)音控制體驗(yàn)

    萬(wàn)物智聯(lián)時(shí)代,離線語(yǔ)音控制技術(shù)正以革命性姿態(tài)重塑智能設(shè)備交互方式。WTK6900HC語(yǔ)音識(shí)別芯片憑借其突破性的技術(shù)創(chuàng)新,為智能清潔設(shè)備領(lǐng)域帶來(lái)三大核心價(jià)值升級(jí),助力產(chǎn)品實(shí)現(xiàn)"聽得清、
    的頭像 發(fā)表于 03-05 09:26 ?348次閱讀
    【智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿】WTK6900HC<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:重新定義離線<b class='flag-5'>語(yǔ)音</b>控制體驗(yàn)

    亞馬遜升級(jí)版Alexa推遲發(fā)布

    。 此次延遲發(fā)布的原因之一,在于升級(jí)后的Alexa在測(cè)試階段暴露出了一些問(wèn)題。據(jù)一位匿名的亞馬遜員工透露,盡管升級(jí)版Alexa在智能交互語(yǔ)音
    的頭像 發(fā)表于 02-17 14:02 ?658次閱讀

    萬(wàn)物相連通訊:共繪萬(wàn)物互聯(lián)藍(lán)圖

    樹立行業(yè)標(biāo)桿,講好中國(guó)故事,傳遞中國(guó)聲音,充分展現(xiàn)騰飛的中國(guó)經(jīng)濟(jì)、崛起的民族品牌和向上的企業(yè)家精神。近日,“崛起的民族品牌”專題系列節(jié)目對(duì)話深圳市萬(wàn)物相連通訊有限公司(簡(jiǎn)稱:萬(wàn)物相連通訊)的董事長(zhǎng)
    的頭像 發(fā)表于 01-15 11:00 ?594次閱讀
    <b class='flag-5'>萬(wàn)物</b>相連通訊:共繪<b class='flag-5'>萬(wàn)物</b>互聯(lián)藍(lán)圖

    解鎖個(gè)性化語(yǔ)音交互新時(shí)代:九芯智能語(yǔ)音云平臺(tái),創(chuàng)意聲音觸手可及!

    九芯智能語(yǔ)音云平臺(tái)提供全面高效安全的智能語(yǔ)音服務(wù),支持自定義語(yǔ)音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù),助力各行業(yè)智能化升級(jí),引領(lǐng)語(yǔ)音交互革命。
    的頭像 發(fā)表于 01-02 16:51 ?795次閱讀
    解鎖個(gè)性化<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新時(shí)代:九芯智能<b class='flag-5'>語(yǔ)音</b>云平臺(tái),<b class='flag-5'>讓</b>創(chuàng)意<b class='flag-5'>聲音</b>觸手可及!

    亞馬遜基于人工智能的Alexa發(fā)布計(jì)劃延期至明年

    11月1日外媒報(bào)道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計(jì)劃延期至明年。   亞馬遜最初于去年9月公開了新版Alexa的規(guī)劃,意在通過(guò)集成AI大模型,顯著增強(qiáng)
    的頭像 發(fā)表于 11-01 15:19 ?950次閱讀

    大華股份與萬(wàn)物云簽署戰(zhàn)略合作協(xié)議

    近日,大華股份與萬(wàn)物云空間科技服務(wù)股份有限公司(以下簡(jiǎn)稱“萬(wàn)物云”)簽署戰(zhàn)略合作協(xié)議。雙方將重點(diǎn)圍繞園區(qū)安全、服務(wù)生態(tài)合作,尤其在弱電智能化服務(wù)、居家安全服務(wù)、人力外包服務(wù)、園區(qū)消防遠(yuǎn)程聯(lián)網(wǎng)、大華生態(tài)服務(wù)以及萬(wàn)物云渠道領(lǐng)域開展深
    的頭像 發(fā)表于 10-31 15:26 ?605次閱讀

    華盛昌攜手我的萬(wàn)物集培訓(xùn)圓滿落幕

    2024年10月19日下午,一場(chǎng)別開生面的培訓(xùn)與活動(dòng)啟動(dòng)儀式在我的萬(wàn)物集(以下簡(jiǎn)稱“萬(wàn)物集”)總部召開。此次活動(dòng)旨在通過(guò)線上線下相結(jié)合的方式,為我的萬(wàn)物集的銷售團(tuán)隊(duì)提供更為專業(yè)的配電柜檢修及自動(dòng)化生產(chǎn)檢測(cè)場(chǎng)景化培訓(xùn),并同步啟動(dòng)雙
    的頭像 發(fā)表于 10-27 15:00 ?698次閱讀

    聯(lián)網(wǎng)系統(tǒng)中音頻方案的“大腦”_語(yǔ)音芯片

    01 聯(lián)網(wǎng)系統(tǒng)中為什么要使用語(yǔ)音芯片 聯(lián)網(wǎng)系統(tǒng)中使用語(yǔ)音芯片的原因可以歸結(jié)為以下幾個(gè)方面:
    的頭像 發(fā)表于 09-26 14:26 ?903次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)<b class='flag-5'>系統(tǒng)</b>中音頻方案的“大腦”_<b class='flag-5'>語(yǔ)音</b>芯片
    主站蜘蛛池模板: 中文字幕一区在线观看 | 欧美性猛交xxxx免费看久久 | 黄色录像日本 | 日本理论在线 | 欧美色碰碰碰免费观看长视频 | 天天干天天曰 | 777精品视频 | 美女一级毛片毛片在线播放 | 天堂中文资源网 | 2020天天操| 四只虎免费永久观看 | 日本福利小视频 | 丁香花五月天婷婷 | 欧美一卡2卡三卡四卡五卡 欧美一卡二卡3卡4卡无卡六卡七卡科普 | 越南黄色录像 | 免费激情网站 | 丁香婷婷在线 | 久久美女精品 | 加勒比啪啪 | 中文字幕欧美成人免费 | 天天干b | 国产亚洲精品久久久久久午夜 | 一级三级黄色片 | 四虎影裤 | 国产精品视频一区国模私拍 | 国产精品爱久久久久久久三级 | 一级毛片女人喷潮 | 亚洲第一色图 | 免费在线播放视频 | 在线综合网| 国产一级特黄a大片免费 | 伊人久久大杳蕉综合大象 | 欧美亚洲一区二区三区在线 | 欧美一级片在线视频 | 诱人的老师bd高清日本在线观看 | 色欲香天天天综合网站 | 日韩三级毛片 | 天天干夜干 | 色视频免费版高清在线观看 | 在线看片成人 | 欧美一级日韩在线观看 |