在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

汽車AI語音交互 正在讓機(jī)器交互更接近真人交互

jf_f8pIz0xS ? 來源:智能相對論 ? 作者:胡楊 胡皓 ? 2020-07-25 12:03 ? 次閱讀

現(xiàn)在,情況有了改善。當(dāng)用戶詢問車機(jī)“明天出門需要帶傘么?”,車機(jī)就會(huì)播報(bào)明天的天氣情況,如果需要再查詢其他時(shí)間或者城市的天氣,那么用戶不用重新喚醒,也不需要說出完整表達(dá),只需要說“那大后天呢?”、“那杭州呢?”。在用戶和車機(jī)在自然連續(xù)對話的過程中,語義理解服務(wù)會(huì)記住會(huì)話的歷史,并結(jié)合歷史處理用戶的請求,通過這種方式,用戶的多次連續(xù)交互就可以形成一個(gè)會(huì)話流,與用戶的交互也更加自然。

自然連續(xù)對話,是車載語音交互從“人工智障”邁向“人工智能”的重要一步。不過斑馬網(wǎng)絡(luò)最近推出的斑馬智行VENUS系統(tǒng),打破了對用戶說話規(guī)則的要求,用戶可以按照自身的說話習(xí)慣來進(jìn)行交流,交互過程更加人性化。這會(huì)不會(huì)是一個(gè)跨越?

從科幻到現(xiàn)實(shí),語音交互一直在進(jìn)化

提到智能語音交互,普羅大眾對于技術(shù)刷屏的記憶停留在2018年的Google開發(fā)者大會(huì)“Google I/O”開幕式上。當(dāng)Google Assistant以驚人的流利會(huì)話,打電話和店家溝通,預(yù)約理發(fā)店、餐廳,并用一句俏皮的“嗯哼”作為回應(yīng)時(shí),觀眾給予了熱烈的掌聲。這是技術(shù)愿景美好、激勵(lì)人心的一面。

有趣的是,同年2月的美國第五十二屆超級碗的天價(jià)廣告上,亞馬遜賣力黑了自家的智能音箱和智能助手——Alexa。喚醒失誤、識(shí)別不準(zhǔn)、響應(yīng)困難等等用戶槽點(diǎn),被廣告創(chuàng)意表現(xiàn)得淋漓盡致。這是技術(shù)的現(xiàn)實(shí)。

但不論是基于場景的未來暢想,還是對當(dāng)下缺陷的大膽自嘲,兩個(gè)科技巨頭都將業(yè)務(wù)重心的一角,押注在了語音交互賽道上。

亞馬遜首席技術(shù)官Werner Vogels斷言:未來,人和數(shù)字世界對的交互,一定是以“人”為核心,而不是機(jī)器驅(qū)動(dòng);我們終將構(gòu)建出更人性化的交互,讓人機(jī)互動(dòng)更加融合。

在“以人為核心”、“更加融合”的人機(jī)交互中,語音交互(簡稱VUI)是核心。VUI允許更自由、高效的人機(jī)交互,其本質(zhì)上比任何其他形式的用戶界面都更“人性化”。斯坦福大學(xué)教授,Wired for Speech的合著者,克利福德·納斯寫道:“語音是人類交流的基本手段……。所有文化主要通過語音來說服,告知和建立關(guān)系。”

VUI允許用戶使用語音作為媒介與機(jī)器進(jìn)行交互。從《2011太空漫游》中的HAL到《星球大戰(zhàn)》中的C-3PO,人們在科幻電影里暢想著能夠與機(jī)器自由溝通。事實(shí)上,早在1952年,貝爾實(shí)驗(yàn)室的工程師就開發(fā)出了Audrey(奧黛麗):它可以識(shí)別數(shù)字0-9的發(fā)音。盡管奧黛麗能夠以超過90%的精度識(shí)別語音輸入,但其體積大,成本高昂,未曾步入大規(guī)模商業(yè)化的發(fā)展通道。

自此,人類開啟了長達(dá)半個(gè)多世紀(jì)的語音交互探索。1962年,IBM推出了第一臺(tái)真正意義上的是語音識(shí)別機(jī)器。工程師William Dersch開發(fā)出的Shoebox可以收聽操作員說出的數(shù)字和命令。例如“5+3+8+6+4-9,總和”,機(jī)器將打印出正確答案:17。

1970年,隱馬爾可夫模型(HMM)為語音識(shí)別的發(fā)展插上了算法的翅膀,讓語音識(shí)別從文字匹配進(jìn)化到了可預(yù)測的高度。20世紀(jì)80年代,Covox,Dragon Systems,Speechworks相繼成立,推動(dòng)了語音識(shí)別的商用化進(jìn)程。

90年代,語音識(shí)別技術(shù)迎來了大規(guī)模商用和普及。1995年,Dragon發(fā)布了單詞聽寫級的語音識(shí)別軟件。這是人類歷史上首個(gè)面向廣大消費(fèi)者的語音識(shí)別產(chǎn)品。僅一年之后,Charles Schawab(嘉信理財(cái))和Nuance(紐昂斯)聯(lián)合推出了一套“語音股票經(jīng)紀(jì)人”系統(tǒng),可同時(shí)響應(yīng)360個(gè)客戶的股票詢價(jià)電話。1997年,如今隸屬Nuance旗下的聲龍系統(tǒng)(Dragon system)推出了“NaturallySpeaking”軟件,這是歷史上第一個(gè)可用的“連續(xù)語音”聽寫軟件。它標(biāo)志著單詞級不停頓語音交互的開始。

最近的20年,Google,Apple,Amazon先后推出了大眾耳熟能詳?shù)闹悄苷Z音助手,并通過智能手機(jī)、智能音箱等產(chǎn)品,來到普羅大眾身邊。據(jù)Juniper Research統(tǒng)計(jì),截至2019年2月,全球使用中的語音助手達(dá)32.5億;預(yù)計(jì)到2023年,該數(shù)字將達(dá)到80億。

語音交互技術(shù)上的高山一:自然連續(xù)對話

隨著軟硬件的快速迭代,如今的ASR(語音識(shí)別)技術(shù)已近成熟,未來智能語音交互的核心競爭力在于在復(fù)雜場景下準(zhǔn)確理解用戶的意圖,并為其提供差異化服務(wù)。更加智能的自然連續(xù)對話能力,將讓語音交互系統(tǒng)更具人類的親和力特質(zhì)和邏輯思維能力,能帶給用戶更具情景化、更有溫度的用車體驗(yàn)和服務(wù)潛力。

“智能相對論”認(rèn)為,自然連續(xù)對話是一個(gè)系統(tǒng)的工程,涉及到從車機(jī)端的聲學(xué)前端處理、語音喚醒、語音識(shí)別、語義理解、對話管理、自然語言生成、語音合成等核心交互技術(shù)。斑馬智行VENUS的AI語音得益于阿里達(dá)摩院的重磅加持以及科大訊飛、思必馳等合作伙伴的大力支持,極大提升了語音能力。斑馬基于AliOS系統(tǒng),可以更好地將語音核心技術(shù)能力與系統(tǒng)能力相結(jié)合,更大程度地發(fā)揮出語音核心技術(shù)的優(yōu)勢,將多種引擎的協(xié)作發(fā)揮到極致,達(dá)到“1+1》2”的效果。

語音交互技術(shù)上的高山二:個(gè)性化,即聲音克隆

如果說自然連續(xù)對話為更自由的交互和差異化服務(wù)提供可能,那語音定制化則將個(gè)性化、情感化的語音交互率先落地。

2017年9月,一家名為Lyrebird的加拿大初創(chuàng)公司在推特上發(fā)布了一段10秒的錄音。錄音是內(nèi)容AI模仿美國總統(tǒng)特朗普的話語。在此之前,Google旗下的DeepMind曾經(jīng)公布了一個(gè)用AI合成人聲的研究成果:WaveNet,達(dá)到以假亂真的地步。Adobe也發(fā)布過一款名為Project VoCo的原型軟件,在傾聽20分鐘音頻樣本之后可以進(jìn)行模仿。而Lyrebird將音頻采樣的輸入時(shí)間縮短到了60秒。

如今,國內(nèi)智能網(wǎng)聯(lián)行業(yè)也首次迎來了語音定制——“聲音克隆”產(chǎn)品。斑馬智行VENUS系統(tǒng)“聲音克隆”操作流程非常簡單。用戶只需在斑馬智行APP錄制20句話即可合成私人語音包,一鍵發(fā)送至車機(jī)便可全局使用,無論是導(dǎo)航引導(dǎo)、天氣查詢,還是預(yù)訂餐廳,和你對話的都是你最想聽的聲音。

聲音是車載AI語音交互功能的“靈魂”,基于“聲音克隆”技術(shù),斑馬智行VENUS系統(tǒng)將為用戶提供“千人千聲”的定制化服務(wù),用戶可以“克隆”親人和愛人的聲音,讓陪伴更長久,讓駕駛更舒心。

據(jù)介紹,斑馬智行VENUS系統(tǒng)“聲音克隆”操作流程非常簡單。用戶只需在斑馬智行APP錄制20句話即可合成私人語音包,一鍵發(fā)送至車機(jī)便可全局使用,無論是導(dǎo)航引導(dǎo)、天氣查詢,還是預(yù)訂餐廳,和你對話的都是你最想聽的聲音。斑馬網(wǎng)絡(luò)AI語音相關(guān)負(fù)責(zé)人表示,斑馬智行VENUS系統(tǒng)能在錄制“傾聽”中“掌握”每個(gè)人說話時(shí)的字母、音位、單詞和語句的發(fā)音特點(diǎn),通過深度學(xué)習(xí)技術(shù)推理并模仿聲音中的語音音色、語調(diào),“說”出全新的語句。

攀登技術(shù)高山,如何讓機(jī)器交互能夠更接近真人交互依然在等待更好答案

語音是人類最舒適,最直觀的交流方式之一。如今的智能語音交互產(chǎn)品,變得越來越像人一樣聰明且富有感情。它可以準(zhǔn)確理解信息輸入、高效處理并提供理想的信息輸出。“智能相對論”認(rèn)為,在人工智能和5G迅速發(fā)展的背景下,語音平臺(tái)有機(jī)會(huì)成為物聯(lián)網(wǎng)時(shí)代下新的“操作系統(tǒng)”,連接全新的產(chǎn)業(yè)生態(tài),包括各類服務(wù)、應(yīng)用、硬件等。

在各類應(yīng)用場景中,除了智能家居,汽車產(chǎn)品對于語音交互的需求顯而易見。不論是點(diǎn)擊、滑動(dòng)等觸摸交互方式,在車載環(huán)境下都存在安全隱患且并不高效,語音交互是天然適應(yīng)車載環(huán)境的交互方式。不過想要設(shè)計(jì)、開發(fā)、應(yīng)用一套成熟的車載語音交互系統(tǒng),要翻越重重高峰:行車噪音干擾如何處理、方言口音如何適配、自然的表達(dá)如何更好支持、系統(tǒng)的誤觸發(fā)如何控制在可用范圍。

而隨著用戶對汽車智能化要求的越來越高,更自然的交互成為語音交互的發(fā)展方向。如何讓機(jī)器交互能夠更接近真人交互?多模態(tài)融合理解、自然全雙工對話、自然語義理解成為了新的需要攀登的高峰。

斑馬智行的系統(tǒng)底層——AliOS,在傳統(tǒng)觸控、按鍵交互模式的基礎(chǔ)上,將語音交互能力、視覺交互能力以及場景信息在系統(tǒng)層進(jìn)行融合互通,更大程度得發(fā)揮了各個(gè)交互能力的優(yōu)勢,使得多模態(tài)融合理解、融合交互以及更自然的全雙工對話、擁有更多信號(hào)輸入的自然語義理解成為可能。同時(shí)在各種交互能力融合后對上層應(yīng)用進(jìn)行開放,使得最終呈現(xiàn)給用戶的交互更自然。

語音交互帶來的產(chǎn)業(yè)機(jī)遇方興未艾。如果說,未來的主流交互方式存在多樣的可能性,那更高率、更自然、更接近于人本能的方向一定是人機(jī)交互的未來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)交互
    +關(guān)注

    關(guān)注

    12

    文章

    1217

    瀏覽量

    55563
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31697

    瀏覽量

    270488
收藏 人收藏

    評論

    相關(guān)推薦

    AI如何增強(qiáng)車輛安全性和用戶交互

    人工智能 (AI) 進(jìn)入汽車領(lǐng)域已經(jīng)不再是未來世界才會(huì)出現(xiàn)的情景了。從能夠通過每次車程汲取經(jīng)驗(yàn)的智能導(dǎo)航,到駕駛員與汽車之間的智能交互AI
    的頭像 發(fā)表于 02-08 09:48 ?560次閱讀

    奇瑞iCAR V23搭載思必馳全鏈路智能語音語言交互技術(shù)

    近日,奇瑞汽車旗下備受矚目的A級新能源風(fēng)格越野SUV——iCAR V23正式上市,新車搭載由思必馳提供的全鏈路智能語音語言交互技術(shù),帶來流暢絲滑的交互體驗(yàn),
    的頭像 發(fā)表于 01-14 14:55 ?353次閱讀

    解鎖個(gè)性化語音交互新時(shí)代:九芯智能語音云平臺(tái),創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺(tái)提供全面高效安全的智能語音服務(wù),支持自定義語音內(nèi)容,簡化燒錄流程,依托AI技術(shù),助力各行業(yè)智能化升級,引領(lǐng)語音
    的頭像 發(fā)表于 01-02 16:51 ?205次閱讀
    解鎖個(gè)性化<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新時(shí)代:九芯智能<b class='flag-5'>語音</b>云平臺(tái),<b class='flag-5'>讓</b>創(chuàng)意聲音觸手可及!

    基于語音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,在語音識(shí)別和語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能會(huì)議系統(tǒng)廠商合作,成功將語音識(shí)別技術(shù)在智能
    的頭像 發(fā)表于 12-20 10:35 ?218次閱讀

    基于智能語音交互的智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語音交互技術(shù),它通過集成自然語言處理(NLP)、語音識(shí)別(ASR)和語音合成(TTS)等先進(jìn)技術(shù),實(shí)現(xiàn)了與客戶的智能
    的頭像 發(fā)表于 12-03 16:44 ?397次閱讀
    基于智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機(jī)制

    訊維AI分布式無紙化交互系統(tǒng):突破傳統(tǒng),引領(lǐng)AI智能會(huì)商新革命!

    隨著AI人工智能技術(shù)的大規(guī)模應(yīng)用于發(fā)展,傳統(tǒng)的音視頻會(huì)議系統(tǒng)迎來了又一次歷史變革。雖然目前音視會(huì)議系統(tǒng)已經(jīng)實(shí)現(xiàn)了數(shù)字化,并且具備了一定的智能化與交互能力,也實(shí)現(xiàn)了無紙化綠色辦公,但是在AI智能化
    的頭像 發(fā)表于 11-18 16:53 ?311次閱讀
    訊維<b class='flag-5'>AI</b>分布式無紙化<b class='flag-5'>交互</b>系統(tǒng):突破傳統(tǒng),引領(lǐng)<b class='flag-5'>AI</b>智能會(huì)商新革命!

    聲智科技超低成本部署,打造AI硬件與AI交互產(chǎn)業(yè)生態(tài)

    7月31日,聲智科技在北京·海淀舉行AI媒體溝通會(huì),以“大模型·新交互”為主題,聲智科技副總裁黃赟賀公布了AzeroGPT 的算法技術(shù)升級成果,并發(fā)布了兩款新品——AI 交互新品“千面
    的頭像 發(fā)表于 08-02 10:00 ?718次閱讀

    立功科技ISD智能交互車燈技術(shù)方案

    隨著智能汽車的快速發(fā)展,車燈產(chǎn)業(yè)正在經(jīng)歷從功能車燈向智能車燈轉(zhuǎn)型發(fā)展,ISD智能交互車燈憑借成熟的產(chǎn)業(yè)鏈以及不斷升級的技術(shù)方案,正逐步成為市場主流。本文為大家介紹立功科技ISD智能交互
    的頭像 發(fā)表于 07-18 14:26 ?1338次閱讀
    立功科技ISD智能<b class='flag-5'>交互</b>車燈技術(shù)方案

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    豐富外設(shè)配件 配套多模態(tài)應(yīng)用示例,支持快速上手體驗(yàn)大模型語音交互、智能視覺等 AI 應(yīng)用 板載 DAPLINK 調(diào)試器,外接一條USB 線即可實(shí)現(xiàn)燒錄、調(diào)試、串口日志查看 板載網(wǎng)絡(luò)模組,支持開發(fā)聯(lián)網(wǎng)類
    發(fā)表于 06-18 17:33

    觸翔X86工控主板在交互機(jī)器人中的應(yīng)用

    X86工控主板在交互機(jī)器人中的應(yīng)用主要體現(xiàn)在其高可靠性、抗干擾性和穩(wěn)定性等方面,為交互機(jī)器人的正常運(yùn)行和精確控制提供了有力支持。以下是關(guān)于X86工控主板在
    的頭像 發(fā)表于 05-28 15:48 ?536次閱讀

    智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對話

    隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語音交互技術(shù)也越來越多的在日常工作、生活中應(yīng)用,智能語音交互的出現(xiàn)不僅僅大量節(jié)省了人工的工作時(shí)間提高了工作效率,為人們工作生活帶來便利的同時(shí),也改變
    的頭像 發(fā)表于 05-23 15:16 ?771次閱讀
    智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對話

    智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對話

    智能語音交互技術(shù)是指通過語音識(shí)別、語音合成和自然語言理解等技術(shù),實(shí)現(xiàn)人與機(jī)器之間自然語言的交流和互動(dòng)。隨著現(xiàn)代人工智能在各行業(yè)的普及,智能
    的頭像 發(fā)表于 05-23 15:14 ?442次閱讀

    WTK6900G語音識(shí)別芯片在車載語音交互氛圍燈上的應(yīng)用案例解析

    隨著智能汽車的快速發(fā)展,車載語音交互技術(shù)逐漸成為提升駕駛體驗(yàn)的關(guān)鍵技術(shù)之一。傳統(tǒng)的車載燈光控制系統(tǒng)往往依賴于手動(dòng)操作,不僅操作繁瑣,而且在駕駛過程中容易分散駕駛員的注意力。因此,開發(fā)一種高效、便捷
    的頭像 發(fā)表于 05-17 13:57 ?489次閱讀

    **十萬級口語識(shí)別,離線自然說技術(shù),智能照明懂你**

    自然說技術(shù),用戶不用死記硬背,提供了自然、更靈活、智能的語音交互方式。 方案框圖 在方案設(shè)計(jì)上,啟英泰倫充分考慮了產(chǎn)品功能、復(fù)雜程度和制造成本等因素。通過將
    發(fā)表于 04-29 17:09

    人機(jī)交互的三個(gè)階段 人機(jī)交互的常用方式

    機(jī)交互經(jīng)歷的三個(gè)階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機(jī)交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3402次閱讀
    主站蜘蛛池模板: 天天影视欧美综合在线观看 | 五月婷婷综合激情网 | 一级毛片免费不卡在线视频 | 国产视频综合 | 亚洲成人精品在线 | 国产激烈床戏无遮挡观看 | 免费国产午夜在线观看 | 国产免费的野战视频 | 99久久免费精品国产免费高清 | 在线观看网址你懂得 | 国产精品丝袜在线观看 | 99久久无色码中文字幕 | 久久国产精品岛国搬运工 | 一级毛片免费毛片一级毛片免费 | 亚洲日本一区二区三区在线不卡 | 国产中日韩一区二区三区 | 手机福利片 | 夜夜夜网| 男女交性动态免费视频 | 天天色综合社区 | 色老头网址| 黄色一级a毛片 | 欧美1024性视频 | 午夜cao | 久久鬼| www天天干| 日韩欧美色 | 日韩第五页 | 国产精品夜夜春夜夜爽 | 欧美黑人巨大日本人又爽又色 | 亚洲婷婷在线视频 | 国产精品一久久香蕉产线看 | 亚洲天堂电影在线观看 | 中日韩毛片 | 在线播放免费 | 免费观看a毛片一区二区不卡 | 日本亚洲免费 | 婷婷六月在线 | 在线观看永久免费视频网站 | 国产成年美女毛片80s | 国产成人精品亚洲日本在线 |