美國(guó)專(zhuān)利商標(biāo)局(USPTO)授予Microsoft的一項(xiàng)新專(zhuān)利表明,該公司正在開(kāi)發(fā)能夠反映用戶(hù)對(duì)話(huà)風(fēng)格和/或面部表情的對(duì)話(huà)代理。專(zhuān)利- 語(yǔ)言風(fēng)格匹配代理 -于2020年9月3日授予Microsoft,并以發(fā)明者Daniel J McDuff,Kael R. Rowan,Mary P Czerwinski,Deepali Aneja和Rens Hoegen稱(chēng)號(hào)。
隨著語(yǔ)音識(shí)別和生成對(duì)話(huà)模型的發(fā)展,諸如聊天機(jī)器人和虛擬代理之類(lèi)的對(duì)話(huà)界面正變得越來(lái)越流行。盡管這種自然語(yǔ)言的交互導(dǎo)致了人機(jī)交互的發(fā)展,但這種交流大多是單調(diào)的且受約束的。因此,這些對(duì)話(huà)最終只是事務(wù)性的,并不是很自然。
這項(xiàng)新的專(zhuān)利技術(shù)旨在帶來(lái)一種基于端到端基于語(yǔ)音的對(duì)話(huà)代理,該對(duì)話(huà)代理可以進(jìn)行更自然,多輪回的對(duì)話(huà),從而與用戶(hù)的對(duì)話(huà)風(fēng)格和面部表情保持一致。
被實(shí)現(xiàn)為僅語(yǔ)音的代理或用臉部體現(xiàn)的會(huì)話(huà)代理可以與用戶(hù)的語(yǔ)音和面部表情匹配。可以通過(guò)識(shí)別用戶(hù)語(yǔ)音的韻律特征并為具有相同或相似特征的虛擬代理合成語(yǔ)音來(lái)實(shí)現(xiàn)會(huì)話(huà)代理的語(yǔ)言樣式匹配。用戶(hù)的面部表情可以通過(guò)具體化的對(duì)話(huà)代理的臉部來(lái)識(shí)別和模仿。虛擬代理的發(fā)言可以基于預(yù)定的腳本響應(yīng)和由機(jī)器學(xué)習(xí)技術(shù)生成的開(kāi)放式響應(yīng)的組合。與用戶(hù)的會(huì)話(huà)風(fēng)格和面部表情保持一致的會(huì)話(huà)代理可能會(huì)被認(rèn)為更值得信賴(lài),更容易理解,
對(duì)話(huà)代理可以是純音頻的,也可以是體現(xiàn)的,這意味著它具有看起來(lái)像在說(shuō)話(huà)的“臉”。在這兩種實(shí)現(xiàn)方式中,代理可以使用機(jī)器學(xué)習(xí)技術(shù),并以自然且可理解的方式響應(yīng)用戶(hù)的話(huà)語(yǔ),從而整體上改善人機(jī)交互。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1239瀏覽量
56238 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
39文章
1774瀏覽量
113975 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
12726
發(fā)布評(píng)論請(qǐng)先 登錄
一文帶你厘清自動(dòng)駕駛端到端架構(gòu)差異

小米汽車(chē)端到端智駕技術(shù)介紹

端到端自動(dòng)駕駛技術(shù)研究與分析
階躍星辰發(fā)布國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型
準(zhǔn)確性超Moshi和GLM-4-Voice,端到端語(yǔ)音雙工模型Freeze-Omni

端到端已來(lái),智駕仿真測(cè)試該怎么做?

爆火的端到端如何加速智駕落地?

連接視覺(jué)語(yǔ)言大模型與端到端自動(dòng)駕駛

Mobileye端到端自動(dòng)駕駛解決方案的深度解析

端到端測(cè)試用例怎么寫(xiě)
端到端測(cè)試不正常如何處理
實(shí)現(xiàn)自動(dòng)駕駛,唯有端到端?

評(píng)論