谷歌推出了一項新技術(shù),當(dāng)服務(wù)無法維持穩(wěn)定的WaveNetEQ連接時,可以提高Duo通話的音頻質(zhì)量。它是基于谷歌的DeepMind部門的技術(shù),該部門的目標(biāo)是用人工噪音代替音頻抖動,這種噪音聽起來就像人類說話一樣,是通過機(jī)器學(xué)習(xí)產(chǎn)生的。
如果你曾經(jīng)在網(wǎng)上打過電話,那么你很有可能經(jīng)歷過音頻抖動。當(dāng)作為調(diào)用的一部分發(fā)送的音頻數(shù)據(jù)包在傳輸過程中丟失,或出現(xiàn)延遲或順序錯誤時,就會發(fā)生這種情況。谷歌說99%的Duo呼叫都經(jīng)歷過數(shù)據(jù)包丟失:20%的丟失超過3%的音頻,10%的丟失超過8%。有很多音頻需要替換。
每個呼叫應(yīng)用程序都必須以某種方式處理這種丟包,但谷歌表示,這些丟包隱藏(PLC)過程可能很難填補(bǔ)60毫秒或更長的空白,聽起來既不像機(jī)器人,也不重復(fù)。WaveNetEQ的解決方案是基于DeepMind的神經(jīng)網(wǎng)絡(luò)技術(shù),它已經(jīng)對來自48種不同語言的100多個使用者的數(shù)據(jù)進(jìn)行了訓(xùn)練。
將WaveNetEQ與NetEQ(一種常用的PLC技術(shù))進(jìn)行了比較。嘗試替換60ms丟包時的聲音。不過,這個系統(tǒng)可以替換的音頻是有限制的。谷歌的技術(shù)旨在取代短音,而不是完整的單詞。因此,120毫秒后,它會逐漸消失,并產(chǎn)生靜音。谷歌說,它對系統(tǒng)進(jìn)行了評估,以確保沒有引入任何重要的新聲音。另外,所有的處理都需要在設(shè)備上進(jìn)行,因為谷歌Duo調(diào)用默認(rèn)是端到端加密的。一旦通話的真實音頻恢復(fù),WaveNetEQ將無縫地回到現(xiàn)實中。
這是一個巧妙的小技術(shù),當(dāng)互聯(lián)網(wǎng)讓他們失望時,打電話應(yīng)該更容易理解。由于Pixel 4手機(jī)在12月的功能下降,該技術(shù)已經(jīng)可以用于在Pixel 4手機(jī)上撥打Duo電話。谷歌表示,它正在將這項技術(shù)推廣到其他未命名的手機(jī)上。
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
108089 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103539
發(fā)布評論請先 登錄
LE-Audio是什么?
東芝推出兩項創(chuàng)新技術(shù)提升碳化硅功率器件性能

如何提高嵌入式代碼質(zhì)量?
即時通話軟件音頻傳輸質(zhì)量測試方案

AMD獲得一項玻璃基板技術(shù)專利
谷歌云宣布一項重要人事任命
英飛凌推出SECORA Pay Green技術(shù),引領(lǐng)支付卡綠色革命
Auracast廣播音頻改裝指南
ip網(wǎng)絡(luò)音頻終端是什么
摩爾線程正式開源音頻理解大模型MooER
蘋果獲得一項突破性智能戒指技術(shù)的專利
谷歌推出Gemini Live,開啟AI語音聊天新紀(jì)元
高質(zhì)量激光光束光學(xué)系統(tǒng)中的空間濾波
谷歌獲Character.AI大模型技術(shù)授權(quán),創(chuàng)始人重歸谷歌懷抱
星閃,一項迫于無奈的創(chuàng)新技術(shù)

評論