玄幻小说,我欲封天txt下载,大主宰之灵路天蚕土豆

Google最新推出的音頻編解碼器Lyra，不僅實現了以每秒3kb網絡寬帶提供聽起來自然清晰的語音聊天，還可以在僅90ms延遲的情況下在從高端云服務器到中端智能手機的任何設備上運行。

2月25日，Google AI blog發布了一篇文章詳細的介紹了最新推出的Lyra——一種用于語音壓縮的新型超低比特率編解碼器。該編解碼器使Google Duo，以及未來的其他應用程序能夠以每秒3kb的網絡寬帶提供聽起來很自然清晰的語音聊天。

眾所周知，人們對實時音視頻的需求不斷增加。特別是去年由于受到疫情的影響，許多人不得不隔離在家，只能與親朋好友通過視頻通話的方式保持聯系。例如，僅去年一年Google Duo和Meet就承載了超過1萬億分鐘的視頻。而這些情況無疑是給全球的互聯網基礎設施帶來了巨大的挑戰。除此之外，雖然有些人可以使用一致的高質量，高速網絡，但這種連接并不普遍。比如在網絡通信并不發達的農村地區。然而，盡管在連接良好的地區，人們有時也會遇到質量差、帶寬低的問題。那么如何在有限的帶寬下實現高質量的音頻輸出就成為了目前最重要的議題。

Lyra音頻編解碼器

因此，Google推出了一種高質量、低比特率的新型音頻編解碼器——Lyra。盡管用戶在網速很慢的情況下，也能進行語音聊天。Lyra編解碼器的基本結構體系非常簡單，如上圖所示。而Lyra與其他音頻編解碼器的不同之處在于：它利用機器學習模型，開發了一種新的模型，能夠使用最少的數據來重建語音。這種模型不僅能夠區分信號，還能生成全新的信號。與之相比，傳統的參數編解碼器只從語音中提取關鍵參數，然后用于在接收端重建信號。雖然實現低比特率，但得到的音頻通常聽起來很機械，不自然。而Lyra利用這些新的自然聲生成模型，即能夠保持參數編解碼器的低比特率，同時又能實現高質量的音頻輸出。這與目前大多流媒體平臺中使用的波形編解碼器幾乎不相上下。更重要的是，Lyra的效率足夠高，可以在僅90ms延遲的情況下在從高端云服務器到中端智能手機的任何設備上運行。

與現有編解碼器對比

Lyra目前被設計運行在3kbps情況下，聽力測試表明，Lyra的表現優于任何其他編解碼器。并且優于在相同8kbps情況下的Opus，從而實現了超過60%的帶寬減少。Lyra可以在帶寬條件不適合高比特率和現有的低比特率編解碼器不能提供足夠質量的情況下使用，這是它的一大優勢，也是解決現在低音頻質量的方案。

以下是Lyra與現有編解碼器的對比：

在安靜的環境下：

Original原始音頻

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈雜的環境下：

Original原始音頻

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra與Opus、Speex分別以6kbps和3kbps，對同一音頻的壓縮質量對比。能夠明顯感受到即使Lyra在3kbps情況下，自然語音音頻的清晰程度也遠優于Opus在6kbps下的情況。

適用情況

Google已經利用開源音頻庫對Lyra使用超過70種語言的揚聲器進行了數千小時的音頻培訓，然后與專家和來自廣泛的聽眾一起驗證音頻質量。Lyra在一個廣泛的數據集中訓練，包括大量不同語言的使用者，以確保編解碼器能夠應對各種情況。另外，Lyra還可以在云環境中使用，以方便使用各種網絡和設備的用戶能夠無縫對接聊天。不僅如此，Google還將Lyra與新的視頻壓縮技術（例如AV1）配對后，即使用戶通過56kbps撥號調制調節器連接到Internet，也可以進行視頻聊天。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴