谷歌宣布開源Android語音識別轉錄工具 —— Live Transcribe的語音引擎

谷歌在其開源博客中宣布開源 Android 語音識別轉錄工具 —— Live Transcribe 的語音引擎（Live Transcribe Speech Engine），它旨在將語音或對話實時轉錄為文字，還能夠為聽障人士提供幫助。

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 應用程序，它的語音識別由谷歌最先進的 Cloud Speech API 提供。但是，依賴于云引入了一些復雜性，不斷變化的網絡連接、數據成本和延遲的魯棒性等等都帶來一些考驗。因此，谷歌把它開源出來，希望開發人員在已有的基礎上進一步構建和開發。

Cloud Speech API 目前無法支持無限的音頻流，團隊目前采取了一些措施來解決這一難題，例如在達到超時之前關閉并重新啟動流式傳輸請求，這將有效減少會話中丟失的文本量。

無限流媒體音頻帶來了一大挑戰。在許多國家，網絡數據非常昂貴，并且在互聯網較差的地方，帶寬可能有限。Live Transcribe Speech Engine 的團隊對音頻編解碼器進行了大量實驗，并最終在不影響精度的情況下將數據使用量減少了 10 倍。

另外，由于是提供實時語音轉錄，轉錄出來的文本會隨著語音的輸入不斷發生變化，降低延遲自然十分必要。該引擎能夠大大降低延遲率，這都要歸功于它的自定義 Opus 編碼器。

此外，值得一提的是，Live Transcribe 支持超過 70 種語言，并能夠根據語音自動識別語種，其中也包括中文。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

解碼器

解碼器

+關注

關注
9

文章
1173

瀏覽量
41918
谷歌

谷歌

+關注

關注
27

文章
6231

瀏覽量
108007
語音識別

語音識別

+關注

關注
39

文章
1779

瀏覽量
114170

原文標題：【業內熱點】谷歌開源實時語音轉錄引擎 Live Transcribe Speech Engine

文章出處：【微信號：ChinaAET，微信公眾號：電子技術應用ChinaAET】歡迎添加關注！文章轉載請注明出處。

精選推薦
更多

文章

資料

帖子

CW/CCW，無霍爾感應：310V無刷工業高壓風扇驅動方案--【其利天下】

其利天下技術
10小時前

303 閱讀

Allegro Skill工藝輔助之導入疊層模板

凡億PCB
11小時前

342 閱讀

從手寫代碼到AUTOSAR工具鏈：J1939Tp應用篇

ETAS易特馳
11小時前

327 閱讀

樹莓派WiFi設置終極指南：分步方法與故障排除技巧！

上海晶珩電子科技有限公司
12小時前

277 閱讀

安森美EliteSiC MOSFET與柵極驅動器在電動汽車電力系統的應用

安森美
12小時前

440 閱讀

建筑工程測量教材

yezi888
1.44 MB

免費

74下載

路由器常見問題整理

lanlanw
133 KB

免費

45下載

洗衣機控制系統設計原理圖源代碼

o_dream
1.42 MB

免費

54下載

基于SC630A_Typical Application直流到直流單輸出電源的參考設計

劉杰
395.56KB

3積分

11下載

基于OpenHarmony適配移植的對STOMP協議支持長連接收發消息

姚小熊27
0.87 MB

免費

1下載

RK這2款旗艦芯片RK3588 PK RK3576，誰是最優選

瑞芯微方案開發老王
1天前

168 閱讀

無位置傳感器無刷直流電機的＋FPGA＋控制實現

jf_89421697
1天前

206 閱讀

【RK3568+PG2L50H開發板實驗例程】FPGA部分 | 光纖通信測試實驗例程

jf_10450402
1天前

343 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）UI生成

李洋水蛟龍
1天前

302 閱讀

【匯思博SEEK100開發板試用體驗】05 天氣app開發--支持24小時+7天天氣預報

jf_83922529
3天前

285 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

谷歌宣布開源Android語音識別轉錄工具 —— Live Transcribe的語音引擎

評論