Mozilla 宣布它正在使其眾包項目 Common Voice 支持更多語言。Common Voice 是一個旨在創建開源語音識別數據集的項目,于去年6月發布,它邀請來自世界各地的志愿者通過網絡和移動應用程序,用他們的聲音記錄文本片段。
業內普遍認為語音將成為下一個重要的技術平臺,近年來隨著人工智能理論與技術的迅猛發展,語音識別技術在不斷突破,通過語音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司將收集到的用戶語音數據歸為公司自己所有,這些數據的價值或許目前很難被外界看出來,但是在信息化高度發達,特別是今天這樣一個大數據和人工智能時代,為開發機器學習模型提供語音數據集怎么看都是一件有深遠意義的事,這些語音數據的意義會慢慢體現。
而最終當它們的價值逐漸顯現,人們會發現在這背后亞馬遜、谷歌、蘋果和微軟等公司已經牢牢鎖住了語音技術的命門,主導了這場語音市場之爭。
Common Voice 項目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語音數據集開源給公眾,使得任何人都可以自由使用這些數據集來將語音識別技術智能地構建到各種應用程序和服務中。Mozilla 已經在去年11月公布了 Common Voice 英語數據集的第一批成果,其中收錄了20000個人錄制的40萬個錄音、大約500小時的演講。此次 Mozilla 又宣布它正式開始收集法語、德語和威爾士語三種語言的語音數據,同時也在為收集另外40種語言做準備,巴西葡萄牙語、印度尼西亞語、波蘭語和荷蘭語等已經準備好啟動眾包語音數據收集。
Mozilla 首席創新官 Katharina Borchert 在他的博客中寫到:“我們希望用戶使用自己的語言甚至方言的時候是可以被機器理解的,但是我們相信這些技術上的接口不應該由少數幾家公司控制,他們不能像守門員一樣來完全把控語音服務。”
Common Voice 項目的意義與用于打擊私人平臺的開放許可證項目類似,OpenStreetMap 就是一個很好的例子。OpenStreetMap 為開發者提供了開放且可自由使用的世界地圖,使得開發商不再需要依賴于 Google Maps 這樣的競爭對手,不僅降低了成本開銷,技術上也不再受到限制。
“使用多種語言標志著 Common Voice 邁出了重要的一步,我們希望它對整體語音技術來說也是一大步”,Mozilla Common Voice 項目的數字策略師 Michael Henretty 補充到:“語音技術的民主化不僅會降低全球創新的障礙,也會讓人們獲取信息更加便捷。”
-
Mozilla
+關注
關注
0文章
50瀏覽量
11363 -
語音識別
+關注
關注
39文章
1770瀏覽量
113710
原文標題:打破語音壟斷 Mozilla Common Voice 支持更多語言
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Meta與UNESCO合作推動多語言AI發展
微軟Copilot Voice升級,積極拓展多語言支持
ChatGPT 的多語言支持特點
科大訊飛發布訊飛星火4.0 Turbo大模型及星火多語言大模型
離線語音控制技術特點

評論