小说阅读网站,魔天记忘语小说,遮天

Mozilla 宣布它正在使其眾包項目 Common Voice 支持更多語言。Common Voice 是一個旨在創(chuàng)建開源語音識別數(shù)據(jù)集的項目，于去年6月發(fā)布，它邀請來自世界各地的志愿者通過網(wǎng)絡(luò)和移動應(yīng)用程序，用他們的聲音記錄文本片段。

業(yè)內(nèi)普遍認為語音將成為下一個重要的技術(shù)平臺，近年來隨著人工智能理論與技術(shù)的迅猛發(fā)展，語音識別技術(shù)在不斷突破，通過語音助手如 Alexa、Google Assistant、Siri 和 Cortana，各公司將收集到的用戶語音數(shù)據(jù)歸為公司自己所有，這些數(shù)據(jù)的價值或許目前很難被外界看出來，但是在信息化高度發(fā)達，特別是今天這樣一個大數(shù)據(jù)和人工智能時代，為開發(fā)機器學(xué)習(xí)模型提供語音數(shù)據(jù)集怎么看都是一件有深遠意義的事，這些語音數(shù)據(jù)的意義會慢慢體現(xiàn)。

而最終當(dāng)它們的價值逐漸顯現(xiàn)，人們會發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋果和微軟等公司已經(jīng)牢牢鎖住了語音技術(shù)的命門，主導(dǎo)了這場語音市場之爭。

Common Voice 項目就是為了避免這樣的事情而誕生的，它的目的是將收集到的語音數(shù)據(jù)集開源給公眾，使得任何人都可以自由使用這些數(shù)據(jù)集來將語音識別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。Mozilla 已經(jīng)在去年11月公布了 Common Voice 英語數(shù)據(jù)集的第一批成果，其中收錄了20000個人錄制的40萬個錄音、大約500小時的演講。此次 Mozilla 又宣布它正式開始收集法語、德語和威爾士語三種語言的語音數(shù)據(jù)，同時也在為收集另外40種語言做準(zhǔn)備，巴西葡萄牙語、印度尼西亞語、波蘭語和荷蘭語等已經(jīng)準(zhǔn)備好啟動眾包語音數(shù)據(jù)收集。

Mozilla 首席創(chuàng)新官 Katharina Borchert 在他的博客中寫到：“我們希望用戶使用自己的語言甚至方言的時候是可以被機器理解的，但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制，他們不能像守門員一樣來完全把控語音服務(wù)?！?/p>

Common Voice 項目的意義與用于打擊私人平臺的開放許可證項目類似，OpenStreetMap 就是一個很好的例子。OpenStreetMap 為開發(fā)者提供了開放且可自由使用的世界地圖，使得開發(fā)商不再需要依賴于 Google Maps 這樣的競爭對手，不僅降低了成本開銷，技術(shù)上也不再受到限制。

“使用多種語言標(biāo)志著 Common Voice 邁出了重要的一步，我們希望它對整體語音技術(shù)來說也是一大步”，Mozilla Common Voice 項目的數(shù)字策略師 Michael Henretty 補充到：“語音技術(shù)的民主化不僅會降低全球創(chuàng)新的障礙，也會讓人們獲取信息更加便捷。”

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴