2月24日消息,為了擴(kuò)展AI語(yǔ)音服務(wù)的市場(chǎng),谷歌除了加強(qiáng)語(yǔ)音辨識(shí)模型、語(yǔ)言支持?jǐn)?shù)量和聲音種類之外,也調(diào)整了語(yǔ)音服務(wù)的價(jià)格。
谷歌更新文字轉(zhuǎn)語(yǔ)音和語(yǔ)音轉(zhuǎn)文字服務(wù),除了優(yōu)化語(yǔ)音辨識(shí)模型、新支持7種語(yǔ)言和31種聲音之外,也調(diào)整了語(yǔ)音服務(wù)的價(jià)格,在特定的應(yīng)用情境中,用戶最多可以省下約50%的支出,而谷歌也提供每月前60分鐘免費(fèi)的語(yǔ)言轉(zhuǎn)文字服務(wù)。
谷歌指出,語(yǔ)音辨識(shí)和生成技術(shù)在人機(jī)互動(dòng)的應(yīng)用中非常關(guān)鍵,要讓人機(jī)互動(dòng)更加自然、簡(jiǎn)單且普遍,并不容易,即便使用準(zhǔn)確度高達(dá)90%的語(yǔ)音辨識(shí)模型,還是很難真正達(dá)到有效的對(duì)話,由于許多企業(yè)的語(yǔ)音辨識(shí)模型都是要在電話中運(yùn)行,受到噪音的干擾,產(chǎn)生的文字資訊讓模型難以處理,谷歌于去年4月針對(duì)這種應(yīng)用場(chǎng)景推出電話和影片的語(yǔ)音轉(zhuǎn)文字服務(wù)。
經(jīng)過(guò)不斷優(yōu)化,現(xiàn)在電話的文字錯(cuò)誤已降低了62%,而影片的語(yǔ)音轉(zhuǎn)文字模型錯(cuò)誤率也降低了64%,除此之外,影片的語(yǔ)音轉(zhuǎn)文字模型在辨識(shí)多個(gè)說(shuō)話者的情境中,像是會(huì)議或是廣播,也有很好的表現(xiàn)。
在價(jià)格方面,為了吸引更多用戶,谷歌將影片語(yǔ)音轉(zhuǎn)文字模型收費(fèi)調(diào)降了25%,而在標(biāo)準(zhǔn)和影片模型服務(wù)中,選擇加入資料收集計(jì)畫的用戶,收費(fèi)價(jià)格會(huì)減少33%,因此,若使用影片模型且選擇加入收集資料計(jì)畫的用戶,將能夠減少約50%的支出。
此外,支持的語(yǔ)言也是企業(yè)使用語(yǔ)音轉(zhuǎn)文字辨識(shí)模型的一大考量,現(xiàn)在谷歌新增了7個(gè)語(yǔ)言和方言,包含丹麥語(yǔ)、葡萄牙語(yǔ)、俄語(yǔ)、波蘭語(yǔ)、斯洛伐克語(yǔ)、烏克蘭語(yǔ)和挪威語(yǔ),加上上述新增的語(yǔ)言,目前總共支持持21種語(yǔ)言,這些新增的語(yǔ)言都還是測(cè)試版。在語(yǔ)音生成模型方面,谷歌的語(yǔ)音生成系統(tǒng)WaveNet也新增了31種聲音,目前總共有包含21種語(yǔ)言的57種聲音。
發(fā)布評(píng)論請(qǐng)先 登錄
正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長(zhǎng)效續(xù)航,語(yǔ)音暢聊,情景對(duì)話,知識(shí)科普,多色可選,隨身攜帶!
90元打造小智AI腕表,語(yǔ)音交互超有趣!
正點(diǎn)原子ESP32S3系列開發(fā)板全面支持小智AI
大語(yǔ)言模型開發(fā)語(yǔ)言是什么
串口屏支持哪些編程語(yǔ)言和開發(fā)環(huán)境?

評(píng)論