為了到2025年實(shí)現(xiàn)采用人工智能(AI)的實(shí)時(shí)同聲傳譯,日本正推進(jìn)研究。目前已完全可以實(shí)現(xiàn)語音識(shí)別,以后的目標(biāo)是提高翻譯準(zhǔn)確率和速度。世界上有很多和日語具有相同特征的語言,如果能實(shí)現(xiàn)日語的同聲傳譯,就有望推進(jìn)國際性普及。
演講者用英語做大約1分鐘的演講,背后的屏幕上顯示出基于AI的日語同聲傳譯。這是日本情報(bào)通信研究機(jī)構(gòu)(NICT,注:日語的“情報(bào)”有“信息”之意)2020年11月舉行的發(fā)布會(huì)上的一幕。從演講者發(fā)言到出現(xiàn)譯文大約需要10秒,但幾乎沒有翻譯錯(cuò)誤。
同聲傳譯一般是對(duì)說話內(nèi)容進(jìn)行語音識(shí)別,然后由使用AI的翻譯軟件將其轉(zhuǎn)換成其他語言。現(xiàn)有的服務(wù)大多是從說完話才開始翻譯。因此,語速快的對(duì)話很難翻譯,表達(dá)相同的內(nèi)容時(shí),同聲傳譯所用時(shí)間是母語會(huì)話時(shí)間的2倍。按這樣的水平很難用于商務(wù)用途,亟需可以克服這一缺點(diǎn)的技術(shù)。
現(xiàn)在同聲傳譯的翻譯準(zhǔn)確率提高,但存在延時(shí)
日本情報(bào)通信研究機(jī)構(gòu)通過2019年度之前的日本國家研究項(xiàng)目,已在語音識(shí)別方面實(shí)現(xiàn)了充分的性能。該機(jī)構(gòu)的目標(biāo)是從2020年度開始兼顧翻譯準(zhǔn)確率和速度。發(fā)布會(huì)上有10秒的延時(shí),但今后有望縮小到跟同聲傳譯人員相當(dāng)?shù)?、3秒。
日本情報(bào)通信研究機(jī)構(gòu)開發(fā)的是在發(fā)言過程中就可以開始翻譯的AI。斷句的預(yù)處理技術(shù)是其中的關(guān)鍵。
翻譯軟件由斷句的預(yù)處理和對(duì)句子進(jìn)行翻譯的翻譯引擎構(gòu)成。現(xiàn)有技術(shù)要想順暢翻譯,只能以句子單位進(jìn)行斷句,因此會(huì)有延時(shí)。如果在說完話之前就開始翻譯,則可以縮短時(shí)差。
日本情報(bào)通信研究機(jī)構(gòu)在預(yù)處理中采用按“語塊”(chunk,或稱:語義塊)斷句的方法,比以句子為單位斷句翻譯得更精準(zhǔn)。專業(yè)的同聲傳譯人員也使用這種方法。這樣可以保證翻譯準(zhǔn)確度,并減少延時(shí)。
日本情報(bào)通信研究機(jī)構(gòu)在開發(fā)中將使用大量的數(shù)據(jù)。該機(jī)構(gòu)在2021年度末之前,將從同聲傳譯人員等手中收集劃分語義的位置及其譯文的數(shù)據(jù)。2022年度將開發(fā)按照語義斷句并翻譯的AI。
與英譯日相比,日譯英的同聲傳譯難度更高。因?yàn)閿嗑涞念A(yù)處理比較難。
在日語中,動(dòng)詞及表示否定等的重要詞語出現(xiàn)在句尾,因此需要預(yù)讀,然后進(jìn)行翻譯。而動(dòng)詞等關(guān)鍵詞語在句子前半部分出現(xiàn)的英語等更好翻譯。在日語中,句子省略主語的情況也很多,AI要補(bǔ)充完整句子以后再翻譯,因此容易出錯(cuò)。
為了防止誤譯,需要進(jìn)行修正的技術(shù)。比如提前給AI提供演講內(nèi)容相關(guān)數(shù)據(jù),讓它進(jìn)行學(xué)習(xí),它就能夠讀懂后面要說的話,從而更準(zhǔn)確地完成同聲傳譯。
日本情報(bào)通信研究機(jī)構(gòu)還將改進(jìn)翻譯引擎。通過日英、英日及所有語言翻譯都使用的技術(shù)來控制翻譯準(zhǔn)確度。如果這項(xiàng)性能不高,即使預(yù)處理速度再快、修正功能出色,也起不到作用。
日本情報(bào)通信研究機(jī)構(gòu)的翻譯引擎除了市售的便攜式翻譯機(jī)以外,還被松下、NTT docomo及NEC等的語音翻譯服務(wù)采用。該機(jī)構(gòu)的研究員隅田英一郎自信地說“英日翻譯準(zhǔn)確率換算成托業(yè)考試(TOEIC)分?jǐn)?shù)的話,相當(dāng)于900分左右”。
在提高翻譯準(zhǔn)確率方面值得期待的是,得到美國特斯拉首席執(zhí)行官(CEO)馬斯克等人資助的研究企業(yè)OpenAI在2020年6月公布了語言AI“GPT-3”。這款A(yù)I可以寫出跟人水平接近的比較自然的文章。
GPT-3利用巨大的“大腦”學(xué)習(xí)大量文件,獲得了很強(qiáng)的能力。開發(fā)中使用的數(shù)據(jù)相當(dāng)于數(shù)千億詞匯量。如果能在翻譯引擎中應(yīng)用GPT-3的系統(tǒng),就有可能大幅提高性能。
圍繞同聲傳譯,全球的大型IT企業(yè)都在競爭,不過日本情報(bào)通信研究機(jī)構(gòu)仍有勝算。隅田研究員指出“美國微軟、中國百度及美國谷歌都是以句子為單位進(jìn)行斷句,以語塊斷句的方法尚未取得成果。都在同一水平上”。各公司都在下力氣開發(fā)的中英語同聲傳譯也跟日本情報(bào)通信研究機(jī)構(gòu)開發(fā)一樣,存在10秒左右的延時(shí)。
如果能實(shí)現(xiàn)日語翻成其他主要語言的同聲傳譯,在國際上就會(huì)占據(jù)優(yōu)勢。
英語、中文及法語等使用人數(shù)較多的語言都是動(dòng)詞跟在名詞后面的類型。占到全球語言的約4成。其實(shí),世界上有一半語言和日語一樣,把動(dòng)詞放在句尾。同類型的語言之間更容易實(shí)現(xiàn)同聲傳譯。如果在不同類型語言之間的同聲傳譯方面,能開發(fā)出優(yōu)異的技術(shù),則有可能應(yīng)用于9成的語言。
責(zé)任編輯:xj
-
AI
+關(guān)注
關(guān)注
88文章
34421瀏覽量
275747 -
人工智能
+關(guān)注
關(guān)注
1804文章
48788瀏覽量
246956 -
翻譯
+關(guān)注
關(guān)注
0文章
47瀏覽量
10969
發(fā)布評(píng)論請先 登錄
工業(yè)通信界的“月老”:CC\\-Link IE和DeviceNet如何牽起機(jī)器人的“紅線”
亮相深圳文博會(huì),時(shí)空壺的“AI同傳”實(shí)力震驚在場老外

華為AI Calling同聲傳譯如何改變游客體驗(yàn)
2025年開啟AI智能體規(guī)模應(yīng)用
華為AI Calling同聲傳譯亮相MWC 2025
AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
Auracast廣播音頻創(chuàng)新實(shí)時(shí)語言翻譯解決方案
NVIDIA展望2025年AI的應(yīng)用前景
中科創(chuàng)達(dá)RUBIK AI Glass Lite版預(yù)計(jì)2025年實(shí)現(xiàn)量產(chǎn)
AI加速采用推動(dòng)存儲(chǔ)器市場2025年顯著增長
NVIDIA AI正加速推進(jìn)藥物研發(fā)
廣州市積極推進(jìn)新型儲(chǔ)能產(chǎn)業(yè) 儲(chǔ)能產(chǎn)業(yè)到2025年力爭達(dá)600億元以上
美光預(yù)測AI需求將大幅增長,計(jì)劃2025年投產(chǎn)EUV DRAM
AI同聲傳譯技術(shù)的新興力量知了未來已推動(dòng)跨語言溝通革新
AI同聲傳譯讓你瞬間掌握60種語言的那一天會(huì)發(fā)生什么事情?

評(píng)論