研討會預(yù)告 | 使用 Transducer 模型優(yōu)化語音識別結(jié)果

在 ASR 自動語音識別領(lǐng)域，基于 CTC 的聲學(xué)模型不再需要對訓(xùn)練的音頻序列和文本序列進行強制對齊，實際上已經(jīng)初步具備了端到端的聲學(xué)模型建模能力。但是 CTC 模型進行聲學(xué)建模存在著兩個嚴重的瓶頸，一是缺乏語言模型建模能力，不能整合語言模型進行聯(lián)合優(yōu)化，二是 CTC 有一個不合理的假設(shè)：標簽相互獨立，這個基本假設(shè)與語音識別任務(wù)之間存在著一定程度的背離，因為在語言系統(tǒng)中存在語境的上下文關(guān)系。因此針對 CTC 的不足，Transducer 模型可以彌補這種不合理的假設(shè)，解決 CTC 的問題。

3 月 9 日，NVIDIA 企業(yè)開發(fā)者社區(qū)經(jīng)理李奕澎將面向有 NLP 和 Speech AI 開發(fā)需求的開發(fā)者，在本次研討會中重點討論 Transducer 模型，并通過代碼來訓(xùn)練和評估 Transducer 模型。

Transducer 模型在自動語音識別中的應(yīng)用 – NVIDIA NeMo 代碼解析

3 月 9 日，星期四，20:00 - 21:30

主要內(nèi)容：

本次網(wǎng)絡(luò)研討會主要面向有 NLP 和 Speech AI 開發(fā)需求的開發(fā)者。通過本次網(wǎng)絡(luò)研討會，您可以獲得以下信息：

Transducer 介紹
Transducer loss 的優(yōu)勢和局限
Transducer 的模型架構(gòu)
ContextNet 的模型架構(gòu)
Transducer 模型的訓(xùn)練和評估

演講嘉賓

李奕澎 | NVIDIA 企業(yè)開發(fā)者社區(qū)經(jīng)理

擁有多年數(shù)據(jù)分析建模、人工智能自然語言處理開發(fā)經(jīng)驗。在自動語音識別、自然語言處理、語音合成等對話式 AI 技術(shù)領(lǐng)域有豐富的實戰(zhàn)經(jīng)驗與見解。曾開發(fā)法律、金融、保險文檔中基于實體抽取的智能問答系統(tǒng)，曾開發(fā)基于 NLP 知識抽取，KG 知識圖譜的建立的科研文檔智能檢索系統(tǒng)。

參與方式

識別二維碼注冊本次研討會

相關(guān)資料

識別二維碼了解 NVIDIA NeMo 更多信息

點擊 “閱讀原文” 或掃描下方海報二維碼，即可免費注冊 GTC23，在 3 月 24 日聽 OpenAI 聯(lián)合創(chuàng)始人與 NVIDIA 創(chuàng)始人的爐邊談話，將由 NVIDIA 專家主持，配中文講解和實時答疑，一起看 AI 的現(xiàn)狀和未來！

原文標題：研討會預(yù)告 | 使用 Transducer 模型優(yōu)化語音識別結(jié)果

文章出處：【微信公眾號：NVIDIA英偉達】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英偉達

英偉達

+關(guān)注

關(guān)注
22

文章
3927

瀏覽量
93285

原文標題：研討會預(yù)告 | 使用 Transducer 模型優(yōu)化語音識別結(jié)果

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot VR、AR與MR的發(fā)展歷史以及商業(yè)應(yīng)用實例
Hot NVIDIA RTX與GTX的區(qū)別是什么？

New NVIDIA AI技術(shù)助力歐洲醫(yī)療健康行業(yè)發(fā)展
New 全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

精選推薦
更多

文章

資料

帖子

Allegro Skill布線功能--過孔助手

凡億PCB
1小時前

85 閱讀

技術(shù)資訊 I 如何在 PCB 中降低 EMI 并優(yōu)化 EMC？

深圳(耀創(chuàng))電子科技有限公司
1天前

183 閱讀

當工業(yè)設(shè)備開始“思考”：HZ-RK3576-SP_EVM如何讓傳統(tǒng)工業(yè)行業(yè)煥發(fā)智能新生？

合眾恒躍
1天前

762 閱讀

樹莓派5上的Gemma 2：如何打造高效的邊緣AI解決方案？

上海晶珩電子科技有限公司
2天前

464 閱讀

新品 | 視美泰發(fā)布高性價比四核工控主板GK-68A，開啟智能工業(yè)新時代！

視美泰
2天前

660 閱讀

鴻蒙第三方組件適配移植的滑動驗證碼教程

姚小熊27
7.33 MB

免費

1下載

Google開源地圖項目OSMDroid-ohos教程

姚小熊27
3.02 MB

免費

7下載

ohmyiterm2快速安裝一個iTerm2

王娟
24.68 MB

免費

0下載

SMD 555定時器鋼琴設(shè)計案例

石玉蘭
0.02 MB

2積分

5下載

車規(guī)級數(shù)字功放一體成型電感VSAD0660-3R3M數(shù)據(jù)手冊

CODACA科達嘉電感
1.22 MB

免費

0下載

【正點原子STM32MP257開發(fā)板試用】基于 YOLO 模型的物體識別

jf_07365693
1天前

348 閱讀

【正點原子STM32MP257開發(fā)板試用】基于 MobileNet 的物體識別

jf_07365693
2天前

341 閱讀

【RA4L1-SENSOR】07 低功耗待機模式及功耗實測

jf_83922529
2天前

1045 閱讀

ArkUI-X平臺橋接Bridge說明

jf_14971143
3天前

689 閱讀

電容三點式無法起振的原因

jf_01102310
3天前

1991 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

研討會預(yù)告 | 使用 Transducer 模型優(yōu)化語音識別結(jié)果

評論