在 ASR 自動語音識別領(lǐng)域,基于 CTC 的聲學(xué)模型不再需要對訓(xùn)練的音頻序列和文本序列進行強制對齊,實際上已經(jīng)初步具備了端到端的聲學(xué)模型建模能力。但是 CTC 模型進行聲學(xué)建模存在著兩個嚴重的瓶頸,一是缺乏語言模型建模能力,不能整合語言模型進行聯(lián)合優(yōu)化,二是 CTC 有一個不合理的假設(shè):標簽相互獨立,這個基本假設(shè)與語音識別任務(wù)之間存在著一定程度的背離,因為在語言系統(tǒng)中存在語境的上下文關(guān)系。因此針對 CTC 的不足,Transducer 模型可以彌補這種不合理的假設(shè),解決 CTC 的問題。
3 月 9 日,NVIDIA 企業(yè)開發(fā)者社區(qū)經(jīng)理李奕澎將面向有 NLP 和 Speech AI 開發(fā)需求的開發(fā)者,在本次研討會中重點討論 Transducer 模型,并通過代碼來訓(xùn)練和評估 Transducer 模型。
Transducer 模型在自動語音識別中的應(yīng)用 – NVIDIA NeMo 代碼解析

3 月 9 日,星期四,20:00 - 21:30
主要內(nèi)容:
本次網(wǎng)絡(luò)研討會主要面向有 NLP 和 Speech AI 開發(fā)需求的開發(fā)者。通過本次網(wǎng)絡(luò)研討會,您可以獲得以下信息:
Transducer 介紹
Transducer loss 的優(yōu)勢和局限
Transducer 的模型架構(gòu)
ContextNet 的模型架構(gòu)
Transducer 模型的訓(xùn)練和評估
演講嘉賓

李奕澎 | NVIDIA 企業(yè)開發(fā)者社區(qū)經(jīng)理
擁有多年數(shù)據(jù)分析建模、人工智能自然語言處理開發(fā)經(jīng)驗。在自動語音識別、自然語言處理、語音合成等對話式 AI 技術(shù)領(lǐng)域有豐富的實戰(zhàn)經(jīng)驗與見解。曾開發(fā)法律、金融、保險文檔中基于實體抽取的智能問答系統(tǒng),曾開發(fā)基于 NLP 知識抽取,KG 知識圖譜的建立的科研文檔智能檢索系統(tǒng)。
參與方式

識別二維碼注冊本次研討會
相關(guān)資料

識別二維碼了解 NVIDIA NeMo 更多信息
點擊 “閱讀原文” 或掃描下方海報二維碼,即可免費注冊 GTC23,在 3 月 24 日 聽 OpenAI 聯(lián)合創(chuàng)始人與 NVIDIA 創(chuàng)始人的爐邊談話,將由 NVIDIA 專家主持,配中文講解和實時答疑,一起看 AI 的現(xiàn)狀和未來!
原文標題:研討會預(yù)告 | 使用 Transducer 模型優(yōu)化語音識別結(jié)果
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達
+關(guān)注
關(guān)注
22文章
3927瀏覽量
93285
原文標題:研討會預(yù)告 | 使用 Transducer 模型優(yōu)化語音識別結(jié)果
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Rambus邀您相約Keysight設(shè)備安全研討會
火山引擎2025“大模型+智能硬件”機智云特邀研討會圓滿收官 共繪萬物智能產(chǎn)業(yè)藍圖

2025年簡儀科技全國巡回研討會預(yù)告

華為2025智能光伏設(shè)計研討會圓滿結(jié)束
2025年星閃技術(shù)應(yīng)用巡回研討會-深圳站火熱報名中
PI在線研討會活動預(yù)告
2025電子設(shè)計與制造技術(shù)研討會
Imagination 系列研討會 |中國生成式 AI 的發(fā)展

飛騰成功舉辦散熱技術(shù)應(yīng)用發(fā)展研討會
芯華章硬件專場研討會順利舉辦
MathWorks公司將舉辦線上專題研討會
CET中電技術(shù)與您相約2024廣東高校綠色低碳校園建設(shè)研討會

評論