NVIDIA 發(fā)布了 NVIDIA Riva 在語音人工智能方面的新突破, NVIDIA NeMo 在大規(guī)模語言建模( LLM )方面的新突破。 Riva 是一款 GPU 加速語音人工智能 SDK ,用于企業(yè)為其品牌和虛擬助手生成富有表現(xiàn)力的類人語音。 NeMo 是語音和 NLU 的加速培訓(xùn)框架,它現(xiàn)在有能力開發(fā)具有數(shù)萬億參數(shù)的大規(guī)模語言模型。
語音和語言人工智能的這些進步使企業(yè)和研究機構(gòu)能夠輕松構(gòu)建針對其行業(yè)和領(lǐng)域定制的最先進的對話人工智能功能。
英偉達 Riva
NVIDIA 發(fā)布了一個具有定制語音功能的新版本,企業(yè)只需 30 分鐘的語音數(shù)據(jù)即可輕松創(chuàng)建獨特的語音來代表其品牌。
此外, NVIDIA 宣布了Riva Enterprise,這是一項付費計劃,包括為需要大規(guī)模 Riva 部署的企業(yè)提供 NVIDIA 專家支持。 Riva 仍然免費提供給工作量較小的客戶和合作伙伴。
亮點包括:
在 A100 上用一天 30 分鐘的音頻數(shù)據(jù)創(chuàng)建一個新的神經(jīng)語音。
細粒度控件以生成富有表現(xiàn)力的聲音。
A100 上的 Fastpitch + HiFiGAN 比 V100 上的 Tacotron2 + WaveGlow 性能高 12 倍。
支持五種其他語言的世界級語音識別。
擴展到成百上千的實時流。
在任何云端、本地和邊緣運行。
注冊以接收有關(guān) Riva Enterprise 的最新消息和更新,以進行大規(guī)模部署 》》
使用 Riva 開發(fā)應(yīng)用程序
閱讀此introductory post to了解 Riva 工作流中的組件。
接下來,按照本教程構(gòu)建您自己的端到端語音識別服務(wù):
Parthart: 1-EC6
Parthart: H2-Em7
Parthut: 3-ECEN-18
有關(guān)構(gòu)建virtual assistants和transcription with entity recognition等語音應(yīng)用程序的更多教程,請訪問Riva Getting Started. 》》
NVIDIA NeMo Megatron 、 Triton 多 – GPU 多節(jié)點推理和 Megatron 530B
NVIDIA 還推出了為企業(yè)構(gòu)建、定制和部署大型語言模型的功能。 NeMo Megatron 是 NeMo 框架中的一項新功能,用于培訓(xùn)多達數(shù)萬億個參數(shù)的大型語言模型( LLM )。
它包括Megatron方面的進步,這是一個由 NVIDIA 研究人員領(lǐng)導(dǎo)的開源項目,旨在開發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ,如 Megatron 530B ,并使用 NVIDIA Triton 推理服務(wù)器跨多個 GPU 和節(jié)點進行部署。
亮點包括:
在包含數(shù)十億頁文本的龐大數(shù)據(jù)集上自動化數(shù)據(jù)整理。
為新的域和語言培訓(xùn)Megatron 530B等模型。
從單節(jié)點擴展到超級計算機,包括數(shù)十個DGX A100系統(tǒng)。
導(dǎo)出到多個節(jié)點和 GPU s ,用于使用 NVIDIA Triton 推理服務(wù)器進行實時推理。
關(guān)于作者
Siddharth Sharma 是NVIDIA 加速計算的高級技術(shù)營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計來創(chuàng)建控制軟件。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5227瀏覽量
105679 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9663瀏覽量
87184 -
人工智能
+關(guān)注
關(guān)注
1804文章
48599瀏覽量
245957 -
LLM
+關(guān)注
關(guān)注
1文章
318瀏覽量
671
發(fā)布評論請先 登錄
Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用

無法在OVMS上運行來自Meta的大型語言模型 (LLM),為什么?
NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
在NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

解鎖NVIDIA TensorRT-LLM的卓越性能
NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub上公開發(fā)布

NVIDIA助力Amdocs打造生成式AI智能體
魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

什么是LLM?LLM的工作原理和結(jié)構(gòu)
【算能RADXA微服務(wù)器試用體驗】+ GPT語音與視覺交互:1,LLM部署
AI初創(chuàng)公司Alembic攻克LLM虛假信息難題
NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持
NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

評論