在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用NVIDIA Triton推理服務器加速語音識別的速度

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-05-13 10:40 ? 次閱讀

網易互娛 AI Lab 的研發人員,基于 Wenet 語音識別工具進行優化和創新,利用 NVIDIA Triton 推理服務器的 GPU Batch Inference 機制加速了語音識別的速度,并且降低了成本。

2001 年正式成立的網易游戲·互動娛樂事業群在經歷了近 20 年的發展歷程后,以“創新無邊界,匠心造精品”為文化基石,創造了一系列大家耳熟能詳的代表作品,如夢幻西游系列、大話西游系列、《陰陽師》、《第五人格》、《荒野行動》、《率土之濱》、《哈利波特:魔法覺醒》等。在 data.ai 公布的 2021 全球發行商 52 強榜單中,網易排名第二。

語音識別 AI 算法服務目前已經成為各個領域不可或缺的基礎算法服務。網易互娛 AI Lab 為所有互娛游戲的玩家,CC 直播平臺用戶等提供完善的語音識別服務。語音識別服務每天都有大量的調用量,AI 推理的計算量繁重。

在網易游戲中,語音識別是一個調用量龐大的基礎算法服務,如果在語音識別算法服務這里出現時耗或吞吐瓶頸的話,會因為語音內容識別過慢,使得用戶使用體驗大幅下降。

服務是基于開源框架 Wenet 優化開發,但是 Wenet 框架中非流式部署方案是基于 libtorch 和 C++ 的,并且熱詞和語言模型部分均采用了 Openfst,速度較慢,也不太方便使用。經過測試 CPU Float32 模式下解碼,onnxruntime 要比 libtorch 快了近 20%。在 GPU 部署時還需要有拼接 Batch 的機制,batch inference 雖然在使用 CPU 做推理時沒有太大的提升,但是能大大提升 GPU 的利用率。

基于以上的挑戰,網易互娛 AI Lab 選擇了采用 NVIDIA 在 Wenet 中開源的 Triton 部署方案來改進優化后進行 GPU 部署,使得語音識別速度提高,大幅降低時延和運營成本。

由于 Wenet 開源框架下的 Triton 推理服務器并沒有考慮音頻解碼,顯存溢出等問題,所以需要有個前端邏輯做音頻解碼處理和音頻分段處理。并且因為 Triton 推理服務器組 batch 的機制是相同音頻長度才會自動組成 batch 做推理,所以前端處理邏輯這塊還加上了按秒 padding 的操作。整體流程如圖所示。

68afeb16-d1df-11ec-bce3-dac502259ad0.jpg

其中前端處理流程如圖所示:

68d173e4-d1df-11ec-bce3-dac502259ad0.jpg

NVIDIA Triton 推理服務器處理流程:

6911f87e-d1df-11ec-bce3-dac502259ad0.jpg

(圖片來源于網易互娛授權)

其中 Triton 推理服務器中解碼器部分是基于 Wenet 的熱詞方案而自研實現的熱詞解碼器方案。

QPS,RTF 在 5 秒音頻下,CPU 設備和 GPU 設備對比,CPU 為 36 核機器, GPU 為單卡 T4:

692de6e2-d1df-11ec-bce3-dac502259ad0.jpg

(圖片來源于網易互娛授權)

由表格可知,對比 CPU-FP32 與 GPU-FP16,單卡 T4 的推理能力基本相當于 36 核 CPU(Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz)機器的 4 倍。并且實驗測試可以得知 FP16 與 FP32 的 WER 基本無損。

自研熱詞解碼器的方法結果展示:

694de352-d1df-11ec-bce3-dac502259ad0.png

6967e824-d1df-11ec-bce3-dac502259ad0.png

(圖片來源于網易互娛授權)

這里 GPU 的效果采用自研的熱詞增強的方法,識別率在熱詞這塊能有絕對 0.8% 的性能提升,而 Wenet 開源的方法大概是 0.5%。并且自研熱詞實例的構建耗時基本可以忽略不計。

整體來看 GPU 的方案在識別率基本無損的情況下,單卡 T4 比 36 核 CPU 機器提高近 4 倍的 QPS,單個音頻 RTF 測試下,包含音頻解碼等損耗情況下也能提高近 3 倍,并且也能夠支持熱詞增強功能,讓機器成本和識別速度都得到了很好的優化。

網易互娛廣州 AI Lab 資深 AI 算法工程師丁涵宇表示:“目前該方案已在網易互娛 AI Lab 語音識別服務落地,大大的降低了識別時延和機器成本。后續,我們還將與英偉達一起研究將熱詞增強的方法在 GPU 中實現,探索的極致的語音識別推理性能。”

原文標題:NVIDIA Triton 助力網易互娛 AI Lab,改善語音識別效率及成本

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5194

    瀏覽量

    105515
  • AI
    AI
    +關注

    關注

    87

    文章

    33663

    瀏覽量

    274408
  • 語音識別
    +關注

    關注

    39

    文章

    1770

    瀏覽量

    113763

原文標題:NVIDIA Triton 助力網易互娛 AI Lab,改善語音識別效率及成本

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI 推理服務器都有什么?2025年服務器品牌排行TOP10與選購技巧

    根據行業數據,AI推理服務器的性能差異可以達到10倍以上。比如,用普通服務器跑一個700億參數的大模型,可能需要30秒才能出結果,而用頂級服務器可能只需要3秒。這就是為什么選對
    的頭像 發表于 04-09 11:06 ?488次閱讀
    AI <b class='flag-5'>推理</b><b class='flag-5'>服務器</b>都有什么?2025年<b class='flag-5'>服務器</b>品牌排行TOP10與選購技巧

    國產推理服務器如何選擇?深度解析選型指南與華頡科技實戰案例

    人工智能技術的爆發催生了對推理算力的迫切需求,而進口服務器的高成本與技術依賴性,推動了國產推理服務器的快速發展。據IDC預測,到2025年,中國AI
    的頭像 發表于 03-24 17:11 ?292次閱讀
    國產<b class='flag-5'>推理</b><b class='flag-5'>服務器</b>如何選擇?深度解析選型指南與華頡科技實戰案例

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA 加速計算和
    的頭像 發表于 03-21 12:01 ?473次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業<b class='flag-5'>加速</b>代理式AI<b class='flag-5'>推理</b>

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務
    的頭像 發表于 03-20 15:03 ?512次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務
    發表于 03-19 15:24 ?285次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業<b class='flag-5'>加速</b>代理式 AI <b class='flag-5'>推理</b>

    浪潮信息發布元腦R1推理服務器

    。 DeepSeek R1 671B模型作為業界領先的深度學習模型,其部署一直面臨著較高的難度和成本。而浪潮信息的元腦R1推理服務器通過一系列的技術創新,成功打破了這一瓶頸。該服務器能夠充分
    的頭像 發表于 02-17 10:32 ?586次閱讀

    GPU加速服務器怎么用的

    GPU加速服務器是將GPU硬件與云計算服務相結合,通過云服務提供商的平臺,用戶可以根據需求靈活租用帶有GPU資源的虛擬機實例。那么,GPU加速
    的頭像 發表于 12-26 11:58 ?309次閱讀

    Triton編譯在機器學習中的應用

    1. Triton編譯概述 Triton編譯NVIDIA Triton
    的頭像 發表于 12-24 18:13 ?799次閱讀

    ASR與傳統語音識別的區別

    識別技術。 構建更深更復雜的神經網絡模型,利用大量數據進行訓練。 提高了語音識別的準確率和穩定性。 傳統語音
    的頭像 發表于 11-18 15:22 ?1066次閱讀

    新加坡服務器速度測試方法有哪些

    測試新加坡服務器速度和性能是確保服務器能夠滿足業務需求的關鍵步驟。以下是一些常用的方法和工具: Ping測試: Ping命令是一種基本的網絡診斷工具,用于測試與服務器的連接延遲和丟包
    的頭像 發表于 10-14 14:55 ?425次閱讀

    什么是AI服務器?AI服務器的優勢是什么?

    AI服務器是一種專門為人工智能應用設計的服務器,它采用異構形式的硬件架構,通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片
    的頭像 發表于 09-21 11:43 ?1661次閱讀

    AMD助力HyperAccel開發全新AI推理服務器

    提高成本效率。HyperAccel 針對新興的生成式 AI 應用提供超級加速的芯片 IP/解決方案。HyperAccel 已經打造出一個快速、高效且低成本的推理系統,加速了基于轉換
    的頭像 發表于 09-18 09:37 ?685次閱讀
    AMD助力HyperAccel開發全新AI<b class='flag-5'>推理</b><b class='flag-5'>服務器</b>

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態的優勢,為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務器
    的頭像 發表于 09-09 09:19 ?802次閱讀

    英偉達推出全新NVIDIA AI Foundry服務NVIDIA NIM推理服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務NVIDIA NIM 推理服務
    的頭像 發表于 07-25 09:48 ?936次閱讀

    AI服務器的特點和關鍵技術

    AI服務器,即人工智能服務器,是一種專門設計用于運行和加速人工智能(AI)算法與模型的硬件設備。隨著人工智能技術的快速發展和普及,AI服務器在數據處理、模型訓練、
    的頭像 發表于 07-17 16:34 ?2737次閱讀
    主站蜘蛛池模板: 国产精品伦子一区二区三区 | 97午夜理伦片在线影院 | 婷婷久久综合 | 天天做天天爱夜夜爽女人爽宅 | 韩国三级hd中文字幕久久精品 | 国产免费卡1卡2卡 | 亚洲一区二区中文字幕 | 成 人 免费 黄 色 视频 | 日本黄色三级视频 | 天天综合网天天综合色不卡 | 在线视频三区 | 国产色视频网站免费观看 | 99插插插| 特级全黄一级毛片免费 | 日本福利小视频 | 色3344| 伊人久久大 | 国产免费高清福利拍拍拍 | 国产叼嘿视频免费网站 | 欧美黑人性受xxxx精品 | 四虎在线最新地址4hu | 欧洲一级鲁丝片免费 | 一区二区美女视频 | 亚洲最色网站 | 国色天香精品亚洲精品 | 色久优优 欧美色久优优 | 一级特黄女毛毛片 | 四虎tv在线观看884aa | 国产精品久久国产三级国不卡顿 | 欧洲一卡二卡乱码新区 | 日韩一卡 二卡 三卡 四卡 免费视频 | 老师解胸罩喂我吃奶 | 亚洲国产精品久久久久婷婷软件 | 狠狠色丁香婷婷久久综合不卡 | 国产热re99久久6国产精品 | 亚洲欧美在线一区二区 | 青青草国产三级精品三级 | 成人亚洲欧美在线电影www色 | 国产一区二区精品 | 26uuu另类亚洲欧美日本一 | 午夜一级影院 |