在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力阿里巴巴天貓精靈大幅提升服務運行效率

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-07-14 10:05 ? 次閱讀

天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 團隊合作,通過利用 NVIDIA TensorRT 加速流式語音合成(Text-to-Speech,以下簡稱 TTS)深度學習模型,并借助 NVIDIA Triton 推理服務器在 NVIDIA T4 GPU 上進行高效部署,幫助阿里巴巴天貓精靈流式 TTS 服務將吞吐提升 50%,首包延時降低 35%,大幅提升服務運行效率,提升資源利用率。

天貓精靈(Tmall Genie)是阿里巴巴消費者人工智能一級公司,于 2017 年 9 月發布第一代天貓精靈智能終端 X1。讓用戶以自然語言對話的交互方式,實現影音娛樂、購物、信息查詢、生活服務等功能操作,成為消費者的家庭助手。目前,天貓精靈已經服務超過 3000 萬中國家庭,在三方權威統計中不僅智能音箱產品出貨量排名中國前列,其產品并已可連接 3 億以上的家庭 AIoT 生態設備。

除了智能音箱終端產品外,天貓精靈推出 AliGenie 開放平臺,旨在構建基于 AI 的多模態交互及服務系統,為多種云應用提供跨系統服務能力,實現端云協同、跨平臺多終端快速接入。該開放平臺提供高性能且高質量的語音 AI 能力,包括多種不同音色的高度擬人、高度流暢的語音合成算法等。

此外,天貓精靈基于 AliGenie 開放平臺,還提供基于芯片/模組的硬件解決方案,以及通用的熱門行業解決方案。專注生活多個領域,提供一站式解決方案。

本案例中負責實施的是天貓精靈智能引擎團隊以及天貓精靈智能合成團隊。天貓精靈智能合成團隊負責語音合成等生成式算法的研究及開發;天貓精靈智能引擎團隊主要支撐天貓精靈業務線各項業務的工程化落地,如語音識別、語義理解、語音合成、圖像處理等 AI 核心場景。

流式 TTS 是天貓精靈工作流中最為重要的 AI 環節之一。在這一場景中,天貓精靈智能引擎團隊面臨著如下挑戰:

首先流式 TTS 對于首包延時有著嚴格要求,否則用戶將會因為較長的反饋遲滯而感到不適,這就要求 TTS 工作管線的每個模塊的推理能夠高效地執行。

另一方面,團隊希望 TTS 服務的吞吐能夠達到較高水平,這就需要在服務端對收到的多個流式合成請求進行 Batching 的處理。但流式 TTS 工作管線包含聲學模型和聲碼器等多個模塊,在 GPU 上進行 Batching 操作需要正確維護和切換每個合成請求所需的模型狀態,因此需要特別設計工作管線和調度邏輯。

最后,如何盡可能提升 GPU 資源利用率是降本增效的關鍵。最直接的思路便是在一張 GPU 上部署多個模型來提升利用率。因此,如何在同一張 GPU 上對多個模型進行高效的調度和管理也成為了一個挑戰。

基于以上挑戰,天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 解決方案架構團隊合作,采用NVIDIA TensorRT對模型進行推理加速,并利用NVIDIA Triton 推理服務器在 T4 GPU 上進行在線部署,形成了一套高效的流式 TTS 推理部署方案。在提升用戶體驗的同時,大幅降低了服務成本。

首先,該方案使用 TensorRT 對流式 TTS 工作管線中的每一個模型進行優化加速。我們將訓練好的聲學模型和聲碼器,導出為 ONNX 模型格式,再使用 TensorRT 將 ONNX 模型轉換為最優化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能顯著提升推理執行的速度,從而盡可能壓縮首包延時。

另一方面,天貓精靈智能引擎團隊與 NVIDIA 團隊合作設計并實現了一種基于 Triton 的流式 TTS 推理部署管線。在該方案中,我們使用 Triton Custom Backend 實現串聯 TTS 各個模型的調度管線。對于管線中的每一步推理處理,會調用部署在 Triton 上的 TTS TensorRT Engine。如此一來,Triton 便可將發送到服務端的 TTS 請求,有條不紊地調度到管線中的每個模塊進行推理執行。并且,在該管線中,我們實現了適用于 GPU 平臺的流式 TTS 高效調度機制,通過在服務端 Custom Backend 中維護每個合成請求的狀態,實時地將模型輸入和狀態動態聚合為對 GPU 友好的 Batch,交由管線中各個模塊的 TensorRT Engine 進行推理,從而大幅提升管線吞吐和 GPU 利用率,同時保證了對每個合成請求的快速響應。此外,流式 TTS 中一句話的合成請求會對應多個回包,每個回包承載一個音頻塊。針對這種一收多發的推理模式,我們利用 Triton 提供的 Decoupled Responses 機制,保證一個請求的多個回包能夠正確高效地發送給對應的客戶端,使用戶能聽到完整且流暢的音頻。

最后,為了進一步提升 GPU 資源利用率,該方案利用了 Triton 的 Concurrent Model Execution 特性。該特性將部署在 Triton 上的模型或模塊,以模型實例的方式管理:一個模型可以部署多個實例,不同模型的實例也可部署在同一GPU上。因此該方案開啟了 Concurrent Model Execution 后,同一個 T4 GPU 上可部署多個 TTS 發音模型,使得多個模型實例的推理在 GPU 算力資源充足時可以達到并行執行。如此一來,GPU 算力資源可以被多個模型的并行執行充分利用起來,達到降本增效的目的。

通過使用基于 NVIDIA TensorRT 和 Triton 推理服務器的流式 TTS 推理部署方案,天貓精靈 TTS 服務的吞吐提升約 50%,首包延時降低約 35% ,幫助天貓精靈節省了業務成本,提升了用戶體驗。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5274

    瀏覽量

    105917
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1637

    瀏覽量

    48115
  • TTS
    TTS
    +關注

    關注

    0

    文章

    51

    瀏覽量

    11120
  • 天貓精靈
    +關注

    關注

    4

    文章

    96

    瀏覽量

    11683

原文標題:NVIDIA TensorRT 和 Triton 助力阿里巴巴天貓精靈顯著提升流式語音合成服務運行效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    阿里云是什么?企業不可不知的云端架構服務

    阿里云是什么?中國高速連線阿里云 CDN 服務 阿里云為國內云端市場中市占有率第一的云平臺,由阿里巴巴集團自主研發,在國內使用的線路品質穩定
    的頭像 發表于 03-16 09:43 ?428次閱讀

    阿里云爆發式的跨越

    表示,阿里巴巴與蘋果的合作,將不僅僅局限于手機服務領域,未來還將涉及更多的業務板塊。 當媒體都在驚嘆與討論蘋果為什么選擇阿里巴巴時,背后真正的主角還需要加上一個 “云” 字。 長期以來,相比淘寶、
    的頭像 發表于 03-12 16:54 ?398次閱讀
    <b class='flag-5'>阿里</b>云爆發式的跨越

    Arm與阿里巴巴合作加速端側多模態AI體驗

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日發布與阿里巴巴集團輕量級深度學習框架 MNN 的又一新合作。
    的頭像 發表于 03-10 09:07 ?570次閱讀

    谷景阿里巴巴國際站正式上線

    在行業發展的關鍵節點,谷景電子取得了重大突破,谷景阿里巴巴國際站正式上線!此次上線聚焦電感領域,旨在為全球客戶提供更較大好的電感產品與服務,也標志著谷景電感業務在國際化道路上邁出了關鍵一步。
    的頭像 發表于 02-26 09:44 ?395次閱讀

    阿里巴巴否認投資DeepSeek傳聞

    近日,市場流傳出一則消息,稱阿里巴巴計劃向人工智能企業DeepSeek投資10億美元,意在獲取該公司10%的股份,并考慮將阿里云作為其首要推理算力平臺。此消息一出,立即引起了市場的廣泛關注和熱議
    的頭像 發表于 02-10 09:10 ?531次閱讀

    阿里巴巴否認投資DeepSeek

    近日,有傳聞稱阿里巴巴計劃以100億美元的估值,投資10億美元認購中國AI初創企業DeepSeek的10%股權。然而,阿里高管顏喬迅速對此進行了否認,他表示:“同為中國杭州企業,我們為DeepSeek的成就鼓掌,但外界流傳的阿里
    的頭像 發表于 02-08 16:47 ?616次閱讀

    貓精靈與夸克團隊攜手設計AI眼鏡

    近日,阿里巴巴集團內部的智能互聯事業群迎來了新的管理變革,由總裁吳嘉正式接管這一關鍵業務板塊。作為阿里巴巴面向廣大消費者的重要硬件業務之一,“貓精靈”將繼續保持其獨立運營的特色與優勢
    的頭像 發表于 01-20 10:28 ?1782次閱讀

    阿里AI To C業務調整:貓精靈與夸克融合,探索AI眼鏡

    近日,阿里集團內部進行了一次業務調整,智能互聯事業群正式由智能信息事業群總裁吳嘉接管。智能互聯事業群是阿里在2022年成立的一級業務部門,其核心品牌為貓精靈,是
    的頭像 發表于 01-17 10:16 ?667次閱讀

    阿里巴巴出售高鑫零售股權,聚焦核心業務

    近日,阿里巴巴集團正式對外發布公告,宣布其子公司及New Retail與德弘資本達成了一項重要協議。根據該協議,阿里巴巴將出售其所持有的高鑫零售全部股權,這些股權合計占高鑫零售已發行股份總數的約
    的頭像 發表于 01-02 10:54 ?424次閱讀

    阿里巴巴將在美國推出AI電商工具PIC COPILOT

    人工智能領域的一次重要嘗試,旨在利用先進的AI技術為美國電商市場提供更加智能化、便捷化的服務。該工具將深度融合阿里巴巴在大數據、云計算以及電子商務領域的深厚積累,通過智能算法和數據分析,幫助商家更加精準地把握市場需求,提升運營
    的頭像 發表于 12-06 10:52 ?982次閱讀

    阿里巴巴整合電商資源,成立全新電商事業群

    業群將由蔣凡擔任CEO,直接向吳泳銘匯報。該事業群將全面覆蓋并整合阿里巴巴旗下的淘寶貓集團、國際數字商業集團,以及1688、閑魚等核心電商業務。這一整合舉措旨在打造一個覆蓋國內外全產業鏈的綜合性業務集群,進一步提升
    的頭像 發表于 11-22 10:51 ?467次閱讀

    阿里巴巴國際站首推全流程AI產品

    近日,阿里巴巴國際站正式推出了其首個全流程AI產品——AI生意助手2.0。這一創新產品的問世,標志著阿里巴巴助力中小企業外貿經營方面邁出了重要一步。
    的頭像 發表于 10-30 16:12 ?697次閱讀

    阿里巴巴完成雙重主要上市

    8月28日阿里巴巴在香港聯交所主板主要上市,成為在港交所、紐交所雙重主要上市的公司。如今,阿里巴巴完成雙重主要上市。 此外,有投資機構認為阿里巴巴最快有望于9月份就納入港股通。 截至8月28日收盤,
    的頭像 發表于 08-29 16:06 ?585次閱讀

    阿里巴巴季報出爐 阿里云二季度營收增長6%

    阿里巴巴季報出爐我們一起來圍觀一下,根據阿里巴巴集團發布的截至2024年6月30日的第二季度經營業績數據顯示,阿里巴巴該季度營收達到2432.4億元,而上年同期營收2341.56億元,同比增4%;經
    的頭像 發表于 08-16 16:45 ?734次閱讀

    阿里巴巴AI賦能海外擴張新篇章

    中國電商巨頭阿里巴巴集團正積極重啟并加速其海外擴張戰略,以應對國內電商市場競爭加劇的挑戰。此次擴張的一大亮點在于,阿里巴巴將人工智能(AI)技術深度融入其國際業務布局中,開啟了海外發展的新篇章。
    的頭像 發表于 07-12 17:56 ?1305次閱讀
    主站蜘蛛池模板: 免费操人视频 | 日本国产高清色www视频在线 | 午夜久久网 | 天堂网在线最新版官网 | 男人视频网站 | 亚洲欧美视频一区二区 | 人人爽天天爽夜夜爽qc | 久久综合九色综合97_ 久久久 | 青草青青产国视频在线 | 老司机色网 | 天天涩综合 | 手机看片免费福利 | 十三以下岁女子毛片免费播放 | 午夜视频福利在线观看 | 亚洲男人天堂手机版 | 最新中文字幕在线资源 | 国产成人在线播放视频 | 亚洲成a人片在线观看www | 在线视频精品视频 | 精品欧美 | 中文字幕不卡免费高清视频 | 国产黄色a三级三级三级 | 亚洲国产精品综合久久久 | 天天干天天干天天插 | 色天天综合色天天碰 | 天天做.天天爱.天天综合网 | 日本成片视频 | 特级片毛片 | 伊人久久大| 丁香六月婷婷七月激情 | 日本在线视频不卡 | 日本免费a级片 | 欧美30p| 欧美另类69xxxxx性欧 | 性xxxxhd高清| 人与牲动交xxxxbbb | 日日爽夜夜 | 天天干天天射天天爽 | 日本不卡在线观看免费v | 天天爽天天狼久久久综合 | 精品无码三级在线观看视频 |