91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

蔚來基于NVIDIA Triton搭建的推理服務平臺

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-10-09 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在近日舉行的 GTC 大會上,蔚來 AI 平臺負責人白宇利帶來非常有價值的分享,他首次對外透露了蔚來自研的全棧式自動駕駛系統(NAD)的部署和開發情況,同時也將蔚來自動駕駛研發平臺(NADP)這個神秘的“Peta Factory”帶到了公眾視野中。

據了解,NADP是服務于蔚來自動駕駛核心業務方向的研發平臺,用于開發 NAD 功能。以“Peta”為名是因為每輛車每天能生成 55 petabit數據(1 petabit = 10^6 gigabit = 10^9 megabit = 10^15 bits),而 NADP 是所有流程、工作流、數據以及底層軟硬件的組合。NADP 能夠以一站式平臺管理大量復雜的 AI 應用,并將模型開發效率提高 20 倍,從而縮短自動駕駛汽車的上市周期,開發出更新、更快的架構。

在模型訓練、測試和部署的過程中,為了確保新改進能夠切實地解決相應問題,且不會引發任何新問題, NADP 需要執行 10 萬項推理任務,包括數據挖掘、仿真和回歸測試。經過眾多方案的對比和篩選,蔚來選用了NVIDIA Triton 推理服務器作為核心組件,構建了 NADP 的高性能推理服務。

正如白宇利在分享中提到:“我們基于 NVIDIA Triton 推理服務器構建了高性能推理服務。此服務非常適用于 NADP,并可輕松集成模型倉庫、工作流、Jupyter、Prometheus 和許多其他組件,從而簡化 AI 推理。Triton 讓編排和擴展變得更輕松,還能將推理速度提高至 6 倍,并可節省 24% 的資源。”

蔚來基于 NVIDIA Triton 搭建的推理服務平臺,在數據挖掘業務場景下,通過服務器端模型前處理和多模型 DAG 式編排,GPU 資源平均節省 24%;在部分核心 pipeline 上,吞吐能力提升為原來的 5 倍,整體時延降低為原來的 1/ 6。

Triton 在設計之初,就融入了云原生的設計思路,為后面逐步圍繞 Triton 搭建完整的云原生平臺性推理解決方案提供了相當大的便利。

作為 NADP 推理平臺的核心組件,Triton 與 NADP 的各個組件形成了一套完整的推理一站式解決方案。從集成效率、高性能、易用性、高可用四方面,在 NADP 推理平臺中提供助力。

目前,NADP 數據挖掘業務下的相關模型預測服務已經全部遷移至 Triton 推理服務器,為上百個模型提供了高吞吐預測能力。同時在某些任務基礎上,通過自實現前處理算子、前后處理服務化、BLS 串聯模型等手段,將一些模型任務合并起來,極大的提升了處理效率。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5304

    瀏覽量

    106328
  • 自動駕駛
    +關注

    關注

    788

    文章

    14308

    瀏覽量

    170545
  • 蔚來
    +關注

    關注

    1

    文章

    536

    瀏覽量

    14921

原文標題:成功案例:蔚來 NADP + NVIDIA Triton,搭建穩定高效的推理平臺

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Love
    的頭像 發表于 06-12 15:37 ?571次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應用的最佳實踐

    企業使用NVIDIA NeMo微服務構建AI智能體平臺

    已發布的 NeMo 微服務可與合作伙伴平臺集成,作為創建 AI 智能體的構建模塊,使用商業智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務。
    的頭像 發表于 04-27 15:05 ?516次閱讀

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Enterprise 軟件平臺之間的集成,將使 160 多個 AI 工具和 100 多個 NVIDIA NIM 微服務通過 OCI 控制臺以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發表于 03-21 12:01 ?693次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業加速代理式AI<b class='flag-5'>推理</b>

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務
    的頭像 發表于 03-20 15:03 ?641次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現集成,以幫助全球企業組織加速創建代理式
    發表于 03-19 15:24 ?355次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業加速代理式 AI <b class='flag-5'>推理</b>

    能源與長城汽車達成充電服務合作

    2月14日,武漢能源有限公司(“能源”)與長城汽車股份有限公司(“長城汽車”)正式達成充電服務合作。
    的頭像 發表于 02-14 11:50 ?569次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?707次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b><b class='flag-5'>平臺</b>提高AI<b class='flag-5'>推理</b>性能

    Triton編譯器在機器學習中的應用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務
    的頭像 發表于 12-24 18:13 ?984次閱讀

    企業云服務平臺設計與搭建

    企業云服務平臺的設計與搭建是一個復雜但系統的過程,涉及多個環節和因素。主機推薦小編為您整理發布企業云服務平臺設計與
    的頭像 發表于 12-04 09:51 ?538次閱讀

    能源與阿維塔達成充電服務合作協議

    近日,武漢能源有限公司(“能源”)與阿維塔科技(重慶)有限公司(“阿維塔”)正式達成充電服務合作協議。
    的頭像 發表于 11-19 10:20 ?582次閱讀

    廣東電網與合作,肇慶首座換電站正式上線

    近日,廣東電網電動汽車服務有限公司與汽車的合作取得重要進展,由前者投資建設的首座換電站已在廣東省肇慶市正式上線運營。這一里程碑式的合
    的頭像 發表于 11-11 13:41 ?1244次閱讀

    NVIDIA與思科合作打造企業級生成式AI基礎設施

    NVIDIA 加速計算平臺NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理
    的頭像 發表于 10-10 09:35 ?833次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態的優勢,為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務
    的頭像 發表于 09-09 09:19 ?929次閱讀

    全新 NVIDIA NeMo Retriever微服務大幅提升LLM的準確性和吞吐量

    企業能夠通過提供檢索增強生成功能的生產就緒型 NVIDIA NIM 推理服務,充分挖掘業務數據的價值。這些微服務現已集成到 Cohesity、DataStax、NetApp 和 Sn
    的頭像 發表于 07-26 11:13 ?1284次閱讀
    全新 <b class='flag-5'>NVIDIA</b> NeMo Retriever微<b class='flag-5'>服務</b>大幅提升LLM的準確性和吞吐量

    英偉達推出全新NVIDIA AI Foundry服務NVIDIA NIM推理服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務NVIDIA NIM 推理服務
    的頭像 發表于 07-25 09:48 ?1054次閱讀
    主站蜘蛛池模板: 激情五月婷婷基地 | 久久综合九色综合97婷婷群聊 | 天天插天天爱 | 最好看的最新中文字幕2018免费视频 | 在线网站黄色 | 高清欧美日本视频免费观看 | 久热精品在线视频 | 视频在线二区 | 日韩一二三级 | 成年男人永久免费看片 | 欧美骚| 久久婷婷丁香七月色综合 | a级精品九九九大片免费看 a级毛毛片看久久 | www.av在线.com| 简单视频在线播放jdav | 国产美女激情视频 | 亚洲三级小视频 | 韩国美女丝袜一区二区 | 蜜月mv国产精品 | 天堂在线最新版在线www | 免费人成动漫在线播放r18 | 视频高清正版在线观看 | 69日本xxxxxxxxx19| 日本妈妈4 | 99精品视频在线播放2 | 色系视频在线观看免费观看 | 亚洲天堂首页 | www.婷婷色| 伊人黄色网 | 四虎国产精品永久免费网址 | 狠狠躁 | 小说老卫陈红张敏陈法蓉 | 亚洲色图欧美视频 | 黄视频国产| 日韩乱轮| 你懂的手机在线观看 | 五月天婷婷精品视频 | 侵犯希崎中文字幕在线 | 91九色麻豆| 在线观看免费av网站 | bt天堂在线观看 |