在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA宣布其AI推理平臺的重大更新

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2021-11-12 14:42 ? 次閱讀

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等全球行業領導者都在使用該平臺

NVIDIA宣布其AI推理平臺的重大更新,目前Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺。

這些更新包括開源NVIDIA Triton推理服務器軟件的新功能,該軟件為所有AI模型和框架提供跨平臺推理;同時也包含對NVIDIA TensorRT的更新,該軟件優化AI模型并為NVIDIA GPU上的高性能推理提供運行時優化。

NVIDIA還推出了NVIDIA A2 Tensor Core GPU,這是一款用于邊緣AI推理的低功耗、小尺寸的加速器,其推理性能比CPU高出20倍。

NVIDIA副總裁兼加速計算總經理Ian Buck表示:“NVIDIA AI推理平臺正在推動各行各業的突破,包括醫療健康、金融服務、零售、制造和超級計算。無論是提供更智能的建議,發揮對話式AI的力量,還是推進科學發現,NVIDIA推理平臺都能以簡單易用的方式提供低延遲、高吞吐及多種性能組合的服務,為全球關鍵的AI新應用賦能?!?/p>

關鍵的軟件優化

Triton 推理服務器的主要更新包括:

Triton 模型分析器 :這款新工具可以自動化地從數百種組合中為 AI 模型選擇最佳配置,以實現最優性能,同時確保應用程序所需的服務質量。

多 GPU 多節點功能:這一新功能支持基于Transformer的大規模語言模型,例如Megatron 530B,在多個GPU和服務器節點上運行并提供實時推理性能,而不是在單個GPU上運行。

RAPIDS FIL : 這一針對隨機森林和梯度提升決策樹模型 GPU 或 CPU 推理的新后端為開發者使用Triton進行深度學習和傳統機器學習提供了一個統一的部署引擎。

Amazon SageMaker 集成:這種無縫集成讓客戶能夠在SageMaker(AWS 完全托管的AI 服務)中使用 Triton 輕松部署多框架的模型,并實現高推理性能。

支持 Arm CPU:除了NVIDIA GPU 和 x86 CPU 外,Triton后端現在還支持在 Arm CPU 上優化AI 推理工作負載。

Triton 支持在云、數據中心、企業邊緣和嵌入式設備等環境中對 GPU 和CPU 進行 AI 推理,并與AWS、Google Cloud、MicrosoftAzure、阿里云PAI-EAS 等平臺集成。此外,NVIDIA AI Enterprise也集成了Triton。 NVIDIA AI Enterprise 是一款經NVIDIA 優化、認證和支持的用于開發和部署 AI 的端到端軟件套件,客戶可利用它在本地數據中心和私有云的主流服務器上運行AI 工作負載。

除了Triton外,TensorRT 現在還與TensorFlow和PyTorch集成,只需一行代碼就能提供比框架內推理快3倍的性能。這使得開發人員采用極為簡化的工作流程就可以體會TensorRT的強大功能。 NVIDIA TensorRT 8.2 是SDK的最新版本,可加速高性能的深度學習推理,在云端、本地或邊緣提供高吞吐和低延遲。有了最新的性能優化,數十億個參數的語言模型可實現實時運行。

領導者支持NVIDIA AI 平臺推理

全球眾多行業領導者都正在使用 NVIDIA AI 推理平臺改進業務運營并為客戶提供新的AI賦能服務。 Microsoft Azure 認知服務為高品質AI 模型提供基于云的 API,以創建智能應用程序。他們正在使用Triton 運行語音轉文本模型,為 Microsoft Teams 用戶提供準確的實時字幕和轉錄。

“Microsoft Teams 是全球溝通和協作的重要工具,每月有近 2.5 億活躍用戶,”Microsoft 團隊呼叫、會議和設備部首席PM 經理 Shalendra Chhabra 表示。“這樣的AI 模型極其復雜,需要數千萬個神經網絡參數才能在幾十種不同的語言中提供準確的結果。模型越大,就越難以經濟高效地實時運行。

Microsoft Azure 認知服務上的NVIDIA GPU 和 Triton 推理服務器使用28 種語言和方言,通過 AI 近乎實時地幫助改進實時字幕和轉錄功能?!盡icrosoft Azure 認知服務上的NVIDIA GPU 和 Triton 推理服務器,結合AI模型,幫助提升了涉及28 種語言和方言的實時字幕和轉錄功能的成本效益。

Samsung Medison 是三星電子旗下一家全球醫療設備公司。該公司正利用 NVIDIA TensorRT 通過智能輔助功能來為其超聲波系統提供增強的更優質的醫療影像。Samsung Medison 致力于通過提高患者的舒適度、減少掃描時間、簡化工作流程并最終提高系統吞吐量來改善患者和醫療健康領域專業人員的生活。

“在新款 V8 高端超聲波系統中應用NVIDIA TensorRT 后,我們能夠在查看和診斷圖像時更好地為醫學專家提供支持,”Samsung Medison 副總裁、客戶體驗團隊主管Won-Chul Bang 表示。

“我們正在積極地將基于AI 的技術引入我們的超聲波系統,以便為醫療專業人員提供更好的支持,使他們能夠專注于患者診斷和治療等更重要的領域?!?Siemens Energy是一家擁有領先能源技術解決方案的能源專營公司,該公司正利用 Triton 通過AI 來幫助其發電廠客戶管理相關設施。

“高度復雜的發電廠通常會配備攝像頭和傳感器,但采用的卻是傳統軟件系統,NVIDIA Triton 推理服務器出色的靈活性能夠讓這些發電廠加入自主工業革命,”

SiemensEnergy自主運營部投資組合經理 Arik Ott 表示。 Snap是一家全球性攝影軟件和社交媒體公司,其主要產品和服務包括Snapchat、Spectacles和Bitmoji等。Snap正在使用NVIDIA技術來提高商業變現能力和降低成本。

“Snap使用NVIDIA GPU和TensorRT將機器學習推理的成本效率提高了50%,并將服務延遲降低了2倍,“Snap公司策劃與商業變現部門工程副總裁Nima Khajehnouri表示?!边@為我們提供了計算資源,以實踐和部署更大型、更準確的廣告和內容排名模型?!?/p>

NVIDIA面向推理的AI平臺包括

新的 NVIDIA 認證系統、全新A2 GPU

NVIDIA 認證系統可以幫助客戶在高性能、經濟高效且可擴展的基礎設施上為各種現代 AI 應用識別、獲取和部署系統,該認證系統現在包含兩個新的邊緣AI類別。 擴展的類別允許NVIDIA 系統的合作伙伴為客戶提供完整系列的由基于 NVIDIA Ampere 架構的GPU 支持的 NVIDIA 認證系統,來處理各種實際工作負載。

新的NVIDIA A2 GPU也包含在內,它是一個入門級、低功耗的緊湊型加速器,適用于邊緣服務器中的推理和邊緣 AI。NVIDIA A2與適用于主流企業服務器的NVIDIA A30、適用高性能AI 服務器的NVIDIA A100一起,為邊緣、數據中心和云端的 AI 推理提供了完整的方案。

Atos、戴爾科技、技嘉、慧與、浪潮、聯想和Supermicro等全球領先的企業系統供應商,其AI系統產品線均支持在NVIDIA 認證系統上使用NVIDIA AI Enterprise。 其他系統提供商,如研華科技、ASRock Rack、華碩、新華三、寧暢和QCT也為各種工作負載提供了NVIDIA 認證系統。包括研華科技、技嘉和聯想在內的領先供應商將很快推出首款通過新邊緣類別認證的 NVIDIA 認證系統。

供貨情況

Triton 通過NVIDIA NGC 目錄提供。NVIDIA NGC是針對 GPU 優化的AI 軟件中心,包括框架、工具包、預訓練模型和 Jupyter Notebooks。Triton源代碼可從Triton GitHub 資源庫獲取。 NVIDIA 開發者計劃成員可通過TensorRT頁面獲取 TensorRT。最新版本的插件、解析器和示例也以開源形式提供,可從TensorRT GitHub 資源庫獲取。 客戶可以通過今日獨家發布的NVIDIA LaunchPad中的全球精選實驗室,在 NVIDIA AI Enterprise 軟件套件中體驗NVIDIA Triton。

NVIDIA AI Enterprise 軟件套件可通過全球 NVIDIA 渠道合作伙伴獲取,包括Atea、Axians、Carahsoft Technology Corp.、Computacenter、Insight Enterprises、Presidio、Sirius、SoftServe、SVASystem Vertrieb Alexander GmbH、TD SYNNEX、Trace3和 WWT。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5188

    瀏覽量

    105445
  • 服務器
    +關注

    關注

    12

    文章

    9596

    瀏覽量

    86986
  • AI
    AI
    +關注

    關注

    87

    文章

    33554

    瀏覽量

    274263

原文標題:GTC21 | NVIDIA 發布 Triton 推理服務器重大更新,全球25000余家公司部署 NVIDIA AI 推理平臺

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    企業使用NVIDIA NeMo微服務構建AI智能體平臺

    已發布的 NeMo 微服務可與合作伙伴平臺集成,作為創建 AI 智能體的構建模塊,使用商業智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務。
    的頭像 發表于 04-27 15:05 ?217次閱讀

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Oracle 數據庫與 NVIDIA AI 相集成,使企業能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,
    的頭像 發表于 03-21 12:01 ?468次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業加速代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎模型 (W
    的頭像 發表于 03-20 19:01 ?735次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發表于 03-20 15:35 ?524次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務軟件,旨在為部署推理
    的頭像 發表于 03-20 15:03 ?507次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式
    發表于 03-19 15:24 ?282次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業加速代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

    NVIDIA 后訓練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業務就緒型基礎 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發表于 03-19 09:31 ?169次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> 模型系列,助力開發者和企業構建代理式 <b class='flag-5'>AI</b> <b class='flag-5'>平臺</b>

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?531次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b><b class='flag-5'>平臺</b>提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    NVIDIA宣布NVIDIA Isaac重要更新

    近期,在備受矚目的2025年國際消費電子展(CES)上,NVIDIA(英偉達)公司宣布了對NVIDIA Isaac平臺重大
    的頭像 發表于 01-17 14:45 ?429次閱讀

    簡述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了對NVIDIA Isaac的重要更新。NVIDIA Isaac 是一個由加速庫、應用框架和
    的頭像 發表于 01-17 09:57 ?626次閱讀
    簡述<b class='flag-5'>NVIDIA</b> Isaac的重要<b class='flag-5'>更新</b>

    NVIDIA發布Cosmos平臺,加速物理AI開發

    NVIDIA近日宣布了一項重大創新——推出NVIDIA Cosmos?平臺。該平臺集成了先進的生
    的頭像 發表于 01-13 11:06 ?660次閱讀

    NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業和科研機構提供了一套高效、靈活的 AI 訓練與推理
    的頭像 發表于 10-27 10:03 ?585次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓練與<b class='flag-5'>推理</b>加速解決方案

    NVIDIA攜手Meta推出AI服務,為企業提供生成式AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務與NVIDIA
    的頭像 發表于 07-25 16:57 ?727次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理
    的頭像 發表于 07-25 09:48 ?930次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發者
    的頭像 發表于 06-04 09:15 ?872次閱讀
    主站蜘蛛池模板: 华人永久免费视频 | 色综合视频在线 | 亚洲女同一区二区 | 爱婷婷视频在线观看 | 久久综合九色综合97_ 久久久 | 天天摸天天做天天爽在线 | 亚洲伊人成人网 | 亚洲视频在线免费看 | 五月婷婷丁香综合 | 亚洲精品456人成在线 | 久操视频网站 | 色婷婷六月丁香七月婷婷 | 午夜影院免费入口 | 精品视频在线观看视频免费视频 | 午夜干b | 久久精品高清 | 国内精品久久久久久久久野战 | 一级毛片一级毛片一级毛片 | 2021久久精品国产99国产 | 99色综合 | 美国一级做a一级爱视频 | 国产精品单位女同事在线 | 国产精品入口免费视频 | 精品国产乱码久久久久久浪潮 | 成人看片在线观看 | 亚洲欧美国产高清va在线播放 | 欧美综合色区 | 中国成人免费视频 | 草馏社区| 色婷婷激婷婷深爱五月小说 | 亚洲免费网站 | 777人体粉嫩u美图 | 奇米一区二区三区四区久久 | 色综合久久久久久久久久久 | 曰本在线网 | 免费国内精品久久久久影院 | 色狠狠综合 | 天天干天天爱天天射 | 久久噜国产精品拍拍拍拍 | 亚洲日本视频在线观看 | 国产香蕉视频在线播放 |