在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-10-10 09:49 ? 次閱讀

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型。

在企業(yè)中部署生成式 AI 將變得空前簡單。

NVIDIA NIM是一套生成式 AI 推理微服務(wù),將支持 KServe 開源軟件,可以自動將 AI 模型以云計算應(yīng)用的規(guī)模運行。

NVIDIA NIM 與 KServe 的組合確保了生成式 AI 可以像任何其他大型企業(yè)級應(yīng)用一樣進(jìn)行部署,還讓用戶能夠通過 Canonical、Nutanix 和 Red Hat 等數(shù)十家公司的平臺廣泛使用 NIM。

NIM 在 KServe 上的集成將使 NVIDIA 的技術(shù)擴展到開源社區(qū)、生態(tài)系統(tǒng)合作伙伴和客戶。借助 NIM,他們可以通過 API 調(diào)用(即現(xiàn)代編程的一鍵式操作)來獲得NVIDIA AI Enterprise軟件平臺的性能、支持和安全性。

在 Kubernetes 上提供 AI

KServe 最初是基于 Kubernetes 的機器學(xué)習(xí)工具包 Kubeflow 的一部分。Kubernete 是一個開源系統(tǒng),用于部署和管理包含大型分布式應(yīng)用組件的軟件容器。

隨著 Kubeflow 在 AI 推理方面的不斷擴展,KServe 誕生了,并最終演變成為獨立的開源項目。

許多公司都為 KServe 軟件做出了貢獻(xiàn)并采用了該軟件。目前,運行 KServe 軟件的公司包括亞馬遜科技、彭博、Canonical、思科、慧與、IBM、Red Hat、Zillow 和 NVIDIA 等。

深入解析 KServe

KServe 本質(zhì)上是 Kubernetes 的擴展,它像一個強大的云應(yīng)用一樣運行 AI 推理。它使用標(biāo)準(zhǔn)協(xié)議,以經(jīng)過優(yōu)化的性能運行,并支持 PyTorch、Scikit-learn、TensorFlow 和 XGBoost,而用戶無需了解這些 AI 框架的細(xì)節(jié)。

在新的大語言模型(LLM)層出不窮的情況下,該軟件尤其有用。

KServe 讓用戶可以輕松地在模型之間來回切換,測試哪一個最符合他們的需求。當(dāng)模型的新版本發(fā)布時,KServe 的 “金絲雀發(fā)布(canary rollouts)” 功能會自動執(zhí)行詳細(xì)驗證,并逐步將其部署到生產(chǎn)系統(tǒng)中。

其另一項功能 “GPU 自動縮放” 可以隨著服務(wù)需求的起伏來高效地管理模型的部署方式,從而使客戶和服務(wù)提供商獲得最佳體驗。

生成式 AI 的 API 調(diào)用

KServe 的優(yōu)勢現(xiàn)在將通過 NVIDIA NIM 的便捷性提供。

使用 NIM ,只需一個簡單的 API 調(diào)用即可應(yīng)對所有的復(fù)雜性。企業(yè) IT 管理員能夠獲得確保應(yīng)用以最佳性能和效率運行所需的指標(biāo),無論應(yīng)用是在他們的數(shù)據(jù)中心還是在遠(yuǎn)程云服務(wù)上,即使是在更改了 AI 模型的情況下。

NIM 讓 IT 專家成為生成式 AI 專家,變革了公司的運營。這就是為什么 Foxconn 和 ServiceNow 等眾多企業(yè)都正在部署 NIM 微服務(wù)的原因。

NIM 支持?jǐn)?shù)十個 Kubernetes 平臺

由于 NIM 與 KServe 的集成,用戶將能夠在數(shù)十個企業(yè)平臺上訪問 NIM,比如 Canonical 的 Charmed KubeFlow 和 Charmed Kubernetes、Nutanix GPT-in-a-Box 2.0、Red Hat 的 OpenShift AI 等等。

KServe 貢獻(xiàn)者、Red Hat 首席軟件工程師 Yuan Tang 表示:“Red Hat 一直在與 NVIDIA 合作,以便讓企業(yè)更輕松地使用開源技術(shù)來部署 AI。通過增強 KServe 并在 Red Hat OpenShift AI 中增加對 NIM 的支持,我們能夠讓 Red Hat 的客戶更方便地訪問 NVIDIA 的生成式 AI 平臺。”

“通過將 NVIDIA NIM 推理微服務(wù)與 Nutanix GPT-in-a-Box 2.0 集成,客戶將能夠從云端到邊緣以一致的方式去構(gòu)建可擴展、安全、高性能的生成式 AI 應(yīng)用。” Nutanix 工程副總裁 Debojyoti Dutta 表示,其團隊為 KServe 和 Kubeflow 做出了貢獻(xiàn)。

Canonical 的 MLOps 產(chǎn)品經(jīng)理 Andreea Munteanu 表示:“作為一家對 KServe 做出重大貢獻(xiàn)的公司,我們很高興通過 Charmed Kubernetes 和 Charmed Kubeflow 提供 NIM。在我們的共同努力下,用戶將能夠輕松地使用生成式 AI 的全部功能,并使其保持最高的性能和效率。”

數(shù)十家其他軟件提供商都能感受到 NIM 的好處,因為他們的產(chǎn)品中也包含了 KServe。

服務(wù)開源社區(qū)

NVIDIA 一直積極地參與 KServe 項目。正如最近的一篇技術(shù)博客中所提到的,KServe 的開放推理協(xié)議已經(jīng)被用于NVIDIA Triton 推理服務(wù)器,可以幫助用戶跨多個 GPU、框架和操作模式同時運行許多 AI 模型。

基于 KServe,NVIDIA 專注于在多個 GPU 上一次運行一個 AI 模型的用例。

作為 NIM 集成的一部分,NVIDIA 計劃在其開源軟件(包括 Triton 和TensorRT-LLM)的基礎(chǔ)上,成為 KServe 的積極貢獻(xiàn)者。NVIDIA 還是云原生計算基金會(CNCF)的活躍成員,該基金會支持生成式 AI 和其他項目的開源代碼。

立即通過 NVIDIA API 目錄試用 Llama 3 8B 或 Llama 3 70B 大語言模型的 NIM API。全球數(shù)百家 NVIDIA 合作伙伴也正在使用 NIM 來部署生成式 AI。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5258

    瀏覽量

    105855
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5166

    瀏覽量

    73243
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34412

    瀏覽量

    275690

原文標(biāo)題:COMPUTEX 2024 | KServe 提供商在云和數(shù)據(jù)中心提供由 NIM 賦能的推理

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    英偉達(dá)GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    基礎(chǔ)設(shè)施以及生成 AI 服務(wù)首次實現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應(yīng)用。 此次 Oracle Cloud Infrast
    的頭像 發(fā)表于 03-21 12:01 ?588次閱讀
    英偉達(dá)GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>加速代理式<b class='flag-5'>AI</b>推理

    聚云科技榮獲亞馬遜云科技生成AI能力認(rèn)證 助力企業(yè)加速生成AI應(yīng)用落地

    、數(shù)據(jù)處理、模型調(diào)優(yōu)到應(yīng)用集成與部署等方面,助力企業(yè)加速生成
    發(fā)表于 02-14 13:41 ?134次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    務(wù)是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過優(yōu)化的推理微服務(wù)可幫助企業(yè)提高生成 AI 應(yīng)用的
    發(fā)表于 01-17 16:29 ?146次閱讀

    NVIDIA推出多個生成AI模型和藍(lán)圖

    NVIDIA 宣布推出多個生成 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化
    的頭像 發(fā)表于 01-08 10:48 ?535次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意
    的頭像 發(fā)表于 11-27 11:29 ?758次閱讀

    全新NVIDIA NIM微服務(wù)實現(xiàn)突破性進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實現(xiàn)突破性進(jìn)展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實現(xiàn)
    的頭像 發(fā)表于 11-21 10:07 ?610次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA
    的頭像 發(fā)表于 11-20 09:12 ?668次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型
    的頭像 發(fā)表于 11-19 14:48 ?798次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    可定制工作流目錄加快核心生成 AI 用例的部署速度。首批用例包括客戶服務(wù)、藥物研發(fā)和 PDF 數(shù)據(jù)提取,未來將加入更多用例 企業(yè)可以使用
    發(fā)表于 08-28 10:10 ?342次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>打造屬于自己的 <b class='flag-5'>AI</b>

    借助NVIDIA NIM加速AI應(yīng)用部署

    大語言模型(LLM)在企業(yè)組織中的應(yīng)用日益廣泛,許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然從基礎(chǔ)模型著手十分
    的頭像 發(fā)表于 08-23 16:38 ?693次閱讀
    借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b>加速<b class='flag-5'>AI</b>應(yīng)用<b class='flag-5'>部署</b>

    全新NVIDIA NIM微服務(wù)將生成AI引入數(shù)字環(huán)境

    生成物理 AI NIM 微服務(wù)以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸
    的頭像 發(fā)表于 08-02 15:20 ?836次閱讀

    NVIDIA NIM:打造AI領(lǐng)域的AI-in-a-Box,提高AI開發(fā)與部署高效

    據(jù)7月30日官方發(fā)布的資訊顯示,在全球備受矚目的計算機圖形學(xué)盛會——SIGGRAPH 2024上,NVIDIA公司對外展示了其在諸如渲染、仿真及生成AI等前沿領(lǐng)域所取得的卓越成果,而
    的頭像 發(fā)表于 07-30 16:27 ?1053次閱讀

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM
    的頭像 發(fā)表于 07-25 16:57 ?800次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?1008次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成 AI 模型服務(wù),以便
    發(fā)表于 07-24 09:39 ?877次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球<b class='flag-5'>企業(yè)</b>打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>
    主站蜘蛛池模板: 99r8这里精品热视频免费看 | 亚洲欧美日韩综合一区 | 亚洲成人在线免费观看 | 狼狼狼色精品视频在线播放 | 欧美高清免费一级在线 | 高清一区二区三区 | 亚洲啊v在线 | 天天舔天天射天天操 | 九九久久九九久久 | 日本高清视频色www在线观看 | 亚洲情a成黄在线观看 | 久久五月女厕所一区二区 | 在线看av网址 | 久久亚洲国产欧洲精品一 | 明日花绮罗在线观看 | 欧美一区二区三区激情啪啪 | 亚洲免费人成在线视频观看 | 久久精品国产免费中文 | 免费网站日本 | 日本一区二区三区视频在线 | 国产美女影院 | 天天曰夜夜曰 | 日本网络视频www色高清免费 | 亚洲国产情侣偷自在线二页 | a一级视频| 色噜噜狠狠狠综合曰曰曰 | 国产精品久久久久久久久免费 | 成人爽a毛片在线视频网站 成人窝窝午夜看片 | 日本一区二区精品88 | 亚洲一级毛片中文字幕 | 91av视频| 欧美人与禽 | 97人人看| 日本高清不卡视频 | 色综合久久五月 | 日本黄页网址 | 福利午夜 | 男人天堂资源站 | 91福利视频免费 | 4438x成人全国最大 | 色婷婷综合久久久久中文一区二区 |