魔天记忘语小说,最好看的小说排行,好看的玄幻小说

在人工智能飛速發(fā)展的今天，大語言模型（LLM）為各個行業(yè)帶來了全新的場景和機(jī)遇。諸如客戶服務(wù)數(shù)字人，計(jì)算機(jī)輔助藥物研發(fā)的生成式虛擬篩選，基于檢索增強(qiáng)生成（RAG）的企業(yè)多模態(tài) PDF 數(shù)據(jù)提取，網(wǎng)絡(luò)安全流數(shù)據(jù)過濾、處理和分類優(yōu)化等工作流，正在無縫集成和運(yùn)行在定制化的企業(yè) AI 應(yīng)用，企業(yè)還能夠基于專有業(yè)務(wù)數(shù)據(jù)和用戶反饋數(shù)據(jù)，不斷優(yōu)化 AI 應(yīng)用。

同時，企業(yè)也面臨著如何高效、安全地部署 LLM 的挑戰(zhàn)。阿里云計(jì)算巢基于 NVIDIA 加速計(jì)算技術(shù)，通過阿里云云市場為企業(yè)和開發(fā)者提供NVIDIA AI Enterprise軟件套件，其包含了NVIDIA NIM Agent Blueprint、NVIDIA NIM和NVIDIA NeMo等企業(yè)級 AI 開發(fā)工作流和 AI 開發(fā)工具鏈。其中，NVIDIA NIM 提供可靠、高性能的 LLM 推理服務(wù)，結(jié)合阿里云計(jì)算巢實(shí)現(xiàn)一站式云上部署，助力企業(yè)加速實(shí)現(xiàn) LLM 的 SaaS 化。

本文以 Llama3 為例，介紹該方案的整體架構(gòu)和部署方式。

NVIDIA NIM：

易于使用的預(yù)構(gòu)建容器工具

NVIDIA NIM 微服務(wù)是一套易于使用的預(yù)構(gòu)建容器工具，目的是幫助企業(yè)客戶在云、數(shù)據(jù)中心和工作站上安全、可靠地部署高性能 AI 模型。作為 NVIDIA AI Enterprise 的一部分，NIM 具備以下核心優(yōu)勢：

安全、靈活的部署：NIM 在不同環(huán)境的 CUDA GPU 加速基礎(chǔ)設(shè)施和 Kubernetes 發(fā)行版中經(jīng)過嚴(yán)格驗(yàn)證和基準(zhǔn)測試，它支持企業(yè)在云、數(shù)據(jù)中心、工作站上安全可靠地部署高性能的 AI 推理，只需 5 分鐘即可完成部署。

加速產(chǎn)品上市：企業(yè)通過預(yù)構(gòu)建、持續(xù)維護(hù)的微服務(wù)，能夠快速將產(chǎn)品推向市場，縮短開發(fā)周期。

開發(fā)者友好：開發(fā)者使用標(biāo)準(zhǔn) API 和幾行代碼即可輕松將 NIM 集成到企業(yè)級 AI 應(yīng)用程序中。

優(yōu)化的推理引擎：NIM 基于Triton 推理服務(wù)器、TensorRT、TensorRT-LLM和 PyTorch 等強(qiáng)大的推理引擎構(gòu)建，提供行業(yè)領(lǐng)先的吞吐率、延遲和 token 生成速度，確保服務(wù)響應(yīng)更快。

企業(yè)級支持：NIM 采用企業(yè)級基礎(chǔ)容器構(gòu)建，提供嚴(yán)格的驗(yàn)證、定期安全更新，適合企業(yè)生產(chǎn)環(huán)境部署。

阿里云計(jì)算巢：專為服務(wù)商

及其客戶打造的云集成 PaaS 平臺

阿里云計(jì)算巢服務(wù)是一個開放給企業(yè)應(yīng)用服務(wù)商（包括：企業(yè)應(yīng)用服務(wù)商、IT 集成服務(wù)商、交付服務(wù)商和管理服務(wù)提供商等）及其用戶的服務(wù)管理 PaaS 平臺，提供軟件上云的“一站式”解決方案。

阿里云計(jì)算巢能提供軟件的交付、部署、運(yùn)維流程標(biāo)準(zhǔn)化的服務(wù)，支持軟件和資源的一體化交付，真正實(shí)現(xiàn)了軟件的開箱即用。

阿里云計(jì)算巢服務(wù)集成了阿里云一系列底層產(chǎn)品能力，通過通用的應(yīng)用管控框架、租戶管理框架，幫助服務(wù)商提升服務(wù)的交付效率、管理效率和服務(wù)能力，在提升用戶滿意度的同時降低運(yùn)營成本；并為用戶提供了統(tǒng)一管理多種應(yīng)用服務(wù)的平臺，提升用戶使用服務(wù)的效率和安全性，降低用戶獲取服務(wù)和管理服務(wù)的成本。

方案介紹

下圖展示了通過阿里云計(jì)算巢快速部署 NVIDIA NIM 的整體架構(gòu)。以 Llama3 為例，我們通過計(jì)算巢來創(chuàng)建、管理 LLM 推理服務(wù)：在阿里云容器服務(wù) ACK （容器服務(wù) Kubernetes 版）集群上，我們使用阿里云 ACK 的云原生 AI 套件，集成開源推理服務(wù)框架 KServe，來部署 NVIDIA NIM。

同時，結(jié)合 ACK 的 Prometheus 和 Grafana 監(jiān)控服務(wù)，快速搭建監(jiān)控大盤，實(shí)時觀測推理服務(wù)狀態(tài)；利用 NVIDIA NIM 提供豐富的監(jiān)控指標(biāo)，如 num_requests_waiting，配置推理服務(wù)彈性擴(kuò)縮容策略。

這里列出的云上資源，以及阿里云彈性計(jì)算服務(wù)（ECS）、專有網(wǎng)絡(luò)（VPC）等基礎(chǔ)資源，都可以通過計(jì)算巢來輕松配置，一鍵拉起，最終實(shí)現(xiàn)一個云上高性能、可實(shí)時觀測、極致彈性的大語言模型推理服務(wù)。用戶只需要根據(jù)該服務(wù)創(chuàng)建實(shí)例，便可部署該服務(wù)。

圖 1. 通過阿里云計(jì)算巢快速部署

NVIDIA NIM 架構(gòu)圖

（圖片來源于阿里云，如您有任何疑問或需要使用本圖片，請聯(lián)系阿里云）

部署流程

1. 參考 NVIDIA NIM 文檔，生成NVIDIA NGC API Key，用于訪問需要部署的模型鏡像。以本文用到的 Llama-3-8B-Instruct 為例，可以通過NVIDIA NGC 目錄來獲取。

同時，請閱讀并承諾遵守 Llama 模型的自定義可商用開源協(xié)議。

2. 在阿里云計(jì)算巢服務(wù)目錄中找到“基于 NVIDIA NIM 快速部署 LLM 模型推理服務(wù)”，并進(jìn)入實(shí)例部署頁面。

如下圖所示，主要配置服務(wù)的基本信息和云上資源，以及第一步中獲取的 NVIDIA NGC API Key，需要填寫在下圖相應(yīng)位置。

圖 2. 在阿里云計(jì)算巢創(chuàng)建服務(wù)實(shí)例

（圖片來源于阿里云，如您有任何疑問或需要使用本圖片，請聯(lián)系阿里云）

因?yàn)榉?wù)部署在阿里云 ACK 集群之上，這里也包含了 Kubernetes 配置：

圖 3. 阿里云 ACK 集群上 Kubernetes

選項(xiàng)頁面

（圖片來源于阿里云，如您有任何疑問或需要使用本圖片，請聯(lián)系阿里云）

3. 按照頁面提示完成所有配置之后，點(diǎn)擊下一步：確認(rèn)訂單，在這里確認(rèn)第 2 步配置的服務(wù)實(shí)例信息和價(jià)格預(yù)覽。

圖 4. 確認(rèn)服務(wù)實(shí)例信息和價(jià)格預(yù)覽

（圖片來源于阿里云，如您有任何疑問或需要使用本圖片，請聯(lián)系阿里云）

部署過程中，用戶需要創(chuàng)建和訪問阿里云資源，當(dāng)阿里云賬號屬于 RAM 賬號時，需要開通以下權(quán)限，頁面上也有開通這些權(quán)限的入口。

4. 點(diǎn)擊立即創(chuàng)建，開始部署。過程中會涉及阿里云資源的創(chuàng)建、NIM 模型鏡像的拉取等。拉取過程的日志，可通過”點(diǎn)擊資源 tab-> 找到 ACK 集群->頁面左側(cè)的工作負(fù)載->無狀態(tài)”來查看。部署完成后，進(jìn)入服務(wù)實(shí)例詳情查看使用說明。通過 curl 發(fā)送 HTTP 請求訪問推理服務(wù)，修改 content 字段，便可自定義和推理服務(wù)交互的內(nèi)容。

圖 5. 服務(wù)實(shí)例詳情頁面截圖

（圖片來源于阿里云，如您有任何疑問或需要使用本圖片，請聯(lián)系阿里云）

通過阿里云的云市場獲取

NVIDIA AI Enterprise 使用該方案

NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分，正式使用時須獲得 NVIDIA AI Enterprise 的許可證授權(quán)。現(xiàn)在，企業(yè)用戶可以通過阿里云云市場獲取 NVIDIA AI Enterprise 來使用該方案。阿里云市場提供了概念驗(yàn)證（PoC）測試服務(wù)和購買 NVIDIA AI Enterprise 許可證，共兩個下單頁面。

PoC 測試服務(wù)

提供 90 天 NVIDIA AI Enterprise PoC License，暨 90 天免費(fèi)試用，而使用時須支付阿里云計(jì)算資源的費(fèi)用。

通過阿里云的云市場購買 NVIDIA AI Enterprise 許可證

該頁面提供的信息僅供參考，用戶需要通過該頁面的“NVIDIA 服務(wù)咨詢”釘釘來溝通采購，最終通過云市場官網(wǎng)推送下單鏈接獲取 NVIDIA AI Enterprise 許可證。

總結(jié)

本文介紹了通過阿里云計(jì)算巢快速部署 NVIDIA NIM 的方案收益和部署方式，該方案充分利用了 NIM 的安全與高性能的無縫 AI 推理功能，以及計(jì)算巢的軟件一站式上云和交付能力，從而打造極致彈性、高性能、可實(shí)時觀測的云上 LLM 推理服務(wù)。

作者信息

毛亦姝

NVIDIA 解決方案架構(gòu)師，主要負(fù)責(zé)生成式 AI 模型的訓(xùn)練、推理在云上的落地，多年互聯(lián)網(wǎng)算法工作經(jīng)驗(yàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5181

瀏覽量
105344
AI

AI

+關(guān)注

關(guān)注
87

文章
33377

瀏覽量
273874
人工智能

人工智能

+關(guān)注

關(guān)注
1803

文章
48381

瀏覽量
244433
阿里云

阿里云

+關(guān)注

關(guān)注
3

文章
998

瀏覽量
43715

原文標(biāo)題：通過阿里云計(jì)算巢部署 NVIDIA NIM，加速企業(yè)大語言模型 SaaS 化

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

【產(chǎn)品活動】阿里云GPU云服務(wù)器年付5折！阿里云異構(gòu)計(jì)算助推行業(yè)發(fā)展！

摘要：阿里云GPU云服務(wù)器全力支持AI生態(tài)發(fā)展，進(jìn)一步普惠開發(fā)者紅利，本周將會推出針對異構(gòu)計(jì)算GPU實(shí)例GN5年付5折的優(yōu)惠活動，希望能夠打造良好的AI生態(tài)環(huán)境，幫助更多的人工智能企

發(fā)表于 12-26 11:22

一張圖看懂阿里云新發(fā)布的物聯(lián)網(wǎng)設(shè)備上云神器——HiTSDB + IoT套件

設(shè)備狀態(tài)，快速發(fā)現(xiàn)數(shù)據(jù)價(jià)值等，可以讓更多物聯(lián)網(wǎng)企業(yè)快速擁抱云計(jì)算。點(diǎn)此查看原文：http://click.aliyun.com/m/41185/HiTSDB +IoT 套件是

發(fā)表于 01-29 17:43

阿里云彈性高性能計(jì)算產(chǎn)品商業(yè)化正式發(fā)布

更新快，可根據(jù)應(yīng)用需求購置最適合的計(jì)算資源配比（如 ECS 實(shí)例）。E-HPC 充分復(fù)用阿里云產(chǎn)品，大大提高了數(shù)據(jù)安全性和高可用性。通過事件驅(qū)動的方式連接云端服務(wù)，

發(fā)表于 02-02 16:36

AI開發(fā)者福音！阿里云推出國內(nèi)首個基于英偉達(dá)NGC的GPU優(yōu)化容器

阿里云上的NGC容器，開發(fā)者們可以快速的接入深度學(xué)習(xí)框架，大大縮減了產(chǎn)品開發(fā)以及業(yè)務(wù)部署的時間；，用戶通過

發(fā)表于 04-04 14:39

阿里云免費(fèi)使用及手冊

自己使用阿里云服務(wù)器搭建的一個個人知識分享博客網(wǎng)站，基于網(wǎng)站搭建過程，分享一些經(jīng)驗(yàn)。先對阿里云服務(wù)器大體介紹下，后續(xù)有時間再分享技術(shù)方面的東西。希望對大家有用。這是目錄，具體手冊在附件

發(fā)表于 05-10 21:17

阿里云專有宿主機(jī)（公測）發(fā)布

。為了提供遷移的靈活性，阿里云提供ECS實(shí)例從共享宿主機(jī)遷移至專有宿主機(jī)的選項(xiàng)，同時也支持ECS實(shí)例從一臺專有宿主機(jī)遷移至另一臺專有宿主機(jī)。部署的靈活性能夠給與您更大的部署選擇，降低調(diào)

發(fā)表于 05-15 10:56

阿里云HPC助力新制造 | 上汽仿真計(jì)算云SSCC

消化負(fù)荷，保障CAE仿真計(jì)算求解業(yè)務(wù)順利運(yùn)作。第五，快速POC 直接在阿里云控制臺操作公共云資源開通，分鐘級交付整個集群，即可開展測試。無需

發(fā)表于 05-31 15:30

Bazaar：阿里云Serverless計(jì)算服務(wù)探秘

出現(xiàn)。通過將無服務(wù)器計(jì)算的概念嵌入到整個云計(jì)算服務(wù)的整體框架中，無服務(wù)器計(jì)算正式走進(jìn)了云

發(fā)表于 06-08 15:35

阿里云企業(yè)IPv6部署方案

方便的在阿里云上部署IPv6公網(wǎng)入口，同時將實(shí)例后端關(guān)聯(lián)到線下IDC或其他云平臺的服務(wù)器。在阿里云

發(fā)表于 07-09 16:18

阿里云應(yīng)用上邊緣云解決方案助力互聯(lián)網(wǎng)All in Cloud

計(jì)算再次向場景化服務(wù)邁出重要一步。談到阿里云對邊緣計(jì)算的定義及布局，徐剛表示：“未來，阿里云除了

發(fā)表于 10-11 09:58

阿里展示“云到端”整體方案

MDM9206 中預(yù)集成阿里云 Link 物聯(lián)網(wǎng)套件，模組廠商和物聯(lián)網(wǎng)開發(fā)者可以利用 LTE IoT 連接以及運(yùn)行在 LTE 系統(tǒng)級芯片上的客戶端軟件，實(shí)現(xiàn)解決方案的快速開發(fā)和部署。

發(fā)表于 07-27 06:30

NVIDIA NIM 革命性地改變模型部署，將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

部署在云、數(shù)據(jù)中心或工作站上。借助 NVIDIA NIM，開發(fā)者能夠輕松地為 copilots、聊天機(jī)器人等構(gòu)建生成式 AI 應(yīng)用，所需時間從

發(fā)表于 06-03 09:12 ?320次閱讀

借助NVIDIA NIM加速AI應(yīng)用部署

大語言模型（LLM）在企業(yè)組織中的應(yīng)用日益廣泛，許多企業(yè)都將其整合到 AI 應(yīng)用中。雖然從基礎(chǔ)模型著手十分高效，但需要花費(fèi)一定的精力才能將它們整合到生產(chǎn)就緒型環(huán)境中。NVIDIA NIM簡化了這一過程，使企業(yè)能夠在數(shù)據(jù)中心、云、

發(fā)表于 08-23 16:38 ?596次閱讀

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM，將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型。

發(fā)表于 10-10 09:49 ?594次閱讀

NVIDIA NIM微服務(wù)登陸亞馬遜云科技

經(jīng)過優(yōu)化的 NIM 微服務(wù)現(xiàn)可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取，用于各種 NVIDIA 和生態(tài)系統(tǒng)模型。

發(fā)表于 12-06 13:33 ?514次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

通過阿里云計(jì)算巢快速部署NVIDIA NIM

評論

【產(chǎn)品活動】阿里云GPU云服務(wù)器年付5折！阿里云異構(gòu)計(jì)算助推行業(yè)發(fā)展！

一張圖看懂阿里云新發(fā)布的物聯(lián)網(wǎng)設(shè)備上云神器——HiTSDB + IoT套件

阿里云彈性高性能計(jì)算產(chǎn)品商業(yè)化正式發(fā)布

AI開發(fā)者福音！阿里云推出國內(nèi)首個基于英偉達(dá)NGC的GPU優(yōu)化容器

阿里云免費(fèi)使用及手冊

阿里云專有宿主機(jī)（公測）發(fā)布

阿里云HPC助力新制造 | 上汽仿真計(jì)算云SSCC

Bazaar：阿里云Serverless計(jì)算服務(wù)探秘

阿里云企業(yè)IPv6部署方案

阿里云應(yīng)用上邊緣云解決方案助力互聯(lián)網(wǎng)All in Cloud

阿里展示“云到端”整體方案

NVIDIA NIM 革命性地改變模型部署，將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

借助NVIDIA NIM加速AI應(yīng)用部署

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

NVIDIA NIM微服務(wù)登陸亞馬遜云科技