91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

借助NVIDIA NIM加速AI應用部署

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-08-23 16:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大語言模型(LLM)在企業組織中的應用日益廣泛,許多企業都將其整合到 AI 應用中。雖然從基礎模型著手十分高效,但需要花費一定的精力才能將它們整合到生產就緒型環境中。NVIDIA NIM簡化了這一過程,使企業能夠在數據中心、云、工作站和 PC 等任何位置運行 AI 模型。

專為企業設計的 NIM 提供一整套預構建云原生微服務,這些微服務能夠被輕松地整合到現有基礎設施中。這些微服務經過精心的維護和持續的更新,具有開箱即用的性能,并確保您能夠獲得 AI 推理技術的最新進展。

適用于大語言模型的全新 NVIDIA NIM

基礎模型的增長源于其能夠滿足各種企業需求的能力,但沒有任何一個單一的模型能夠完全滿足企業的需求,企業通常會根據特定的數據需求和 AI 應用工作流,在其用例中使用不同的基礎模型。

考慮到企業需求的多樣化,我們擴大了 NIM 的陣容,涵蓋了Mistral-7B、Mixtral-8x7B和Mixtral-8x22B,這三個基礎模型在特定任務中的表現都十分出色。

wKgZombISu2ABnFsAAEKU7AeGQ4868.png

圖 1. 新的 Mixtral 8x7B Instruct NIM

可從 NVIDIA API 中獲取

Mistral 7B NIM

Mistral 7B Instruct 模型在文本生成和語言理解任務中表現出色。該模型可在單個 GPU 上運行,非常適合語言翻譯、內容生成和聊天機器人等應用。將 Mistral 7B NIM 部署至 NVIDIA 數據中心 GPU 后,開發者在內容生成任務中可實現的開箱即用性能(token/秒),其性能最多可提升至沒有使用 NIM 時的 2.3 倍。

wKgaombISq-AccWAAAFYFUTuXLI634.png

圖 2. Mistral 7B NIM 提高了內容生成的吞吐量

基于 1 個 NVIDIA Tensor Core GPU,輸入 500 個 token,輸出 2,000 個 token。NIM 開啟時:FP8。吞吐量為 5,697 token/秒,TTFT 為 0.6 秒,ITL 為 26 毫秒。NIM 關閉時:FP16。吞吐量為 2,529 token/秒,TTFT 為 1.4 秒,ITL 為 60 毫秒。

Mixtral-8x7B和

Mixtral-8x22B NIM

Mixtral-8x7B 和 Mixtral-8x22B 模型采用混合專家(MoE)架構提供快速且經濟高效的推理。這兩個模型在總結、問題解答和代碼生成等任務中表現出色,非常適合需要實時響應的應用。

相較無 NIM 運行的情況,NIM 可以提高這兩種模型的開箱即用性能。當用于內容生成且在 1 個 NVIDIA Tensor Core GPU 上運行時,Mixtral-8x7B NIM 的吞吐量最多可提高 4.1 倍。在內容生成和翻譯用例中,Mixtral-8x22B NIM 的吞吐量最多可提高 2.9 倍。

wKgZombISseAP6fwAAFZhOnmu9w134.png

圖 3. Mixtral 8x7B NIM

提高了內容生成的吞吐量

輸入 500 個 token,輸出 2,000 個 token。200 個并發請求。NIM 開啟時:FP8。吞吐量為 9,410 token/秒。TTFT 為 740 毫秒,ITL 為 21 毫秒。NIM 關閉時:FP16。吞吐量為 2,300 token/秒,TTFT 為 1,321 毫秒,ITL 為 86 毫秒。

wKgaombIStyAD9Y0AAGc-i0HOjU067.png

圖 4. Mixtral 8x22B NIM

提高了內容生成和翻譯的吞吐量

輸入 1,000 個 token,輸出 1,000 個 token。250 個并發請求。NIM 開啟時:吞吐量為 6,070 token/秒,TTFT 為 3 秒,ITL 為 38 毫秒。NIM 關閉時:吞吐量為 2,067 token/秒,TTFT 為 5 秒,ITL 為 116 毫秒。

借助 NVIDIA NIM 加速 AI 應用部署

開發者可以使用 NIM 縮短構建適用于生產部署的 AI 應用所需的時間,同時還能提高 AI 推理效率,并降低運營成本。借助 NIM,經過優化的 AI 模型實現了容器化,為開發者帶來了以下優勢:

性能和規模

這些云驅動的微服務可提供低延遲、高吞吐量并可以輕松擴展的 AI 推理,使用 Llama 3 70B NIM,最多可將吞吐量提高 5 倍。NIM 還支持精確的微調模型,無需從頭開始構建即可實現超高的準確性,進一步提高了 AI 推理性能。

易于使用

通過簡化與現有系統的整合來加快進入市場的速度,并在 NVIDIA 加速基礎設施上提供最佳性能。借助專為企業使用而設計的 API 和工具,開發者可以實現其 AI 能力的最大化。

安全性和易管理性

確保您的 AI 應用和數據具有強大的可控性和安全性。通過NVIDIA AI Enterprise,NIM 支持在任何基礎設施上的靈活自托管部署,提供企業級軟件、嚴格的驗證以及與 NVIDIA AI 專家的直接連線。

AI 推理的前景:

NVIDIA NIM 及其他延伸

NVIDIA NIM 代表了 AI 推理領域的重大進步。隨著各行各業對 AI 應用需求的日益增長,高效部署這些應用變得至關重要。想要利用 AI 變革力量的企業可以使用 NVIDIA NIM,將預構建的云原生微服務輕松整合到現有系統中,以此加快產品推出速度,保持在創新領域的領先地位。

未來的 AI 推理將超越單個 NVIDIA NIM。隨著對先進 AI 應用的需求不斷增長,連接多個 NVIDIA NIM 將變得至關重要。這種微服務網絡將帶來能夠協同工作和適應各種任務的高度智能化應用,從而深入改變我們使用技術的方式。如要在您的基礎設施上部署 NIM 推理微服務,請查看“使用 NVIDIA NIM 部署生成式 AI 的簡單指南”:

NVIDIA 定期發布新的 NIM,為企業提供最強大的 AI 模型,助企業應用一臂之力。請訪問API 目錄,查找適用于 LLM、視覺、檢索、3D 和數字生物學模型的最新 NVIDIA NIM。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106476
  • AI
    AI
    +關注

    關注

    88

    文章

    35194

    瀏覽量

    280283
  • 模型
    +關注

    關注

    1

    文章

    3522

    瀏覽量

    50452
  • 微服務
    +關注

    關注

    0

    文章

    145

    瀏覽量

    7748

原文標題:全新 NVIDIA NIM:可適用于 Mistral 和 Mixtral 模型并為您的 AI 項目賦能

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA數字人技術加速部署生成式AI驅動的游戲角色

    NVIDIA 在 GDC 2024 大會上宣布,Inworld AI 等領先的 AI 應用程序開發者,正在使用 NVIDIA 數字人技術加速
    的頭像 發表于 04-09 10:08 ?1104次閱讀
    <b class='flag-5'>NVIDIA</b>數字人技術<b class='flag-5'>加速</b><b class='flag-5'>部署</b>生成式<b class='flag-5'>AI</b>驅動的游戲角色

    NVIDIA AI微服務現已與AWS集成,加速藥物研發和數字醫療

    NVIDIA NIM 使數千家使用 AWS 的醫療和生命科學公司能夠快速、輕松開發和部署生成式 AI
    的頭像 發表于 05-09 09:21 ?1910次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數百萬開發者轉變為生成式 AI 開發者

    部署在云、數據中心或工作站上。借助 NVIDIA NIM,開發者能夠輕松地為 copilots、聊天機器人等構建生成式 AI 應用,所需時間
    發表于 06-03 09:12 ?380次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改變模型<b class='flag-5'>部署</b>,將全球數百萬開發者轉變為生成式 <b class='flag-5'>AI</b> 開發者

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,為全球的2800萬英偉達開發者
    的頭像 發表于 06-04 09:15 ?967次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1
    的頭像 發表于 07-25 09:48 ?1066次閱讀

    NVIDIA NIM:打造AI領域的AI-in-a-Box,提高AI開發與部署的高效性

    據7月30日官方發布的資訊顯示,在全球備受矚目的計算機圖形學盛會——SIGGRAPH 2024上,NVIDIA公司對外展示了其在諸如渲染、仿真及生成式AI等前沿領域所取得的卓越成果,而其中最為引人注目的便是NVIDIA
    的頭像 發表于 07-30 16:27 ?1145次閱讀

    借助NVIDIA NIM微服務助力可口可樂公司擴展生成式AI內容

    借助 NVIDIA NIM 微服務 USD Search 和 USD Code,市場營銷領導者 WPP 幫助飲料公司在全球范圍內加速創意活動的迭代。
    的頭像 發表于 08-13 16:16 ?893次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業打造屬于自己的 AI

    可定制工作流目錄加快核心生成式 AI 用例的部署速度。首批用例包括客戶服務、藥物研發和 PDF 數據提取,未來將加入更多用例 企業可以使用 NIM Agent Blueprints 以及
    發表于 08-28 10:10 ?387次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,助力企業打造屬于自己的 <b class='flag-5'>AI</b>

    NVIDIA NIM助力企業高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調用來大規模地部署大語言模型。
    的頭像 發表于 10-10 09:49 ?774次閱讀

    日本企業借助NVIDIA產品加速AI創新

    日本領先企業和大學正在使用 NVIDIA NeMo、NIM 微服務和 NVIDIA Isaac 加速 AI 創新。
    的頭像 發表于 11-19 14:34 ?958次閱讀

    NVIDIA推出適用于網絡安全的NIM Blueprint

    德勤使用適用于容器安全的 NVIDIA NIM Agent Blueprint 幫助企業利用開源軟件構建安全的 AI
    的頭像 發表于 11-20 09:58 ?712次閱讀

    全新NVIDIA NIM微服務實現突破性進展

    全新 NVIDIA NIM 微服務實現突破性進展,可助力氣象技術公司開發和部署 AI 模型,實現對降雪、結冰和冰雹的預測。
    的頭像 發表于 11-21 10:07 ?680次閱讀

    NVIDIA 發布保障代理式 AI 應用安全的 NIM 微服務

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務,能夠為各行業構建 AI 的企業提高 AI 的準確性、安
    發表于 01-17 16:29 ?162次閱讀

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業加速代理式AI推理

    Enterprise 軟件平臺之間的集成,將使 160 多個 AI 工具和 100 多個 NVIDIA NIM 微服務通過 OCI 控制臺以原生方式提供。此外,Oracle 和 NVIDIA
    的頭像 發表于 03-21 12:01 ?718次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    NVIDIA攜手諾和諾德借助AI加速藥物研發

    NVIDIA 宣布與諾和諾德開展合作,借助創新 AI 應用加速藥物研發。此次合作也將支持諾和諾德與丹麥 AI 創新中心 (DCAI) 關于使
    的頭像 發表于 06-12 15:49 ?521次閱讀
    主站蜘蛛池模板: 偷偷鲁影院手机在线观看 | 成年免费大片黄在线观看免费 | 免费一级毛片在线播放 | 美女被免费视频网站九色 | 免费人成黄页在线观看日本 | 亚洲精品国产美女在线观看 | 亚洲区在线播放 | 欧美黄色片在线播放 | 亚洲一区二区电影 | 狠狠操狠狠插 | 国产在播放一区 | 美女涩涩网站 | 九月丁香婷婷亚洲综合色 | 美女视频黄视大全视频免费网址 | 女同性进行性行为视频 | 8050网午夜一级毛片免费不卡 | 五月婷婷电影 | 国产精品三级国语在线看 | 欧美日韩一区二区视频图片 | 最近国语剧情视频在线观看 | 欧美精品专区55页 | 在线麻豆国产传媒60在线观看 | 色偷偷888欧美精品久久久 | 女人午夜啪啪性刺激免费看 | videosxxoo18欧美| 男人边吃奶边爱边做视频日韩 | 色婷婷综合久久久中文字幕 | 一级毛片 在线播放 | 特黄特色的大片观看免费视频 | 色综合久久天天综合绕观看 | 窝窝午夜看片成人精品 | 日韩亚洲欧洲在线com91tv | www.射射| 日本a级三级三级三级久久 日本a级影院 | 欧美网站在线播放 | 老汉影视永久免费视频 | 在线视频免费观看 | 亚洲人成综合网站在线 | 欧美色综合久久 | 色播在线永久免费视频网站 | 视频在线观看免费网址 |