在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA為全球企業(yè)開發(fā)和部署大型語言模型打開一扇新的大門

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2021-11-12 14:30 ? 次閱讀

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語言模型Megatron 530B;多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語言的AI開發(fā)和部署,推動(dòng)行業(yè)和科學(xué)發(fā)展

NVIDIA為全球企業(yè)開發(fā)和部署大型語言模型打開了一扇新的大門——使這些企業(yè)能夠建立他們自己的、特定領(lǐng)域的聊天機(jī)器人、個(gè)人助理和其他AI應(yīng)用程序,并能夠以前所未有的水平理解語言中的微妙和細(xì)微差別。

NVIDIA推出了為訓(xùn)練具有數(shù)萬億參數(shù)的語言模型而優(yōu)化的NVIDIA NeMo Megatron框架、為新領(lǐng)域和語言進(jìn)行訓(xùn)練的可定制大型語言模型(LLM)Megatron 530B以及具有多GPU、多節(jié)點(diǎn)分布式推理功能的NVIDIA Triton推理服務(wù)器。

這些工具與NVIDIA DGX系統(tǒng)相結(jié)合,提供了一個(gè)可部署到實(shí)際生產(chǎn)環(huán)境的企業(yè)級(jí)解決方案,以簡化大型語言模型的開發(fā)和部署。

“大型語言模型已被證明是靈活且功能強(qiáng)大的,無需專門的培訓(xùn)或監(jiān)督,即可回答深層次領(lǐng)域問題,翻譯語言,理解和總結(jié)文件,編寫故事和計(jì)算程序。” NVIDIA應(yīng)用深度學(xué)習(xí)研究副總裁Bryan Catanzaro表示。“ 為新的語言和領(lǐng)域建立大型語言模型可能仍然是最大的超級(jí)計(jì)算的應(yīng)用,現(xiàn)在這些功能對(duì)全球的企業(yè)也變得觸手可及。”

NVIDIA NeMo Megatron和Megatron 530B

加速大型語言模型開發(fā)

NVIDIA NeMo Megatron是在Megatron的基礎(chǔ)上發(fā)展起來的開源項(xiàng)目,由NVIDIA研究人員主導(dǎo),研究大型轉(zhuǎn)換語言模型的高效訓(xùn)練。Megatron 530B是世界上最大的可定制語言模型。

NeMo Megatron框架使企業(yè)能夠克服訓(xùn)練復(fù)雜自然語言處理模型的挑戰(zhàn)。經(jīng)過優(yōu)化,可以在NVIDIA DGX SuperPOD的大規(guī)模加速計(jì)算基礎(chǔ)設(shè)施上進(jìn)行擴(kuò)展。

NeMo Megatron通過數(shù)據(jù)處理庫自動(dòng)處理LLM訓(xùn)練的復(fù)雜性,這些數(shù)據(jù)處理庫可以攝入、策劃、組織和清理數(shù)據(jù)。利用先進(jìn)的數(shù)據(jù)、張量和管道并行化技術(shù),它能使大型語言模型的訓(xùn)練有效地分布在成千上萬的GPU上。企業(yè)可以通過NeMo Megatron框架進(jìn)一步訓(xùn)練它以服務(wù)新的領(lǐng)域和語言。

NVIDIA Triton推理服務(wù)器

助力實(shí)時(shí)大型語言模型推理

此外,今日發(fā)布的最新NVIDIA Triton推理服務(wù)器中的多GPU、多節(jié)點(diǎn)特性,使大型語言模型推理工作負(fù)載能夠?qū)崟r(shí)在多個(gè)GPU和節(jié)點(diǎn)上擴(kuò)展。這些模型需要的內(nèi)存比單個(gè)GPU甚至是包含多個(gè)GPU的大型服務(wù)器所能提供的還要多,并且,實(shí)際應(yīng)用對(duì)其推理實(shí)時(shí)性有著極高的要求。

通過Triton推理服務(wù)器,Megatron530B能夠在兩個(gè)NVIDIA DGX系統(tǒng)上運(yùn)行,將處理時(shí)間從CPU服務(wù)器上的1分鐘以上縮短到半秒,令實(shí)時(shí)應(yīng)用部署大型語言模型成為可能。

全球范圍開發(fā)的大規(guī)模定制語言模型

使用NVIDIA DGX SuperPOD構(gòu)建大型復(fù)雜語言模型的早期客戶包括SiDi、京東探索研究院和VinBrai。 SiDi是巴西的一家大型AI 研究和開發(fā)機(jī)構(gòu),已經(jīng)采用三星虛擬助手,供全國 2 億巴西葡萄牙語者使用。 SiDi 首席執(zhí)行官John Yi 表示:“SiDi 團(tuán)隊(duì)在AI 虛擬助理和聊天機(jī)器人開發(fā)方面擁有豐富的經(jīng)驗(yàn),此類開發(fā)既需要強(qiáng)大的 AI 性能,也需要經(jīng)過訓(xùn)練并適應(yīng)人類語言不斷變化的細(xì)微差別的專用軟件。NVIDIA DGX SuperPOD 非常適合推動(dòng)我們團(tuán)隊(duì)的先進(jìn)工作,幫助我們?yōu)榘臀鞯钠咸蜒勒Z者提供領(lǐng)先的AI 服務(wù)。” 京東探索研究院,是以供應(yīng)鏈為基礎(chǔ)的領(lǐng)先技術(shù)和服務(wù)提供商京東的研發(fā)部門,他們利用 NVIDIA DGX SuperPOD 開發(fā)NLP,應(yīng)用于智能客戶服務(wù)、智能零售、智能物流、物聯(lián)網(wǎng)、醫(yī)療健康等領(lǐng)域。 VinBrain,越南的醫(yī)療健康 AI 公司,他們使用 DGX SuperPOD 為100 家醫(yī)院的放射科醫(yī)生和遠(yuǎn)程醫(yī)療醫(yī)生開發(fā)和部署了一種臨床語言模型。在這些醫(yī)院,已有 600 多名醫(yī)療健康從業(yè)者使用該模型。

供應(yīng)情況

企業(yè)可以利用今天同期發(fā)布的NVIDIA LaunchPad,免費(fèi)體驗(yàn)開發(fā)和部署大型語言模型。行業(yè)組織可以申請(qǐng)加入搶先體驗(yàn)計(jì)劃,了解用于訓(xùn)練大規(guī)模語言模型的 NVIDIA NeMo Megatron 加速框架。

NVIDIA Triton可從NVIDIA NGC目錄中獲得,該目錄是GPU優(yōu)化的AI軟件中心,包括框架、工具包、預(yù)訓(xùn)練模型和Jupyter Notebooks,并可從Triton GitHub repository中獲取開放源代碼。

Triton也包含在NVIDIA AI Enterprise軟件套件中,該套件由NVIDIA優(yōu)化、認(rèn)證和支持。企業(yè)可以使用該軟件套件,在內(nèi)部數(shù)據(jù)中心和私有云的主流加速服務(wù)器上運(yùn)行語言模型推理。

NVIDIA DGX SuperPOD 和NVIDIA DGX 系統(tǒng)通過NVIDIA 的全球經(jīng)銷商提供,這些合作伙伴能夠根據(jù)要求為符合條件的客戶提供詢價(jià)服務(wù)。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103723
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31520

    瀏覽量

    270339
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3309

    瀏覽量

    49224

原文標(biāo)題:GTC21 | NVIDIA 借助超大規(guī)模 AI 語言模型為全球企業(yè)賦能

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    企業(yè)AI模型部署攻略

    當(dāng)下,越來越多的企業(yè)開始探索和實(shí)施AI模型,以提升業(yè)務(wù)效率和競(jìng)爭(zhēng)力。然而,AI模型部署并非易事,需要企業(yè)在多個(gè)層面進(jìn)行細(xì)致的規(guī)劃和準(zhǔn)備。下
    的頭像 發(fā)表于 12-23 10:31 ?172次閱讀

    語言模型開發(fā)框架是什么

    語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型
    的頭像 發(fā)表于 12-06 10:28 ?181次閱讀

    語言模型開發(fā)語言是什么

    在人工智能領(lǐng)域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發(fā)語言和工具的支持。下面,AI部落小編為您介紹大
    的頭像 發(fā)表于 12-04 11:44 ?231次閱讀

    云端語言模型開發(fā)方法

    云端語言模型開發(fā)個(gè)復(fù)雜而系統(tǒng)的過程,涉及數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練優(yōu)化、部署應(yīng)用等多個(gè)環(huán)節(jié)。
    的頭像 發(fā)表于 12-02 10:48 ?195次閱讀

    語言模型如何開發(fā)

    語言模型開發(fā)個(gè)復(fù)雜且細(xì)致的過程,涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)和部署等多個(gè)階段
    的頭像 發(fā)表于 11-04 10:14 ?214次閱讀

    如何利用大型語言模型驅(qū)動(dòng)的搜索公司創(chuàng)造價(jià)值

    大型語言模型LLMs具有自動(dòng)化內(nèi)容創(chuàng)建、提高內(nèi)容質(zhì)量及多樣化的潛力,可重塑企業(yè)與信息的交互方式。通過利用LLMs,企業(yè)能提升工作效率,降低運(yùn)
    的頭像 發(fā)表于 10-13 08:07 ?220次閱讀
    如何利用<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>驅(qū)動(dòng)的搜索<b class='flag-5'>為</b>公司創(chuàng)造價(jià)值

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺(tái)集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署語言模型
    的頭像 發(fā)表于 10-10 09:49 ?450次閱讀

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發(fā)布了款全新的領(lǐng)先語言模型Mistral NeMo 12B。開發(fā)者可以輕松定制和
    的頭像 發(fā)表于 07-27 11:04 ?721次閱讀

    NVIDIA AI Foundry 全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Retriever 微服務(wù),以實(shí)現(xiàn)準(zhǔn)確響應(yīng) 埃森哲率先使用新服務(wù),客戶創(chuàng)建自定義 Llama 3.1 模型;Aramco、ATT 和優(yōu)步。 ? Llama 3.1 多語種大語言模型
    發(fā)表于 07-24 09:39 ?742次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry <b class='flag-5'>為</b><b class='flag-5'>全球</b><b class='flag-5'>企業(yè)</b>打造自定義 Llama 3.1 生成式 AI <b class='flag-5'>模型</b>

    富士通與Cohere合作,專注于開發(fā)和提供大型語言模型(LLM)

    富士通(Fujitsu)與總部位于多倫多與舊金山的頂尖安全及數(shù)據(jù)隱私人工智能企業(yè)Cohere Inc.攜手宣布建立深度戰(zhàn)略合作伙伴關(guān)系,共同致力于大型語言模型(LLM)的創(chuàng)新與
    的頭像 發(fā)表于 07-16 16:55 ?538次閱讀

    英偉達(dá)開源Nemotron-4 340B系列模型,助力大型語言模型訓(xùn)練

    近日,英偉達(dá)宣布開源了款名為Nemotron-4 340B的大型模型,這壯舉為開發(fā)者們打開了通往高性能
    的頭像 發(fā)表于 06-17 14:53 ?634次閱讀

    NVIDIA 通過 Holoscan NVIDIA IGX 提供企業(yè)軟件支持

    部署邊緣 AI 解決方案。 NVIDIA AI Enterprise-IGX 是款全新產(chǎn)品,其為企業(yè)的邊緣計(jì)算軟件堆棧提供前所未有的性能、安全性和支持,簡
    的頭像 發(fā)表于 06-04 10:21 ?566次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)

    和測(cè)試 ? COMPUTEX—2024 年 6 月 2 日— NVIDIA 于今日宣布,全球 2,800 萬開發(fā)者現(xiàn)可下載 NVIDIA NIM?——
    發(fā)表于 06-03 09:12 ?262次閱讀
    <b class='flag-5'>NVIDIA</b> NIM 革命性地改變<b class='flag-5'>模型</b><b class='flag-5'>部署</b>,將<b class='flag-5'>全球</b>數(shù)百萬<b class='flag-5'>開發(fā)</b>者轉(zhuǎn)變?yōu)樯墒?AI <b class='flag-5'>開發(fā)</b>者

    QSPI工作在QUAD模式下,擦除第一扇區(qū)成功,第二區(qū)失敗為什么?

    請(qǐng)教下,QSPI 為何工作在 QUAD模式下,擦除第一扇區(qū)所需要的時(shí)間基本上是OK,擦除第二區(qū) 所需要的時(shí)間怎么會(huì)是 0ms ???
    發(fā)表于 05-07 07:58

    基于北京迅iTOP-RK3588大語言模型部署測(cè)試

    基于北京迅iTOP-RK3588大語言模型部署測(cè)試
    的頭像 發(fā)表于 04-25 14:35 ?1019次閱讀
    基于北京迅<b class='flag-5'>為</b>iTOP-RK3588大<b class='flag-5'>語言</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>測(cè)試
    主站蜘蛛池模板: 亚洲欧美一区二区三区图片 | 天天干视频网 | 夜夜夜操操操 | 人人揉人人爽五月天视频 | 成人午夜视频免费看欧美 | 午夜激情福利 | 大蕉久久伊人中文字幕 | 亚洲qingse中文字幕久久 | 97一区二区三区 | 天天色天天射天天操 | 婷婷开心六月久久综合丁香 | 婷婷开心激情 | 立即播放免费毛片一级 | 亚洲国产精品久久网午夜 | 成人午夜亚洲影视在线观看 | 天堂视频网| 夜夜操天天操 | 亚洲怡红院在线观看 | 亚洲成人自拍 | 日本偷偷操 | 色天天天天| 在线黄色免费观看 | 婷婷综合五月天 | 男人j桶进女人j的视频 | 久久精品高清视频 | 免费爱爱网址 | 天天做天天爱天天射 | 俺要操 | 37pao强力打造免费高速高清 | 久久ww | 日本三级免费看 | 午夜视频一区二区 | 国产拍拍拍精品视频 | 日本一区视频在线观看 | 天天摸天天操天天干 | 午夜视频在线观看完整高清在线 | 日日操夜夜操狠狠操 | 成人午夜久久 | 在线视频亚洲一区 | 欧美一级视频在线观看 | 222aaa免费国产在线观看 |