在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Microsoft使用NVIDIA Triton加速AI Transformer模型應用

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-04-02 13:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Microsoft 的目標是,通過結合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件,率先將一系列強大的 AI Transformer 模型投入生產用途。

如果您的軟件能喚起人們喜悅的淚水,您就是在傳播歡樂。

Translator 是一項 Microsoft Azure 認知服務,通過應用一些規模龐大的 AI 模型來幫助更多人進行交流。

“有太多精彩的故事可以講了!” Translator 開發經理 Vishal Chowdhary 表示。

比如,在 2010 年海地遭受 7.0 級地震后,在短短 5 天的沖刺期里為相關應用緊急添加海地克里奧爾語支持,進而為救援人員提供幫助。再比如,祖父母在使用這款軟件,與講著他們不懂的語言的遠方孫輩進行第一次實時交流時,感動到哽咽。

雄心勃勃的目標

“我們的愿景是,讓成千上萬的開發者都已經在使用的這個 API,能打破不同語言、不同模式之間的阻礙。” Chowdhary 說。

考量全球現行的語言大約有 7000 種,這真的是個雄心勃勃的目標。

因此,團隊采用了一種強大而復雜的工具,即是混合專家系統(MoE)AI 方法。

在推動自然語言處理快速發展進步的 Transformer 模型中,這是非常先進的一種。它具有 50 億個參數,其規模比團隊在生產過程中用于自然語言處理的最大模型大了 80 倍。

MoE 模型涉及到龐大的計算量,很難找到能將其投入生產環境中使用的用戶。在初始測試中,基于 CPU 的服務器無法滿足團隊要在一秒鐘內完成翻譯一個文檔的要求。

27 倍的提速

隨后,該團隊使用 NVIDIA Triton 推理服務器(本周 GTC 大會上宣布的 NVIDIA AI Enterprise 2.0 平臺的其中一部分)在加速系統上進行了測試。

Chowdhary 說:“借助 NVIDIA GPU 和 Triton,我們得以實現這一目標,且非常高效。”

事實上,相較于未經優化的 GPU 運行時,該團隊實現了高達 27 倍的提速。

“這讓我們可以構建一個模型來執行不同的語言理解任務,例如匯總、生成文本和翻譯等,而不必為每個任務開發單獨的模型。” 負責監督測試的 Microsoft 首席研究員 Hanny Hassan Awadalla 表示。

Triton 如何提供幫助

Microsoft 的模型能將大型任務(如翻譯多個文檔)拆分為許多個小任務,在每個小任務中翻譯幾百個句子。Triton 的動態批處理功能將諸多此類請求整合起來,從而充分利用 GPU 的強大功能。

對于 Triton 使用 CPU、GPU 或其他加速器在各種模式下運行各種模型的能力,讓該團隊贊不絕口。

Chowdhary 的團隊十多年來一直在開發大規模分布式系統。Chowdhary 表示:“這種解決方案周到地考慮了我的工作場景,提供了我想要的各種功能,就像是我給自己親手定制的解決方案一樣。

在幕后,有兩個軟件組件是 Triton 取得成功的關鍵。一個是 NVIDIA 擴展型 FasterTransformer,這是一個處理推理計算的軟件層,可支持 MoE 模型。另一個是 CUTLASS,這是一個 NVIDIA 數學庫,有助于高效實現模型。

在四周內提供已驗證的原型

盡管測試十分復雜,但該團隊通過與 NVIDIA 工程師合作并運用 Triton 的強大力量,在不到一個月的時間內就獲得了可投入正常運轉的端到端原型。

“在如此之短的時間內制作出一款達到可發布程度的產品,這樣的效率實在令人印象深刻,對此我真的非常感激。” Awadalla 這樣說道。

雖然這是該團隊第一次使用 Triton,但 “我們使用它來發布 MoE 模型,不用花費太多力氣就重新構建了運行時環境,現在我衷心希望在我們的長期托管系統中納入這款解決方案。” Chowdhary 補充表示。

采取后續措施

加速后的服務將采用審慎的步驟實施,初期會用于少數幾種主要語言的文檔翻譯。

Chowdhary 表示:“我們的最終目標是,讓客戶能在所有場景中通過透明的方式獲享這些新模型的優點。”

這項工作是 Microsoft 的一項涉獵更廣泛的計劃的一部分。其目的是推動 Office 和 Teams 等眾多產品的進步,幫助各類開發者與客戶(從專注于打造一款應用的小型公司到財富 500 強企業)取得發展。

為了給這一計劃鋪平道路,Awadalla 的團隊于去年 9 月發表了一項研究成果,介紹如何在 NVIDIA A100 Tensor Core GPU 上訓練具有多達 2 千億個參數的 MoE 模型。自那之后,該團隊還在具有超過 3 千億個參數的模型上使用 80G 版本的 A100 GPU,將性能提升了 8 倍。

Adawalla 表示:“為了更好地表示更多的語言,尤其是我們手頭沒有太多數據的語言,模型必定會越來越大。”

原文標題:GTC22 | 促進人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質量和效率

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5284

    瀏覽量

    106140
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4930

    瀏覽量

    131015
  • AI
    AI
    +關注

    關注

    88

    文章

    34890

    瀏覽量

    277757
  • Microsoft
    +關注

    關注

    0

    文章

    222

    瀏覽量

    7263

原文標題:GTC22 | 促進人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質量和效率

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA攜手諾和諾德借助AI加速藥物研發

    NVIDIA 宣布與諾和諾德開展合作,借助創新 AI 應用加速藥物研發。此次合作也將支持諾和諾德與丹麥 AI 創新中心 (DCAI) 關于使用 Gefion
    的頭像 發表于 06-12 15:49 ?423次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Love
    的頭像 發表于 06-12 15:37 ?491次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Triton</b>和TensorRT-LLM部署TTS應用的最佳實踐

    NVIDIA Cosmos加速機器人和自動駕駛汽車物理AI發展

    NVIDIA Cosmos 通過可預測未來世界狀態的世界基礎模型加速物理 AI 的發展。
    的頭像 發表于 04-24 11:01 ?502次閱讀
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>機器人和自動駕駛汽車物理<b class='flag-5'>AI</b>發展

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    Triton 推理服務器的后續產品,NVIDIA Dynamo 是一款全新的 AI 推理服務軟件,旨在為部署推理 AI 模型
    的頭像 發表于 03-20 15:03 ?610次閱讀

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首
    發表于 03-19 15:24 ?349次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    NVIDIA推出面向RTX AI PC的AI基礎模型

    NVIDIA 今日發布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
    的頭像 發表于 01-08 11:01 ?518次閱讀

    NVIDIA Cosmos世界基礎模型平臺發布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進的生成式世界基礎模型、高級 tokenizer、護欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機器人等物理
    的頭像 發表于 01-08 10:39 ?536次閱讀

    Triton編譯器在機器學習中的應用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務平臺的一部分,它負責將深度學習模型轉換為優化的格式,以便
    的頭像 發表于 12-24 18:13 ?942次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發表于 11-27 11:29 ?803次閱讀

    Transformer模型的具體應用

    如果想在 AI 領域引領一輪新浪潮,就需要使用到 Transformer
    的頭像 發表于 11-20 09:28 ?1525次閱讀
    <b class='flag-5'>Transformer</b><b class='flag-5'>模型</b>的具體應用

    NVIDIA AI加速推進藥物研發

    在當前的醫療健康領域,AI 的重要性愈發凸顯。NVIDIA AI加速推進藥物研發,致力于減少藥物的研發時間和成本,使更多的老年患者能夠更快獲得關鍵治療。
    的頭像 發表于 11-19 16:07 ?676次閱讀

    NVIDIA加速AI在日本各行各業的應用

    企業借助基于 NVIDIA AI Enterprise 與 Omniverse 工業 AI 構建的創新中心和服務加速 AI 轉型。
    的頭像 發表于 11-19 15:45 ?728次閱讀

    日本企業借助NVIDIA產品加速AI創新

    日本領先企業和大學正在使用 NVIDIA NeMo、NIM 微服務和 NVIDIA Isaac 加速 AI 創新。
    的頭像 發表于 11-19 14:34 ?889次閱讀

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態的優勢,為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和
    的頭像 發表于 09-09 09:19 ?910次閱讀

    NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業和各國現在能夠使用自有數據與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構建“超級
    發表于 07-24 09:39 ?910次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球企業打造自定義 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>
    主站蜘蛛池模板: 四虎国产永久在线精品免费观看 | 免费在线观看你懂的 | 国产看午夜精品理论片 | 777kkk亚洲综合欧美色老头 | 狠狠色丁香婷婷综合视频 | 中日韩免费视频 | 久久天天躁狠狠躁夜夜爽蜜月 | 精品国内一区二区三区免费视频 | 四虎国产精品永久地址49 | 婷婷久久综合九色综合98 | 美女黄视频免费 | 久久久久久久影院 | 91在线网| 三级精品视频在线播放 | 国产成人永久免费视频 | 欧美人与牲动交xxxxbbbb | 手机在线观看你懂的 | 久久黄网站 | 在线免费视频手机版 | 国产视频日本 | 国产亚洲美女精品久久久2020 | 日本人69xxxxx| 拍拍拍交性免费视频 | 放荡的俄罗斯美女bd | 国产成人三级视频在线观看播放 | 天天躁日日躁狠狠躁一级毛片 | 亚洲精品蜜桃久久久久久 | 国产va精品免费观看 | 亚洲成综合人影院在院播放 | 午夜69成人做爰视频网站 | 大色综合| 亚洲国产一区二区三区a毛片 | 四虎影院在线免费播放 | 免费播放欧美毛片欧美aaaaa | 日韩黄色录像 | 色婷婷激婷婷深爱五月老司机 | 国产成人综合欧美精品久久 | 色偷偷免费视频 | 欧美天天干 | 激情五月婷婷基地 | xxxx日本在线播放免费不卡 |