在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊云與NVIDIA仍持續(xù)為AI推理加速進(jìn)行合作

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-31 09:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

騰訊云計(jì)算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個(gè) AI 組件。基于 GPU 異構(gòu)計(jì)算平臺(tái)針對(duì)業(yè)界 AI 訓(xùn)練和推理任務(wù)進(jìn)行了全方位的加速優(yōu)化。TACO Kit 不僅大大提升了 GPU 集群上多機(jī)多卡分布式訓(xùn)練的效率,對(duì)于 GPU 上的模型推理也通過(guò)集成 NVIDIA TensorRT 帶來(lái)了顯著加速。雙方團(tuán)隊(duì)就 GPU 推理加速這一話(huà)題將進(jìn)行持續(xù)深入的合作,推出定制化的優(yōu)化方案,為業(yè)界客戶(hù)帶來(lái)顯著的性能收益。

騰訊云計(jì)算加速套件TACO Kit(Tencent Cloud Accelerated Computing Optimization Kit)是一種異構(gòu)計(jì)算加速軟件服務(wù),具備領(lǐng)先的 GPU 共享技術(shù)和業(yè)界唯一的 GPU 在離線混部能力,搭配騰訊自研的軟硬件協(xié)同優(yōu)化組件和硬件廠商特有優(yōu)化方案,支持物理機(jī)、云服務(wù)器、容器等產(chǎn)品的計(jì)算加速、圖形渲染、視頻轉(zhuǎn)碼各個(gè)應(yīng)用場(chǎng)景,幫助用戶(hù)實(shí)現(xiàn)全方位全場(chǎng)景的降本增效。

其中,AI 加速引擎 TACO Train 和 TACO Infer 是騰訊云虛擬化團(tuán)隊(duì)依托云帆團(tuán)隊(duì),立足于騰訊內(nèi)部豐富的 AI 業(yè)務(wù)場(chǎng)景,深耕訓(xùn)練框架優(yōu)化、分布式框架優(yōu)化、網(wǎng)絡(luò)通信優(yōu)化、推理性能優(yōu)化等關(guān)鍵技術(shù),攜手打造的一整套 AI 加速方案。為了更好的服務(wù)用戶(hù),騰訊云決定將內(nèi)部深度優(yōu)化的加速方案免費(fèi)提供給公有云用戶(hù),助力廣大用戶(hù)提高 AI 產(chǎn)品迭代效率。

無(wú)論對(duì)于 AI 訓(xùn)練或 AI 推理,如何有效提升 AI 任務(wù)的性能,節(jié)省硬件資源成本,是業(yè)界持續(xù)追求的目標(biāo)。在訓(xùn)練方面,隨著 AI 模型規(guī)模的擴(kuò)大及訓(xùn)練數(shù)據(jù)的增多,用戶(hù)對(duì)模型的迭代效率要求也隨之增長(zhǎng),單個(gè) GPU 的算力已無(wú)法滿(mǎn)足大部分業(yè)務(wù)場(chǎng)景,使用單機(jī)多卡或多機(jī)多卡訓(xùn)練已成為趨勢(shì)。但用戶(hù)在部署分布式訓(xùn)練系統(tǒng)時(shí),時(shí)常面臨著難以充分利用 GPU 資源、訓(xùn)練效率低下的問(wèn)題,而分布式訓(xùn)練性能調(diào)優(yōu)卻是需要同時(shí)進(jìn)行通信優(yōu)化、計(jì)算優(yōu)化的極其復(fù)雜的問(wèn)題。

在推理方面,對(duì)多種多樣的工作負(fù)載進(jìn)行推理加速也是業(yè)界共同的需求。這需要考慮如何對(duì)不同框架訓(xùn)練的模型進(jìn)行統(tǒng)一的高效部署;如何整合各類(lèi)加速軟件和技術(shù),對(duì)接不同模型和業(yè)務(wù)場(chǎng)景。

在訓(xùn)練方面,TACO Train 推出 Tencent TensorFlow(以下簡(jiǎn)稱(chēng) TTF), 針對(duì)特定業(yè)務(wù)場(chǎng)景的 XLA,Grappler 圖優(yōu)化,以及自適應(yīng)編譯框架解決冗余編譯的問(wèn)題,并對(duì) TensorFlow 1.15 添加了對(duì)CUDA 11的支持,讓用戶(hù)可以使用NVIDIA A100 Tensor Core GPU來(lái)進(jìn)行模型訓(xùn)練。另外,TACO Train 推出 LightCC 這一基于 Horovod 深度優(yōu)化的分布式訓(xùn)練框架,在保留了原生 Horovod 的易用性上,增加了性能更好的通信方式。相比 Horovod,LightCC 能夠?qū)?2D AllReduce 充分利用通信帶寬;在 GPU 上訓(xùn)練時(shí)提供高效的梯度融合方式;并使用 TOPK 壓縮通信,降低通信量,提高傳輸效率。最后,騰訊云自研了用戶(hù)態(tài)網(wǎng)絡(luò)協(xié)議棧 HARP,可以通過(guò) Plug-in 的方式集成到NVIDIA NCCL中,無(wú)需任何業(yè)務(wù)改動(dòng),加速云上分布式訓(xùn)練性能,從而解決了目前普遍使用的內(nèi)核網(wǎng)絡(luò)協(xié)議棧存在著一些必要的開(kāi)銷(xiāo)導(dǎo)致其不能很好地利用高速網(wǎng)絡(luò)設(shè)備的問(wèn)題。

在推理方面,TACO Infer 通過(guò)跨平臺(tái)統(tǒng)一的優(yōu)化接口賦能用戶(hù),讓渴望加速計(jì)算的用戶(hù)輕松駕馭騰訊云上豐富的異構(gòu)算力。TACO Infer 針對(duì) GPU 推理任務(wù),集成了NVIDIA TensorRT,利用其極致的模型優(yōu)化能力,使推理過(guò)程能夠達(dá)到令人滿(mǎn)意的性能。此外,TACO 也將自定義的高性能 kernel 實(shí)現(xiàn)與TensorRT相結(jié)合,極大地提升用戶(hù)的推理效率。

TACO Kit 針對(duì) GPU 的訓(xùn)練優(yōu)化,為諸多業(yè)務(wù)帶來(lái)了顯著的性能提升。在某電商平臺(tái)推薦業(yè)務(wù)Wide & Deep 模型訓(xùn)練任務(wù)中,TACO Train 提供的方案通過(guò)定制化高性能 GPU 算子,使延遲從 14.3ms 下降至 2.8ms;整體訓(xùn)練性能提升 43%,成本下降 11%;在另一電商推薦場(chǎng)景 MMoE 模型的訓(xùn)練任務(wù)中,TACO Train 提供的訓(xùn)練方案,在NVIDIA V100 Tensor Core GPU集群上,使計(jì)算速度性?xún)r(jià)比相比于 CPU 集群提升了 3.2 倍,收斂速度性?xún)r(jià)比相比于 CPU 集群提升了 24.3 倍。

目前,騰訊云 TACO Kit 與 NVIDIA 雙方團(tuán)隊(duì)仍持續(xù)為 AI 推理加速進(jìn)行合作。未來(lái)也將針對(duì)一些常見(jiàn)的業(yè)務(wù)模型,圍繞TensorRT進(jìn)行聯(lián)合優(yōu)化,將模型推理的性能推向更高的水準(zhǔn),為業(yè)界有推理加速需求的客戶(hù)提供一站式的優(yōu)化方案。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5299

    瀏覽量

    106291
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131174
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279073
  • 騰訊云
    +關(guān)注

    關(guān)注

    0

    文章

    221

    瀏覽量

    17097

原文標(biāo)題:騰訊云與 NVIDIA 深度合作,打造計(jì)算加速套件 TACO Kit 加速 GPU AI 計(jì)算全鏈路

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動(dòng)各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過(guò)深化合作提供先進(jìn)的技術(shù),從到 PC 加速
    的頭像 發(fā)表于 05-27 14:03 ?344次閱讀

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫(kù)與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?688次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b><b class='flag-5'>合作</b>助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?710次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開(kāi)源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴(kuò)展
    的頭像 發(fā)表于 03-20 15:03 ?635次閱讀

    通用汽車(chē)和NVIDIA合作構(gòu)建定制化AI系統(tǒng)

    通用汽車(chē)和 NVIDIA 宣布正在借助 AI、仿真和加速計(jì)算技術(shù),合作打造下一代汽車(chē)、工廠和機(jī)器人。
    的頭像 發(fā)表于 03-20 14:40 ?1023次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式
    發(fā)表于 03-19 15:24 ?353次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>合作</b>助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、Crowd
    發(fā)表于 03-19 09:31 ?228次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開(kāi)放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> 平臺(tái)

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 02-08 09:59 ?702次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    騰訊申請(qǐng)注冊(cè)“騰訊AI代碼助手”商標(biāo)

    致力于提升編程效率的智能工具。其主要功能包括代碼的智能補(bǔ)全和自動(dòng)生成,旨在幫助開(kāi)發(fā)者更加高效地進(jìn)行編程工作。這款工具的出現(xiàn),標(biāo)志著騰訊在人工智能和計(jì)算領(lǐng)域的技術(shù)實(shí)力得到了進(jìn)一步的提升。 值得注意的是,
    的頭像 發(fā)表于 12-13 10:28 ?683次閱讀

    NVIDIA與軟銀集團(tuán)合作加速日本主權(quán)AI計(jì)劃

    NVIDIA 宣布與軟銀集團(tuán)開(kāi)展一系列合作,旨在加速日本主權(quán) AI 計(jì)劃,并進(jìn)一步提升日本在全球的技術(shù)領(lǐng)先優(yōu)勢(shì),同時(shí)全球電信運(yùn)營(yíng)商開(kāi)辟數(shù)十
    的頭像 發(fā)表于 11-19 15:49 ?753次閱讀

    印尼GOTO、騰訊與阿里簽署合作協(xié)議

    近日,印尼知名科技公司GOTO與中國(guó)的騰訊、阿里正式簽署了合作協(xié)議。此次攜手合作,旨在共同推動(dòng)印尼數(shù)字經(jīng)濟(jì)的發(fā)展,
    的頭像 發(fā)表于 11-11 14:32 ?834次閱讀

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過(guò) Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理
    的頭像 發(fā)表于 10-27 10:03 ?807次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

    NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM
    的頭像 發(fā)表于 10-10 09:35 ?829次閱讀

    NVIDIA加速計(jì)算和生成式AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開(kāi)篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計(jì)算和生成式 AI
    的頭像 發(fā)表于 09-09 09:18 ?905次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?1052次閱讀
    主站蜘蛛池模板: 四虎影院永久网址 | 91福利免费视频 | 亚洲一区二区影视 | 女女同免费播放毛片 | 国产九九热 | 夜恋秀场欧美成人影院 | 五月天精品在线 | 亚洲福利二区 | 999久久久国产精品 999久久久免费精品国产牛牛 | 四虎一影院区永久精品 | 欧美综合网站 | 欧美无遮挡一区二区三区 | 亚洲一区二区精品视频 | 性欧美高清极品猛交 | 黄网站色视频免费看无下截 | 久久夜色精品国产噜噜小说 | 亚洲色图综合在线 | 骚五月| 国产女主播在线 | 丁香花在线视频观看免费 | 夜夜操天天爽 | 大色综合色综合资源站 | 伊人伊成久久人综合网777 | 中文字幕精品一区影音先锋 | 天天摸天天爽天天澡视频 | 夜夜夜夜曰天天天天拍国产 | 分分操免费视频在线观看 | 在线女同免费观看网站 | 欧美成人午夜影院 | 人人澡人人澡人人看青草 | 激情文学亚洲色图 | 免费一级毛片不卡在线播放 | 国产成人综合日韩精品婷婷九月 | 中文字幕在线观看一区二区 | 天天好b| 国内视频一区二区 | 一区二区视屏 | 在线成人免费 | 黄色在线看网站 | 西西人体大胆高清啪啪欧洲 | 欧美中出 |