在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU加速的推薦程序框架Merlin HugeCTR

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-03-20 15:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個 GPU 和節(jié)點之間分配訓(xùn)練并估計點擊率(Click-through rate)。

此次v3.4更新涉及的模塊主要為:

HugeCTR 分級參數(shù)服務(wù)器

HugeCTR Python API

相關(guān)介紹:

HugeCTR 分級參數(shù)服務(wù)器介紹

V3.4.1 版本新增內(nèi)容

調(diào)整了整個代碼庫中日志消息的日志級別。

現(xiàn)已支持對具有多個標(biāo)簽的數(shù)據(jù)集進行推理:

“Softmax” 層現(xiàn)在已支持 FP16,并且支持混合精度以進行多標(biāo)簽推理。

支持多 GPU 離線推理:

我們通過 Python 接口支持多 GPU 離線推理,它可以利用Hierarchical Parameter Server

并在多個設(shè)備上實現(xiàn)并發(fā)執(zhí)行。更多信息請參考推理 API和多 GPU 離線推理筆記本。

HPS 已構(gòu)建為獨立庫:

我們重構(gòu)了代碼庫并將分層參數(shù)服務(wù)器構(gòu)建為一個獨立的庫,以后會進一步封裝。

metadata.json 簡介:

添加了有關(guān) Parquet data 中 _metadata.json 的詳細信息。

增加了用于估計每個 GPU 的詞匯量大小的文檔和工具:

我們添加了一個工具來計算每個 GPU 的不同嵌入類型的詞匯量大小,在此基礎(chǔ)上,workspace_size_per_gpu_in_mb 可以根據(jù)嵌入向量大小和優(yōu)化器類型評估更多信息請參考腳本:

訓(xùn)練中支持 HDFS :

a. 現(xiàn)在支持從 HDFS 加載和存儲模型和優(yōu)化器狀態(tài)。

b. 增加了編譯選項使 HDFS 的支持更加靈活。

c. 添加了一個筆記本來展示如何將 HugeCTR 與 HDFS 一起使用:

增加了一個演示如何分析模型文件的 Python 腳本和筆記本

錯誤修復(fù):修復(fù)了SOK 中的鏡像策略錯誤。

修復(fù)了無法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02 中導(dǎo)入稀疏操作工具包的問題。

HugeCTR 參數(shù)服務(wù)器:修復(fù)了在未配置 RocksDB 時,可能會在初始化期間發(fā)生的訪問沖突問題。

已知問題

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時,建議您通過發(fā)出以下命令(-shm-size=1g -ulimit memlock=-1) 來增加這些資源。

另見 NCCL 的 已知問題

還有 GitHub 問題

目前即使目標(biāo) Kafka broker 無響應(yīng),KafkaProducers 啟動也會成功。為了避免與來自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動、正常工作并且可以從運行 HugeCTR 的節(jié)點訪問。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 worker 將被映射到同一個文件,從而導(dǎo)致數(shù)據(jù)加載不會按預(yù)期進行。

正則化器暫不支持聯(lián)合損失訓(xùn)練。

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    8990

    瀏覽量

    153632
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4937

    瀏覽量

    131136
  • 工具包
    +關(guān)注

    關(guān)注

    0

    文章

    47

    瀏覽量

    9704

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    OpenVINO?檢測到GPU,但網(wǎng)絡(luò)無法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅(qū)動程序版本 25.20.100.6373,檢測到 GPU,但網(wǎng)絡(luò)無法加載
    發(fā)表于 03-05 06:01

    從圖形處理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022年首次發(fā)布,見證了生成式AI從云端到智能手機等消費設(shè)備中普及。在云端,由于GPU的可編程性、可擴展性和快速處理AI工作負載的能力,GPU已成為高效的AI加速
    的頭像 發(fā)表于 02-27 08:33 ?470次閱讀
    從圖形處理到AI<b class='flag-5'>加速</b>,一文看懂Imagination D系列<b class='flag-5'>GPU</b>

    GPU加速計算平臺的優(yōu)勢

    傳統(tǒng)的CPU雖然在日常計算任務(wù)中表現(xiàn)出色,但在面對大規(guī)模并行計算需求時,其性能往往捉襟見肘。而GPU加速計算平臺憑借其獨特的優(yōu)勢,吸引了行業(yè)內(nèi)人士的廣泛關(guān)注和應(yīng)用。下面,AI部落小編為大家分享GPU
    的頭像 發(fā)表于 02-23 16:16 ?419次閱讀

    利用NVIDIA DPF引領(lǐng)DPU加速云計算的未來

    DPU 的強大功能,并優(yōu)化 GPU 加速計算平臺。作為一種編排框架和實施藍圖,DPF 使開發(fā)者、服務(wù)提供商和企業(yè)能夠無縫構(gòu)建 BlueField 加速的云原生軟件平臺。
    的頭像 發(fā)表于 01-24 09:29 ?686次閱讀
    利用NVIDIA DPF引領(lǐng)DPU<b class='flag-5'>加速</b>云計算的未來

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計算服務(wù)相結(jié)合,通過云服務(wù)提供商的平臺,用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機實例。那么,GPU
    的頭像 發(fā)表于 12-26 11:58 ?443次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計算的啟用 - 交互式模擬:通過加速對話框啟用,打開求解器對話框,點擊“加速”按鈕,打
    發(fā)表于 12-16 14:25

    PyTorch GPU 加速訓(xùn)練模型方法

    在深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時間的重要手段。PyTorch作為一個流行的深度學(xué)習(xí)框架,提供了豐富的工具和方法來利用GPU進行模型訓(xùn)練。 1. 了解
    的頭像 發(fā)表于 11-05 17:43 ?1383次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    常見GPU問題及解決方法

    各種問題。以下是一些常見的GPU問題及其解決方法: GPU驅(qū)動程序過時或不兼容 問題描述:GPU驅(qū)動程序
    的頭像 發(fā)表于 10-27 14:12 ?3602次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是深度學(xué)習(xí)的核心應(yīng)用領(lǐng)域之一,GPU加速圖像識別模型訓(xùn)練方面發(fā)揮著關(guān)鍵作用。通過利用
    的頭像 發(fā)表于 10-27 11:13 ?1320次閱讀

    GPU超頻設(shè)置技巧

    技巧: 了解你的硬件 : 在超頻之前,了解你的GPU型號和規(guī)格是非常重要的。不同的GPU有不同的超頻潛力。 檢查GPU的默認頻率和電壓,以及制造商推薦的超頻范圍。 更新驅(qū)動程序 : 確
    的頭像 發(fā)表于 10-27 11:09 ?1464次閱讀

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學(xué)計算、數(shù)據(jù)分析、機器學(xué)習(xí)等復(fù)雜計算任務(wù)的軟硬件結(jié)合系統(tǒng)。
    的頭像 發(fā)表于 10-25 09:23 ?584次閱讀

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理
    發(fā)表于 10-20 09:14

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?599次閱讀

    SOK在手機行業(yè)的應(yīng)用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關(guān)特性和優(yōu)化
    的頭像 發(fā)表于 07-25 10:01 ?865次閱讀
    SOK在手機行業(yè)的應(yīng)用案例
    主站蜘蛛池模板: 午夜爽爽性刺激一区二区视频 | 欧美日本视频一区 | 77788色淫网站免费观看 | 欧美日韩国产一区 | 欧美色图亚洲激情 | 欧美色综合高清免费 | 欧美婷婷 | 福利天堂 | 亚洲永久网站 | 啪啪免费网站 | 欧美8888| 与子乱刺激对白在线播放 | 偷窥自拍亚洲色图 | 国产乱人视频在线看 | 日本免费不卡视频一区二区三区 | 天堂8在线官网 | a亚洲| 国内一级特黄女人精品毛片 | 国产四虎精品 | 国产一级特黄a大片免费 | 色综合美国色农夫网 | 中文字幕在线乱码免费毛片 | 天堂网在线资源 | 特级一级毛片免费看 | 亚洲国内精品久久 | 五月激情电影 | 欧美三页| 国产综合视频在线观看 | 李老汉和小花的性生生活 | 三级三级三级网站网址 | 爱爱免费网址 | 黄 色 片成 人免费观看 | 日本口工禁漫画无遮挡全彩 | 手机看片福利在线 | 五月天婷婷免费视频 | 色狠狠xx | 最新国产精品视频免费看 | 四虎在线播放免费永久视频 | 黄色一级a毛片 | 久久影视免费观看网址 | 美女黄色在线 |