近期,來自富士通(Fujitsu)的研究員們宣布他們打破了ImageNet的訓練速度記錄——在74.7秒內達到75%的準確率。這比去年11月由索尼(Sony)創下的前紀錄快了47秒。
團隊取得這樣的紀錄,得益于日本東京大學(University of Tokyo)的AI Bridging Cloud Infrastructure(ABCI)系統上的2,048塊NVIDIA Tesla V100 GPU,以及MXNet深度學習架構。
ABCI系統是日本最快的超級計算機,在世界超級計算機榜單中也名列前10。該系統由超過4,300塊NVLink互聯的NVIDIA V100 GPU提供算力。Sony此前保持的紀錄也是借助此系統實現的。
富士通(Fujitsu)在一篇文章中介紹:“基于此技術,富士通實驗室(Fujitsu Laboratories)深耕HPC發展,公司現已開發出了新的技術,能夠在保證訓練準確率的同時拓展每塊GPU的計算量。”
為了對使用大批量mini-batch訓練深度神經網絡(DNN)時發生的驗證準確性進行補償,團隊“使用了相關技術,在不影響準確率的同時,增大了小批量的體量。”
研究人員介紹說:“眾所周知,具有數據并行性的分布式深度學習是加速集群訓練的有效方法。通過這種方法,在集群上運行的所有步驟都具有相同的DNN模型和權重。”
研究人員們同時也借助了Tensor核心的混合精度。
該DNN架構經過優化,基于ImageNet在74.7秒的時間內完成 ResNet-50訓練,而且驗證準確率高達75.08%。
團隊還能夠使用高達81,920個的大批量mini-batch,同時保持75.08%的準確率(如上表中第3個數據點所示)。
為實現這一里程碑式的成果,大量的NVIDIA技術被應用其中,其中就包括層級對應的適應率縮放(Layer-wise Adaptive Rate Scaling)。
該項工作目前已在ArXiv 和富士通博客上發表。
-
NVIDIA
+關注
關注
14文章
5258瀏覽量
105864 -
深度學習
+關注
關注
73文章
5555瀏覽量
122538 -
富士通
+關注
關注
2文章
202瀏覽量
55120
原文標題:富士通借助 Tesla V100 Tensor核心GPU創下ImageNet新紀錄
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
海思SD3403邊緣計算AI數據訓練概述
SDK如何控制DLP4500在一秒內投影60張圖片?
浪潮信息:元腦EPAI已接入DeepSeek,大幅提升DeepSeek企業應用準確率

Meta非入侵式腦機技術:AI讀取大腦信號打字準確率80%
請問AFE4400 SPO2精度和準確率如何?
富士通預測2025年AI領域的發展趨勢
《富士通綜合報告(Fujitsu Integrated Report 2024)》帶你全面了解富士通

如何提升人臉門禁一體機的識別準確率?

富士通上半年營收利潤均創歷史新高
微機保護裝置預警功能的準確率
ai人工智能回答準確率高嗎
NIUSB6009 采集準確率的問題?
富士通半導體存儲解決方案公司宣布更名為RAMXEED LIMITED
NRK3301識別語音芯片在智能按摩椅中的應用與體驗提升

評論