GTC 2023|Colossal-AI系統的數據并行優化方案

Colossal-AI的改變：

從Colossal-AI的GitHub star數量中看出，這是衡量其開源社區的指標。與其它非常流行的開源系統（如Spark、 MongoDB等）相比，在相同時間內Colossal-AI使用增長速度是最快的。

世界上37個國家的用戶正在使用Colossal-AI，還有各種其他人工智能生態系統使用Colsssal-AI。

Colsssal-AI的重要功能——N-Dim并行系統

這可以將你的復雜模型可用硬件上，以便最大化使用并行同時最小化通信。

Colsssal-AI提供了完整的并行方法，包括數據并行、張量并行、流水線并行和序列并行，同時還有團隊提出的2維、2.5維和3維張量并行以及序列并行。

其中優化了數據并行，可以讓你以最小的損失在相當大的規換下訓練模型。

大規模優化器如何優化數據并行

與單個GPU訓練相比數據并行訓練將整個數據集分為幾個分區。

每個GPU擁有1個數據集分區，模型在每個GPU上復制，開在其本地數據集分區進行訓練，在反向傳播期間計算的梯度，被平均并用于更新模型副本，可以確保在不同GPU之間同步模型。

然而，簡單的增加批次大小，通常會導致泛化性能下降并降低計算精度。為了解決這些問題，研究出一種新的方法，可擴展的大規模優化器LARS和LAMB，適合大批量設置。

在ViT模型和ImageNet數據集上對可擴展的大規模優化器LARS和LAMB進行理論分析。他們可最大程度使用GPU資源，將ViT-B/32的訓練時間從一個GPU的73小時減少到200個GPU的0.68小時，并實現幾乎線性增加的加速度，并保證收斂。

編輯：黃飛

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4937

瀏覽量
131174
英偉達

英偉達

+關注

關注
22

文章
3944

瀏覽量
93607
深度學習

深度學習

+關注

關注
73

文章
5560

瀏覽量
122763
gtc

gtc

+關注

關注
0

文章
73

瀏覽量
4598

精選推薦
更多

文章

資料

帖子

恩智浦FS24功能安全SBC芯片詳解為區域控制器節點設計提供便利

NXP客棧
1天前

947 閱讀

IGBT的電流是如何定義的

英飛凌工業半導體
1天前

888 閱讀

半導體激光器的三種驅動模式

中科院半導體所
1天前

572 閱讀

權威認證！RT-Thread操作系統100%國產自主可控，鑄就睿擎工業平臺安全基石? !

RT-Thread官方賬號
1天前

712 閱讀

基于ADI MAX12900和MAX32675C的4-20mA傳感器設計

analog_devices
1天前

644 閱讀

irfp460 pdf

小組店小二
666

10積分

216下載

道勤數碼播放器使用說明書

lanlanw
7.45 MB

免費

29下載

基于鴻蒙適配移植的廣告圖片輪播控件教程

姚小熊27
2.83 MB

免費

2下載

HoneyProxy HTTP(S)?流量分析

郝埃連
2.70 MB

2積分

1下載

44×4 LCD顯示驅動芯片VK2C22A/B 數據手冊

駱宇祺
5.48 MB

免費

1下載

HarmonyOS AI輔助編程工具（CodeGenie）報錯分析

李洋水蛟龍
2天前

322 閱讀

【社區活動】電子發燒友七月份活動匯總

dianzi_0101
2天前

944 閱讀

方波轉三角波輸出為一條直線

jf_59522181
2天前

1182 閱讀

【Milk-V Duo S 開發板免費體驗】SDK編譯、人臉檢測、OpenCV測試

jf_07365693
2天前

698 閱讀

【匯思博SEEK100開發板試用體驗】06 天氣app--使用組件導航實現設置頁及頁面跳轉

jf_83922529
2天前

706 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

GTC 2023|Colossal-AI系統的數據并行優化方案

評論