除了數(shù)據(jù)并行之外,還有其他的主流并行技術(shù),即張星并行和流水線并行訓(xùn)練。
張星并行和流水線并行技術(shù)通常被描述為模型并行,在開(kāi)源社區(qū)中,最著名的兩個(gè)系統(tǒng)是NVIDIA的Megatron- M和Microsoft的DeepSpeed。
Megatron- M使用一維張量并行,線算符的權(quán)重被分割,大型矩陣乘法被分解為在不同設(shè)備上執(zhí)行的較小矩陣藏法,這可以是模型大小在集群中擴(kuò)展并提高計(jì)算效率。
微軟的DeepSpeed和NVIDIA的Megatron- M兼容,并通過(guò)Zero Redundancy Optimizer改善數(shù)據(jù)并行訓(xùn)練,消除內(nèi)存冗余。
Colossal-AI不僅提供了完整的現(xiàn)有并行方法,還提供了更高級(jí)的辦法,例如2D、2.5D 和3D張星并行,以及序列并行。
與1D張量并行相比,這些并稱為是2.5D 和3D張星并行,不僅切分參數(shù),而且沿更多張量唯獨(dú)切分輸入和輸出,正方形或者立方體的每個(gè)子集,表示可以分配給不同處理器的部分?jǐn)?shù)據(jù)和工作。
2D張量并行基于經(jīng)典SUMMA矩陣?yán)?a target="_blank">算法
-
人工智能
+關(guān)注
關(guān)注
1791文章
47294瀏覽量
238578 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3776瀏覽量
91138 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121182 -
gtc
+關(guān)注
關(guān)注
0文章
73瀏覽量
4427
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
FPGA中的流水線設(shè)計(jì)
基于流水線負(fù)載平衡模型的并行爬蟲(chóng)研究
基于流水線技術(shù)的并行高效FIR濾波器設(shè)計(jì)
![基于<b class='flag-5'>流水線</b>技術(shù)的<b class='flag-5'>并行</b>高效FIR濾波器設(shè)計(jì)](https://file1.elecfans.com//web2/M00/A4/AA/wKgZomUMNTKAJaozAACGBBsGBp4408.gif)
流水線中的相關(guān)培訓(xùn)教程[1]
基于流水線的并行FIR濾波器設(shè)計(jì)
![基于<b class='flag-5'>流水線</b>的<b class='flag-5'>并行</b>FIR濾波器設(shè)計(jì)](https://file.elecfans.com/web2/M00/49/0A/pYYBAGKhtDWAWRxSAAAOOIQJllY193.jpg)
CPU流水線的定義
Verilog基本功之:流水線設(shè)計(jì)Pipeline Design
各種流水線特點(diǎn)及常見(jiàn)流水線設(shè)計(jì)方式
![各種<b class='flag-5'>流水線</b>特點(diǎn)及常見(jiàn)<b class='flag-5'>流水線</b>設(shè)計(jì)方式](https://file.elecfans.com/web2/M00/05/A4/poYBAGDieS2AEejEAAA2rNG7wwY109.png)
嵌入式_流水線
![嵌入式_<b class='flag-5'>流水線</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
什么是流水線 Jenkins的流水線詳解
以Gpipe作為流水線并行的范例進(jìn)行介紹
![以Gpipe作為<b class='flag-5'>流水線</b><b class='flag-5'>并行</b>的范例進(jìn)行介紹](https://file1.elecfans.com/web2/M00/88/AB/wKgaomRu2N-AeB9lAAAr1c3KVIc361.png)
Google GPipe為代表的流水線并行范式
![Google GPipe為代表的<b class='flag-5'>流水線</b><b class='flag-5'>并行</b>范式](https://file1.elecfans.com/web2/M00/88/BB/wKgZomRwVFGAaHM7AAAtsQiOVa0545.png)
評(píng)論