PyTorrch 2. 0 是PyTorrch機(jī)器學(xué)習(xí)框架向前邁出的重要一步。 PyTorrch 2. 0 的穩(wěn)定釋放帶來(lái)了新的功能,這些功能可以釋放出更高的性能,同時(shí)保持與先前的釋放相容的后向,并保留了Pythonic 焦點(diǎn),這幫助PyTorrch如此熱情地被AI/ML社區(qū)采納。 AMD長(zhǎng)期以來(lái)一直是PyTorch的堅(jiān)定支持者,我們感到高興的是,PyTorrch 2.0 的穩(wěn)定釋放包括支持AMD InstinctTM和得到ROCTM軟件平臺(tái)支持的RadeonTM GPUs。
PyTorrch 2. 0 發(fā)布后, PyTorrch 2. 0 引入了火炬,作為火炬導(dǎo)管支持的一種貝塔特征,通過(guò) OpenAI Triton 深層學(xué)習(xí)編譯器支持AMD Instinct 和 Radeon GPUs 。 通過(guò)火炬導(dǎo)導(dǎo)管,開發(fā)者現(xiàn)在可以生成低層內(nèi)核,使用Triton的便攜和性能,在本地硬件中心內(nèi)核編程模型上生成手寫內(nèi)核。
OpenAI Triton是被屏蔽的算法的語(yǔ)言和編譯者,旨在提供CUDA/HIP和火炬之間的抽象層,讓開發(fā)者能夠更有成效地寫出高效的內(nèi)核。 我們已經(jīng)寫了一個(gè)新的后端,將特里頓自定義的 MLIR 方言與我們的 ROCm 編譯器堆疊連接起來(lái)。
Triton 能夠通過(guò)利用AMD CDNATM GPU 架構(gòu)的硬件特性,自動(dòng)優(yōu)化諸如TirchIngentor等機(jī)器學(xué)習(xí)編譯器生成的包括AMD Instinct GPU加速器在內(nèi)的多種AI加速器的內(nèi)核。 這樣,開發(fā)者和用戶就很容易從任何 HW 向 AMD Intinct GPU 加速器無(wú)縫地轉(zhuǎn)換, 并且從框的性能中獲得巨大效果 。
此外,像Triton這樣的編譯者還可以使開發(fā)者能夠使用像Python這樣的高級(jí)編程語(yǔ)言來(lái)編寫機(jī)器學(xué)習(xí)代碼,這些代碼可以用專門硬件高效地編譯和操作。 這有助于大大提高機(jī)器學(xué)習(xí)開發(fā)者的生產(chǎn)力,因?yàn)樗麄兛梢詫W⒂谀P偷乃惴ǚ矫?依靠編程者生成高效代碼。
按設(shè)計(jì),PyTorrch 2. 0 與早先的PyTorrch 釋放量相容。 PyTorrch 2. 0 的 ROCm 建筑也是如此。 使用 AMD GPUs 的 PyTorrch 開發(fā)商可以遷移到 PyTorrch 2. 0 , 因?yàn)樗麄兇_信他們現(xiàn)有的代碼會(huì)繼續(xù)工作而無(wú)需作任何修改, 因此獲取釋放量帶來(lái)的改進(jìn)不會(huì)受到任何處罰。 另一方面, 使用 PyTorrch 2.0 和 TochInginor 能夠大大改進(jìn)默認(rèn)的熱量模式的性能, 如下所示 。
使用AMD Instinct MI250 GPUs的初步結(jié)果表明,與默認(rèn)熱量模式相比,火炬導(dǎo)管的性能明顯改善,優(yōu)化程度極小,與默認(rèn)熱量模式相比。 我們看到,在卡美貝特、提stillGPT2 和 T5SMall 的45個(gè)拖車臉基準(zhǔn)套件45個(gè)模型中,44個(gè)模型的性能平均提高至1.54X。 我們期待繼續(xù)與梅塔的PyTorch小組成員接觸,以便進(jìn)一步優(yōu)化ROCm軟件堆,并為今后的PyTurch 發(fā)布工作做出進(jìn)一步的性能改進(jìn)。
PyTorch 2. 0 PyTorrch 2. 0 遵循與以前相同的安裝選項(xiàng),以建造和安裝支持 AMD GPP 的 AMD GPU 。 其中包括一個(gè)可安裝的 Python 軟件包 。當(dāng)然還有使用上游 PyTorch 倉(cāng)庫(kù)從源頭建造的選項(xiàng)。 與為其他平臺(tái)建造 PyTorch 一樣, PyTarch 配置器為Pip 安裝提供具體命令線。
由ROCm軟件平臺(tái)支持的GPU 構(gòu)成支持AMD GPU的PyTorch支持基礎(chǔ)的ROCm軟件平臺(tái)記錄在文件上。
PyTorrch 2. 0 代表著繼續(xù)擴(kuò)大對(duì)ML開發(fā)者支持的一個(gè)重大步驟, 通過(guò)提高性能, 維護(hù)一個(gè)簡(jiǎn)單、 Pythonic 的界面, 從而繼續(xù)擴(kuò)大對(duì) ML 開發(fā)者的支持。 這一提高性能在很大程度上是由新的TirchIngingor 基礎(chǔ)設(shè)施所促成的, 后者又利用了 Tritton ML 編程語(yǔ)言和即時(shí)編程器。 AMD對(duì)這些技術(shù)的支持使用戶能夠?qū)崿F(xiàn)新的PyToch 架構(gòu)的全部承諾。 我們?cè)?PyTorch 2.0 中的 GPU 支持只是圍繞AI 和 機(jī)器學(xué)習(xí)的更大視野的體現(xiàn)之一。 AI/ ML 在多種AMD 產(chǎn)品行中扮演著重要角色, 包括 Instenct 和 Radeon GPUS 、 AlveoTM 數(shù)據(jù)中心加速器以及 RizenTM 和 EPYC 處理器。 這些硬件和軟件倡議都是AMD 滲透性AI 愿景的一部分, 我們期待應(yīng)對(duì)這個(gè)動(dòng)態(tài)空間的許多新挑戰(zhàn)和機(jī)遇。
MI200-89 - PyTorch Ingentor Mod Hugging Face 變形器培訓(xùn)速度加快,運(yùn)行標(biāo)準(zhǔn)的 PyTorch 2. 0 測(cè)試套,超過(guò) PyTurch 熱量模式比較,基于對(duì)截至2023年3月10日單一GCD的AMD內(nèi)部測(cè)試,使用 2P AMD EPYCTM 7763 生產(chǎn)服務(wù)器,使用 4x AMD IntinctTM MI250 (128GB HBM2e) 560W GPUS, 具有無(wú)限性 FabricTM 技術(shù); 主機(jī) ROCmTM 5.3, 客人 ROCmTM 5.4.4, PyTorch 2.0.0, Triton 2.0。 服務(wù)器制造商可能會(huì)改變配置,產(chǎn)生不同的結(jié)果。 績(jī)效可能因使用最新驅(qū)動(dòng)器和優(yōu)化等因素而不同。
2023年 先進(jìn)微量設(shè)備有限公司保留所有權(quán)利。AMD、AMD箭標(biāo)、AMD CDNA、AMD Instinct、EPYC、Radeon、ROCm、Ryzen及其組合是先進(jìn)微量設(shè)備公司的商標(biāo)。 本出版物使用的其他產(chǎn)品名稱僅用于鑒定目的,可能也是其各自所有者的商標(biāo)。
審核編輯:彭菁
-
amd
+關(guān)注
關(guān)注
25文章
5537瀏覽量
135490 -
gpu
+關(guān)注
關(guān)注
28文章
4874瀏覽量
130301 -
代碼
+關(guān)注
關(guān)注
30文章
4874瀏覽量
69922 -
編譯器
+關(guān)注
關(guān)注
1文章
1651瀏覽量
49690 -
pytorch
+關(guān)注
關(guān)注
2文章
808瀏覽量
13655
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
AMD推出全新針腳兼容系統(tǒng)級(jí)芯片及CPU解決方案


#硬聲創(chuàng)作季 #FPGA Xilinx入門-16 亞穩(wěn)態(tài)現(xiàn)象原理與解決方案-1

#硬聲創(chuàng)作季 #FPGA Xilinx入門-16 亞穩(wěn)態(tài)現(xiàn)象原理與解決方案-2

#硬聲創(chuàng)作季 #FPGA Xilinx入門-16 亞穩(wěn)態(tài)現(xiàn)象原理與解決方案-3
NVIDIA GRID是否支持此解決方案?
三相LTC3733為AMD Opteron和Athlon 64處理器提供高性能電源解決方案
瑞薩電子將與AMD合作5G有源天線系統(tǒng)無(wú)線電RF前端解決方案
PyTorch 1.8發(fā)布,支持AMD ROCm
PyTorch 1.8正式官宣發(fā)布還支持AMD GPU!
常見(jiàn)的AMD顯卡問(wèn)題,附解決方案和安裝教程

評(píng)論