那些年在pytorch上踩過的坑

今天又發現了一個pytorch的小坑，給大家分享一下。手上兩份同一模型的代碼，一份用tensorflow寫的，另一份是我拿pytorch寫的，模型架構一模一樣，預處理數據的邏輯也一模一樣，測試發現模型推理的速度也差不多。一份預處理代碼是為pytorch模型寫的，用到的庫是torch，另一份是為tensorflow寫的，用到的是numpy。在訓練時，每個epoch耗時居然差距非常大，pytorch的代碼在140w條數據上訓練每輪耗時約45min，而tensorflow版的代碼耗時僅約12min。

我把代碼看了又看，百思不得其解，預處理的代碼比較復雜，都包含兩個for循環，pytorch版代碼我把更多的預處理步驟放到了Dataset里，這樣訓練時加載每個batch后，再要處理的步驟就更少了，速度也應該更快，而tensorflow版代碼的for循環里預處理的步驟明明更多，怎么會速度比我的代碼還快呢？然而，經過我的測試發現，從加載每個batch的數據進來開始，經過預處理，直到輸入到模型做計算前，兩者的耗時差了約7~8倍。最后發現問題出在對pytorch的tensor進行了頻繁的索引操作。

下面做個實驗給大家直觀體驗一下，對tensor做索引和對array做索引的速度差距有多大，tensor和array都是大小(1000x1000)的二維數組。

Pytorch(version==1.4.1)索引1000000次耗時：3.51秒

Numpy索引1000000次耗時：0.43秒

我還特意對比了一下對TensorFlow的tensor做索引的耗時

TensorFlow(version==2.1.0)索引1000000次耗時：118.89秒

由此可見tensor和array的索引速度至少差距在10倍，不過這也在情理之中，畢竟tensor要比array“重”得多。因此在使用pytorch和tensorflow時，頻繁需要索引的操作一定要先把tensor轉換為numpy.array來做！

除此之外，與其對二維數組進行索引，不如將其展平為一維數組，算上展平的時間，速度還會有不少提升。

Pytorch從3.51秒降到了1.94秒

Numpy從0.43秒降到了0.29秒

如果在訓練和數據預處理過程中發現自己的代碼跑起來速度非常慢，記得看一看有沒有對tensor做太多次索引，如果有的話，要把它轉為numpy.array，還有，盡量把二維、三維的索引變成一維的索引，這些都能加快你訓練模型的速度。

PS：最后我的代碼終于訓練一輪也只需要不到12min了，后來又找了點加速的辦法，把訓練一輪的時間控制到了9min以內，這些就放在以后再寫吧~

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

代碼

代碼

+關注

關注
30

文章
4900

瀏覽量
70694
tensorflow

tensorflow

+關注

關注
13

文章
330

瀏覽量
61170
pytorch

pytorch

+關注

關注
2

文章
809

瀏覽量
13947

精選推薦
更多

文章

資料

帖子

CMOS工藝中方塊電阻的主要類型和測試方法

芯長征科技
16小時前

363 閱讀

用于電動汽車供電網絡的高壓母線轉換器48V電源模塊

Vicor
16小時前

454 閱讀

Copilot操作指南（一）：使用圖片生成原理圖符號、PCB封裝

KiCad
19小時前

291 閱讀

如何構建帶有VGA輸出的低分辨率熱成像

FPGA研究院
19小時前

478 閱讀

如何為EMC設計選擇PCB疊層結構

Altium
20小時前

463 閱讀

ELC16J.pdf 電子管資料數據手冊

張勇
128

5積分

28下載

功率MOSFET與高壓集成電路

yezi888
5.38 MB

免費

239下載

USB+Type-C移動電源參考設計

glen.li
458KB

免費

635下載

Cashbox區塊鏈錢包

陳艷
7.15 MB

免費

0下載

rqbit Rust實現的BitTorrent客戶端

名士流
0.43 MB

2積分

1下載

匠芯創D133CBS RISC-V KunLun Pi V1.0開發板開發資料

ElecFans小喇叭
1天前

276 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）代碼續寫

李洋水蛟龍
1天前

216 閱讀

【沁恒CH585開發板免費試用體驗】手機控制小臺燈亮度與小風扇轉速

yinwuqing
1天前

267 閱讀

【嘉楠堪智K230開發板試用體驗】K230 AI 功能體驗

杯pp
1天前

266 閱讀

【Milk-V Duo S 開發板免費體驗】ISP功能AE測試

jf_1137202360
1天前

349 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

那些年在pytorch上踩過的坑

評論