用Python寫的程序,確實(shí)在性能上會(huì)比其他語(yǔ)言差一些,這是因?yàn)镻ython為了最大化 開發(fā)效率 ,犧牲了一定的 運(yùn)行效率 。開發(fā)效率和運(yùn)行效率往往是魚與熊掌不可兼得的關(guān)系。
不過(guò),程序性能較差有很多原因,并不能全把鍋甩到Python身上,我們應(yīng)該首先從自己的代碼上找原因,找原因最快的方法就是算出自己寫的語(yǔ)句或函數(shù)的 執(zhí)行時(shí)間 。這時(shí)候,很多人都會(huì)選擇用以下的形式打印出語(yǔ)句的執(zhí)行時(shí)間:
這是一種比較低效的做法,如果你有上萬(wàn)條語(yǔ)句要測(cè)試,想用這個(gè)方法來(lái)找到瓶頸簡(jiǎn)直是大海撈針。幸好,得益于Python強(qiáng)大的社區(qū)功能,我們有很多關(guān)于效率的模塊可以使用,今天要介紹的是 line_profiler , 它可以算出函數(shù)里每條語(yǔ)句的占用時(shí)間。
我們將使用上次電影人臉識(shí)別中的代碼進(jìn)行講解:Python 識(shí)別電影中的人臉,不過(guò)要注意,這篇推送里的函數(shù)少傳遞了幾個(gè)參數(shù),正確參數(shù)請(qǐng)點(diǎn)擊該推送下方的閱讀原文進(jìn)行查看哦。
1.準(zhǔn)備
Python環(huán)境當(dāng)然是必備的,如果你還沒有安裝Python,可以看這篇文章:超詳細(xì)Python安裝指南。
打開cmd/terminal輸入以下命令安裝line_profile:
pip install line_profiler
windows機(jī)器如果出現(xiàn) Microsoft Visual C++ 14.0 is required 這樣的錯(cuò)誤,請(qǐng)前往微軟官網(wǎng),下載vs2015勾選"適用于visual C++2015的公共工具" 進(jìn)行安裝。
如果出現(xiàn):ModuleNotFoundError: No module named 'skbuild'
的情況,請(qǐng)輸入以下命令安裝scikit-build:
pip install scikit-build
實(shí)在還是安裝不上的話 ,可以下載anaconda,輸入以下命令安裝:
conda install -c anaconda line_profiler
2.使用
使用方式非常簡(jiǎn)單,比如原來(lái)我們?cè)谧x取人臉的代碼中,主函數(shù)是這樣的:
我們要測(cè)的是read_pic_save_face函數(shù)中所有語(yǔ)句的執(zhí)行時(shí)間,只需要這樣調(diào)用line_profiler:
這樣就可以獲得該函數(shù)所有語(yǔ)句的執(zhí)行時(shí)間報(bào)表。當(dāng)然,它還有許多其他的調(diào)用方法,具體可以看line_profiler說(shuō)明文檔: *
https://github.com/rkern/line_profiler*
3.閱讀報(bào)告
line_profiler報(bào)告包括幾個(gè)部分:
Line: 語(yǔ)句位于第幾行 **
Hits: 該行被執(zhí)行的次數(shù)
Time: 該語(yǔ)句運(yùn)行的總時(shí)間
Per Hit: 該語(yǔ)句運(yùn)行一次的平均耗時(shí)
% Time: 該語(yǔ)句占總時(shí)間的比重**
可以看到,我們的這份代碼主要是在face_cascade.detectMultiScale 耗時(shí)最久,這是opencv的分類器執(zhí)行效率問(wèn)題。知道了是這里的效率問(wèn)題,優(yōu)化就有一個(gè)目標(biāo)了。
這一部分的優(yōu)化,我們可以從硬件方面入手,讓OpenCV在GPU上運(yùn)行算法,這樣做性能將遠(yuǎn)超在CPU上運(yùn)行的性能,這是絕招。其次就是利用多線程計(jì)算(沒試過(guò),不確定是否有用,或許下次可以試一下)。
-
模塊
+關(guān)注
關(guān)注
7文章
2783瀏覽量
49630 -
程序
+關(guān)注
關(guān)注
117文章
3824瀏覽量
82447 -
代碼
+關(guān)注
關(guān)注
30文章
4888瀏覽量
70272 -
python
+關(guān)注
關(guān)注
56文章
4825瀏覽量
86223
發(fā)布評(píng)論請(qǐng)先 登錄
基于KEIL軟件的C語(yǔ)言編程,如何計(jì)算一段程序的執(zhí)行時(shí)間呢?
如何計(jì)算AURIX微控制器指令執(zhí)行時(shí)間?
嵌套循環(huán)執(zhí)行時(shí)間計(jì)算
請(qǐng)問(wèn)C2000中尋址結(jié)構(gòu)體或者共同體需要的執(zhí)行時(shí)間長(zhǎng)嗎?
如何計(jì)算執(zhí)行時(shí)間
如何使用CYCLECOUNTER快速的測(cè)量執(zhí)行時(shí)間?
如何在MCU上測(cè)量代碼執(zhí)行時(shí)間?
RT1052執(zhí)行時(shí)間
RTThread Studio該如何查看代碼執(zhí)行時(shí)間
MPC5744p如何優(yōu)化程序執(zhí)行時(shí)間?
如何測(cè)量ARM Cortex-M MCU代碼的執(zhí)行時(shí)間

MCU上的代碼執(zhí)行時(shí)間

可以節(jié)省Python執(zhí)行時(shí)間的四種方式
使用STM32定時(shí)器測(cè)量程序執(zhí)行時(shí)間的方法詳解

TPT19新特性之最壞情況執(zhí)行時(shí)間的指示

評(píng)論