前幾天看到幾篇不同的文章寫關于機器學習的to do & not to do,有些觀點贊同,有些不贊同,是現(xiàn)在算法崗位這么熱門,已經(jīng)不像幾年前一樣,可能跑過一些項目、懂點原理就可以了,現(xiàn)在對大家的要求更高,尤其工程能力更不可缺少,只跑過一些iris鳶尾花分類、啤酒與尿布、貓狗分類等的同學需要再提高提高,因為競爭太激烈了,我在這里結(jié)合我自己的經(jīng)驗總結(jié)一下吧。
To Do
做項目時,邊搜集數(shù)據(jù)可以邊用已經(jīng)搜集好的少部分數(shù)據(jù)跑模型。不用等到所有數(shù)據(jù)都搜集好了再跑。
不知道什么算法合適,可以直接把所有的算法都跑一遍,看效果再選擇,多跑幾個應用場景你就知道什么算法適合什么場景,什么數(shù)據(jù)對不同的算法會有什么影響了。
不知道什么參數(shù)是最佳參數(shù),可以用random search或者grid search自動搜索最佳參數(shù)組合,有經(jīng)驗以后對于每個參數(shù)的大概范圍心里會有個數(shù)。
一定要練習工程能力,只會調(diào)參的demo俠現(xiàn)在很難找到工作啦。
模型復現(xiàn)和刷題是很好的鍛煉工程能力的一種方式。
刷題不要追求數(shù)量,要總結(jié)不同類型的題目的經(jīng)驗,并結(jié)合之前的業(yè)務中,看能不能優(yōu)化之前的業(yè)務邏輯。
模型復現(xiàn)可以給自己規(guī)定一個任務,譬如在一個月內(nèi),把某篇論文的Tensorflow實現(xiàn)的代碼,復現(xiàn)成Pytorch或者PaddlePaddle等其他框架的代碼,不是閑著沒事做,而是模型復現(xiàn)可以迅速提高你對框架的熟悉度和代碼能力。
模型復現(xiàn)的過程中,最難的是寫新的op和模型效果(精度和速度)的對齊。這可能很折磨人,但是收獲也很大。
如果要做新項目,可以先看看有沒有預訓練模型,可以快速做遷移學習的,如果有,那么整體的模型周期會快很多。
如果跑完算法,一定要有一個成品的形態(tài),最好不要只做算法這一塊,譬如跑完模型將其打包封裝成服務接口(服務端和移動端等),達到讓人可用的狀態(tài)最好。
領導不想知道過程,只想知道結(jié)果。沒有可用的東西和可視化的結(jié)果,他會覺得你啥也沒做。
上條只針對部分領導。
沒有人會比你更關心模型的參數(shù)調(diào)整導致模型的效果提升了0.1%還是1%,大多數(shù)人,尤其是leader、或者leader的leader,只關心它有什么用,真實場景的效果好不好。
可以多和同事、同行等互相交流,參加線下的學習會、交流會等,可能會有意想不到的收獲。
學習新的算法,先把代碼跑起來再說,再來看理論、數(shù)學推導、自己手寫實現(xiàn)等。
除了調(diào)參以外,還需要關注關注部署上線、模型壓縮等方面的內(nèi)容。
Not To Do
訓練數(shù)據(jù)不要太干凈了,因為真實場景的數(shù)據(jù)往往和實驗數(shù)據(jù)差很多,嘗試加點噪音吧,做些數(shù)據(jù)增強和mixup等。
論文里的效果不一定能復現(xiàn)。可以嘗試論文的思路,但是不要太過相信論文里的效果數(shù)據(jù)。
做一個項目就好好深挖,不僅僅要做出來,還要不斷的優(yōu)化,不然每個項目都只是跑通了,效果還行,沒必要寫到簡歷里,不如寫一個做得很深入,嘗試了各種優(yōu)化方法并有效果提升的項目。
不要因為覺得自己數(shù)學不好就先去惡補數(shù)學,買一堆高等代數(shù)、數(shù)學分析、實變函數(shù)、復變函數(shù)等純數(shù)學書,如果一定要看,推薦《線性代數(shù)》《信息論》《凸優(yōu)化》《數(shù)值分析》。
上條推薦的四本數(shù)學書也不用全看,凸優(yōu)化太厚了,其他三本可以在自己有大塊時間可以刷書的時候,規(guī)定自己在一個月或者幾個月的時間迅速刷完。線性代數(shù)是基礎,數(shù)值分析是優(yōu)化方法(也不用全看),凸優(yōu)化與信息論與目標函數(shù)相關,涉及機器學習的很多理論知識。
不要覺得你訓練的模型效果多好就多么厲害,除非是做科研、打比賽、工業(yè)界更關注能不能落地,能不能應用產(chǎn)生價值,不要自high = =
如果把你的算法封裝成服務了,也要做做壓測,學習下工程方面的內(nèi)容。
最好的狀態(tài)是,工程能力強,又懂算法,兩者結(jié)合,效果更佳。不要只注重某一方面的提升,多關注下自己的代碼風格,不要讓你的同事code review的時候犯難。
-
函數(shù)
+關注
關注
3文章
4365瀏覽量
63932 -
模型
+關注
關注
1文章
3471瀏覽量
49864 -
機器學習
+關注
關注
66文章
8481瀏覽量
133908
發(fā)布評論請先 登錄
ST NPI 新上架開發(fā)板 【X-NUCLEO-DO41A1】

在工業(yè)自動化領域AI,AO,DI,DO是什么,它有什么作用

1.5KE10A 瞬態(tài)抑制二極管 DO-201AD封裝規(guī)格書
1.5KE9.1A 瞬態(tài)抑制二極管 DO-201AD封裝規(guī)格書
1.5KE8.2A 瞬態(tài)抑制二極管 DO-201AD封裝規(guī)格書
P6KE6.8A瞬態(tài)抑制二極管 DO-15封裝 產(chǎn)品規(guī)格書
水質(zhì)DO變送器可以應用在哪里
4525DO-TP3AJ030APF傳感器在礦井氣壓測量中的應用

4525DO-DS3BS001DS傳感器在差壓變送器中的應用

物聯(lián)網(wǎng)中RTU的DO是什么?如何實現(xiàn)DO相關軟件功能?

評論