前幾天看到幾篇不同的文章寫關于機器學習的to do & not to do,有些觀點贊同,有些不贊同,是現在算法崗位這么熱門,已經不像幾年前一樣,可能跑過一些項目、懂點原理就可以了,現在對大家的要求更高,尤其工程能力更不可缺少,只跑過一些iris鳶尾花分類、啤酒與尿布、貓狗分類等的同學需要再提高提高,因為競爭太激烈了,我在這里結合我自己的經驗總結一下吧。
To Do
做項目時,邊搜集數據可以邊用已經搜集好的少部分數據跑模型。不用等到所有數據都搜集好了再跑。
不知道什么算法合適,可以直接把所有的算法都跑一遍,看效果再選擇,多跑幾個應用場景你就知道什么算法適合什么場景,什么數據對不同的算法會有什么影響了。
不知道什么參數是最佳參數,可以用random search或者grid search自動搜索最佳參數組合,有經驗以后對于每個參數的大概范圍心里會有個數。
一定要練習工程能力,只會調參的demo俠現在很難找到工作啦。
模型復現和刷題是很好的鍛煉工程能力的一種方式。
刷題不要追求數量,要總結不同類型的題目的經驗,并結合之前的業務中,看能不能優化之前的業務邏輯。
模型復現可以給自己規定一個任務,譬如在一個月內,把某篇論文的Tensorflow實現的代碼,復現成Pytorch或者PaddlePaddle等其他框架的代碼,不是閑著沒事做,而是模型復現可以迅速提高你對框架的熟悉度和代碼能力。
模型復現的過程中,最難的是寫新的op和模型效果(精度和速度)的對齊。這可能很折磨人,但是收獲也很大。
如果要做新項目,可以先看看有沒有預訓練模型,可以快速做遷移學習的,如果有,那么整體的模型周期會快很多。
如果跑完算法,一定要有一個成品的形態,最好不要只做算法這一塊,譬如跑完模型將其打包封裝成服務接口(服務端和移動端等),達到讓人可用的狀態最好。
領導不想知道過程,只想知道結果。沒有可用的東西和可視化的結果,他會覺得你啥也沒做。
上條只針對部分領導。
沒有人會比你更關心模型的參數調整導致模型的效果提升了0.1%還是1%,大多數人,尤其是leader、或者leader的leader,只關心它有什么用,真實場景的效果好不好。
可以多和同事、同行等互相交流,參加線下的學習會、交流會等,可能會有意想不到的收獲。
學習新的算法,先把代碼跑起來再說,再來看理論、數學推導、自己手寫實現等。
除了調參以外,還需要關注關注部署上線、模型壓縮等方面的內容。
Not To Do
訓練數據不要太干凈了,因為真實場景的數據往往和實驗數據差很多,嘗試加點噪音吧,做些數據增強和mixup等。
論文里的效果不一定能復現。可以嘗試論文的思路,但是不要太過相信論文里的效果數據。
做一個項目就好好深挖,不僅僅要做出來,還要不斷的優化,不然每個項目都只是跑通了,效果還行,沒必要寫到簡歷里,不如寫一個做得很深入,嘗試了各種優化方法并有效果提升的項目。
不要因為覺得自己數學不好就先去惡補數學,買一堆高等代數、數學分析、實變函數、復變函數等純數學書,如果一定要看,推薦《線性代數》《信息論》《凸優化》《數值分析》。
上條推薦的四本數學書也不用全看,凸優化太厚了,其他三本可以在自己有大塊時間可以刷書的時候,規定自己在一個月或者幾個月的時間迅速刷完。線性代數是基礎,數值分析是優化方法(也不用全看),凸優化與信息論與目標函數相關,涉及機器學習的很多理論知識。
不要覺得你訓練的模型效果多好就多么厲害,除非是做科研、打比賽、工業界更關注能不能落地,能不能應用產生價值,不要自high = =
如果把你的算法封裝成服務了,也要做做壓測,學習下工程方面的內容。
最好的狀態是,工程能力強,又懂算法,兩者結合,效果更佳。不要只注重某一方面的提升,多關注下自己的代碼風格,不要讓你的同事code review的時候犯難。
-
函數
+關注
關注
3文章
4350瀏覽量
63047 -
模型
+關注
關注
1文章
3372瀏覽量
49299 -
機器學習
+關注
關注
66文章
8453瀏覽量
133152
發布評論請先 登錄
相關推薦
水質DO變送器可以應用在哪里
4525DO-TP3AJ030APF傳感器在礦井氣壓測量中的應用
![4525<b class='flag-5'>DO</b>-TP3AJ030APF傳感器在礦井氣壓測量中的應用](https://file1.elecfans.com/web1/M00/F2/F1/wKgaoWcONfWAEsnJAADSWwoQc8A256.png)
4525DO-DS3BS001DS傳感器在差壓變送器中的應用
![4525<b class='flag-5'>DO</b>-DS3BS001DS傳感器在差壓變送器中的應用](https://file1.elecfans.com/web1/M00/F2/F0/wKgaoWcOLbOAJPPfAADaJNlGYDc553.png)
物聯網中RTU的DO是什么?如何實現DO相關軟件功能?
![物聯網中RTU的<b class='flag-5'>DO</b>是什么?如何實現<b class='flag-5'>DO</b>相關軟件功能?](https://file1.elecfans.com//web2/M00/08/D8/wKgaombzvuKAG5UoAAA9W_PBVSc908.jpg)
DO傳感器有什么作用
DO變送器有哪些功能特點
使用wifi_fpm_do_sleep系統崩潰的原因?
微軟planner新版增強To Do功能,優化經典planner,助你更高效地工作
4525DO-DS3AI002DS空速模塊的誤差分析及結構分析
![4525<b class='flag-5'>DO</b>-DS3AI002DS空速模塊的誤差分析及結構分析](https://file1.elecfans.com/web2/M00/C8/78/wKgZomYciD2AQ4jGAABhhh2MZW8448.png)
評論