穿越小说完本 ,盗墓笔记同人小说,小说排行榜

前幾天看到幾篇不同的文章寫關于機器學習的to do & not to do，有些觀點贊同，有些不贊同，是現(xiàn)在算法崗位這么熱門，已經(jīng)不像幾年前一樣，可能跑過一些項目、懂點原理就可以了，現(xiàn)在對大家的要求更高，尤其工程能力更不可缺少，只跑過一些iris鳶尾花分類、啤酒與尿布、貓狗分類等的同學需要再提高提高，因為競爭太激烈了，我在這里結(jié)合我自己的經(jīng)驗總結(jié)一下吧。

To Do

做項目時，邊搜集數(shù)據(jù)可以邊用已經(jīng)搜集好的少部分數(shù)據(jù)跑模型。不用等到所有數(shù)據(jù)都搜集好了再跑。

不知道什么算法合適，可以直接把所有的算法都跑一遍，看效果再選擇，多跑幾個應用場景你就知道什么算法適合什么場景，什么數(shù)據(jù)對不同的算法會有什么影響了。

不知道什么參數(shù)是最佳參數(shù)，可以用random search或者grid search自動搜索最佳參數(shù)組合，有經(jīng)驗以后對于每個參數(shù)的大概范圍心里會有個數(shù)。

一定要練習工程能力，只會調(diào)參的demo俠現(xiàn)在很難找到工作啦。

模型復現(xiàn)和刷題是很好的鍛煉工程能力的一種方式。

刷題不要追求數(shù)量，要總結(jié)不同類型的題目的經(jīng)驗，并結(jié)合之前的業(yè)務中，看能不能優(yōu)化之前的業(yè)務邏輯。

模型復現(xiàn)可以給自己規(guī)定一個任務，譬如在一個月內(nèi)，把某篇論文的Tensorflow實現(xiàn)的代碼，復現(xiàn)成Pytorch或者PaddlePaddle等其他框架的代碼，不是閑著沒事做，而是模型復現(xiàn)可以迅速提高你對框架的熟悉度和代碼能力。

模型復現(xiàn)的過程中，最難的是寫新的op和模型效果（精度和速度）的對齊。這可能很折磨人，但是收獲也很大。

如果要做新項目，可以先看看有沒有預訓練模型，可以快速做遷移學習的，如果有，那么整體的模型周期會快很多。

如果跑完算法，一定要有一個成品的形態(tài)，最好不要只做算法這一塊，譬如跑完模型將其打包封裝成服務接口（服務端和移動端等），達到讓人可用的狀態(tài)最好。

領導不想知道過程，只想知道結(jié)果。沒有可用的東西和可視化的結(jié)果，他會覺得你啥也沒做。

上條只針對部分領導。

沒有人會比你更關心模型的參數(shù)調(diào)整導致模型的效果提升了0.1%還是1%，大多數(shù)人，尤其是leader、或者leader的leader，只關心它有什么用，真實場景的效果好不好。

可以多和同事、同行等互相交流，參加線下的學習會、交流會等，可能會有意想不到的收獲。

學習新的算法，先把代碼跑起來再說，再來看理論、數(shù)學推導、自己手寫實現(xiàn)等。

除了調(diào)參以外，還需要關注關注部署上線、模型壓縮等方面的內(nèi)容。

Not To Do

訓練數(shù)據(jù)不要太干凈了，因為真實場景的數(shù)據(jù)往往和實驗數(shù)據(jù)差很多，嘗試加點噪音吧，做些數(shù)據(jù)增強和mixup等。

論文里的效果不一定能復現(xiàn)。可以嘗試論文的思路，但是不要太過相信論文里的效果數(shù)據(jù)。

做一個項目就好好深挖，不僅僅要做出來，還要不斷的優(yōu)化，不然每個項目都只是跑通了，效果還行，沒必要寫到簡歷里，不如寫一個做得很深入，嘗試了各種優(yōu)化方法并有效果提升的項目。

不要因為覺得自己數(shù)學不好就先去惡補數(shù)學，買一堆高等代數(shù)、數(shù)學分析、實變函數(shù)、復變函數(shù)等純數(shù)學書，如果一定要看，推薦《線性代數(shù)》《信息論》《凸優(yōu)化》《數(shù)值分析》。

上條推薦的四本數(shù)學書也不用全看，凸優(yōu)化太厚了，其他三本可以在自己有大塊時間可以刷書的時候，規(guī)定自己在一個月或者幾個月的時間迅速刷完。線性代數(shù)是基礎，數(shù)值分析是優(yōu)化方法（也不用全看），凸優(yōu)化與信息論與目標函數(shù)相關，涉及機器學習的很多理論知識。

不要覺得你訓練的模型效果多好就多么厲害，除非是做科研、打比賽、工業(yè)界更關注能不能落地，能不能應用產(chǎn)生價值，不要自high = =

如果把你的算法封裝成服務了，也要做做壓測，學習下工程方面的內(nèi)容。

最好的狀態(tài)是，工程能力強，又懂算法，兩者結(jié)合，效果更佳。不要只注重某一方面的提升，多關注下自己的代碼風格，不要讓你的同事code review的時候犯難。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴