編者按:Feedly聯合創始人、大數據與機器學習主管Kireet Reddy分享了自己入門機器學習的經驗。
上大學前,我原以為自己將來會去計算機硬件行業工作,比如Intel之類。不過,到了CMU后,我發現計算機科學課程要有趣得多,看起來這些課程我也學得更好,這恐怕不是一個巧合。我真的很享受幾乎每一門參加的CS課程。實際上,只有一門例外:機器學習入門!我對這門課程很感興趣,不幸的是,看起來這門課的教授對教授這門課程的不感興趣程度和我的感興趣程度差不多,教得也不好。所以長期以來機器學習不在我的關注范圍之內。
不過,幾年前,我注意到機器學習真的吸引了很多注意力,這再次激起了我的好奇心。這次我從吳恩達的MOOC開始,吳是一個很棒的教授。和以前的區別是,我原來白天上課,現在網上上課。我一下子就著迷了,開始在網上搜索更多可以參加的課程。下面是我在學習過程中收獲的一些經驗和竅門。
追趕ML潮流是不是好主意?
毫無疑問,機器學習將經久不衰。這一領域的活躍已經有一段時間了,發展也很快,我可以說,夸大宣傳背后確實有實質性的進展。解決有些問題,機器就是比人類更擅長。
但這并不意味著機器學習適合每個人。機器學習方面的工作和其他軟件工程領域很不一樣。它更帶研究性和猜測性。如果你喜歡事先一段一段地計劃好工作,在x周之后一切就緒,那也許機器學習不怎么適合你。如果你喜歡處理數據,持續學習新技術,(真心)喜歡數學,那么機器學習也許是一個很棒的轉職方向。
多久能趕上進度?
這個問題有太多答案。我首先想到的回答是“永遠不能”。機器學習的范圍相當廣泛,同時正以驚人的速度發展。如果你碰巧和我一樣需要睡眠,那么你大概無法跟上這一領域的每項進展。但另一個更樂觀的答案也許是4個月(每周10小時)。例如,這些時間足夠你完成fast.ai的課程了(很棒的課程)。
這并不是微不足道的投入,因為你大概有許多時間要花在工作和生活上。不過,以我的個人經歷為證,這是有可能做到的,如果你愿意投入的話,其實并不難。
好課程有哪些?
這真取決于你打算如何學習。就我個人而言,之所以喜歡機器學習,是因為它優雅地組合了數學和計算機科學的許多領域:概率論、線性代數、微積分、優化,等等。所以我很自然地偏向學術性課程。
斯坦福的CS231n是一個極好的學術性課程。我看了Andrej Karpathy的授課視頻,講得非常好。課程作業的設置也很好,可以遠程完成。盡管課程主要內容為圖像問題和卷積網絡,課程其實是“從頭開始”的,同樣覆蓋了前饋網絡和循環網絡。
如果你更喜歡偏實踐的課程,那fast.ai的課程很不錯。Jeremy Howard從非常基礎、系統的角度講授所有內容,課程的設計讓任何具有一定技術背景的人可以參與。另外他們的論壇也是一個很不錯的社區。
之前提到的吳恩達后來又在Coursera開了新的課程系列。我沒有親自嘗試這些課程,但我確信其中一定包含很多好東西。我感覺這門課程也是以偏向實踐的方法教授的,不過也涉及一些背后的數學。
我建議你嘗試多門課程,然后挑選一門最能吸引你的注意力的課程。不過我鼓勵你至少逐漸完成一門實踐性課程和一門理論性課程,這是一個很好的互補。為了理解論文(警告:你需要閱讀學術論文),學術性課程將幫助你適應長篇的技術內容。實踐性課程則將提供一些直覺,幫助你做出ML項目中的各種決策。
如果你需要溫習一下數學,或者想學得更深入一點,MIT有幾門很棒的課程。任何ML工作都絕對需要對概率學良好的理解,John Tsitsiklis教授的6.041/6.431講得超棒。John將復雜問題逐步分解,直到答案顯而易見的地步,這種授課方法完全是藝術。
MIT的線性代數課程(18.06)也很有意思。這門課的教授同樣很出色,風格獨特。不過這門課程并不是真的很有必要,因為大多數ML任務只需要理解矩陣乘法。
如果我不懂編程該怎么辦?
去學。
大多數ML工作基于Python完成,幸運的是,Python相當容易上手。大多數ML工作也真不需要你是一個世界級的程序員。但我還是建議你在進行任何ML方面的工作前參加一門關于編程的速成線上課程。一下子學習編程和機器學習的概念(更別說還需要重新學習你大概已經忘掉了的一堆數學)是災禍之因。給自己一個循序漸進的機會。
我有一定基礎,現在該怎么做?
好,現在到了開始建模的時候了!一般來說有兩條路可走:1) 在工作中找一個項目,或者進行一個個人項目;2) 找一個Kaggle競賽。這取決于你的具體情況,不過我建議選Kaggle,主要原因如下:
問題是明確定義的。恰當地結構化真實生活中的ML問題可能需要一定的技巧。Kaggle就不存在這個問題。
類似地,有時候自己創建的數據集可能包含一些難以診斷的缺陷。而Kaggle競賽會給你提供數據。
Kaggle提供了一個處理同樣問題的社區。如果你陷入困境或者需要一點指引,有地方可去。
另一方面,如果你在工作中能碰到為ML方案量身定做的問題(比如圖像分類),那么也許工作項目是給你的同事留下深刻印象并說服老板讓你在機器學習上投入更多時間的快捷方式。
所以,如果你正考慮鉆研機器學習,請勇往直前!機器學習最棒的一點是人們在時間和知識方面真的很慷慨。一旦開始,你能在網上找到很棒的支持系統,幫助你前行。
-
計算機科學
+關注
關注
1文章
144瀏覽量
11635 -
機器學習
+關注
關注
66文章
8504瀏覽量
134661
原文標題:Feedly創始人是如何入門機器學習的
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
FPGA在機器學習中的具體應用
機器學習模型市場前景如何
嵌入式機器學習的應用特性與軟件開發環境

如何選擇云原生機器學習平臺
zeta在機器學習中的應用 zeta的優缺點分析
NPU與機器學習算法的關系
eda在機器學習中的應用
具身智能與機器學習的關系
人工智能、機器學習和深度學習存在什么區別

評論