編者按:SharpestMinds聯合創始人Jeremie Harris分享了申請數據科學家職位的經驗。
我仍然記得我兄弟決定賣出他的比特幣的時刻。那是2017年,當時我們在星巴克。我們碰到了一個發傳單的中年婦女。傳單開頭用黑體印著“比特幣:通向提前退休的道路”。
當時我挺好奇的,就問了她對加密貨幣市場的看法,結果發現她對比特幣以外的其他加密貨幣幾乎一無所知。以太坊?“從來沒聽說過。”萊特幣?“那是廉價版的比特幣,是吧?”
從經驗上說,如果毫無頭緒的中年婦女都在當地的星巴克向你宣傳最新的技術趨勢,你大概正接近不實宣傳的高峰,或者“泡沫”。
當然這算不上什么新發現。每個人都同意,投資的時候如果你做的和其他所有人都一樣,那你不太可能得到多少回報。很奇怪的一點是,人們沒能在投資自身上應用同一推理。
假設你想要應聘數據科學家職位。如果你做的全是標準的“我想要成為一位數據科學家”事情,那么這就意味著你不應該期望得到夢想的工作。目前市場已經充斥了初級水平的人員,因此,處于中位數水平的新手數據科學家不太可能得到太多認同。所以,你如果想要避免中位數的結果,為什么要做中位數的事?
問題在于,大多數人開始他們的數據科學之旅時不是這么想的。我在SharpestMinds工作的時候和數百名新手數據科學家聊過,其中大約80%的人告訴我的都差不多:
首先,他們學一些基礎(Python + sklearn + Pandas,也許還學點別的,比如SQL)
接著,他們參加了千篇一律的MOOC課程
他們讀了一些工作描述,擔心不符合條件
也許去參加另一門MOOC,也許開始申請工作
沒有收到任何回音(或者,最好的情況下,參加了一些面試,全搞砸了)
變得很沮喪,考慮是不是去讀個碩士,或者再申請一些工作
到了抉擇的時刻了:該不該重復第2-7步直到發生了不同的事情?
如果這符合你的情況,那么很可能你也處在一個自我提升的泡沫中:你正在做所有其他人都在做的事,但期望得到不同的結果。你需要做一件事:停下來。
如果你期望超出平均水平的結果,那么你不能做平均水平的事情。但是,想要避免平均水平的事,你需要知道什么是平均水平的事。
這里是一些例子:如果你需要參加一個MOOC課程學習一些基礎,那很好。但不要陷入MOOC螺旋:MOOC,從定義上來說,基本上都是為平均水平的人設計的。所以你并不會因為上了多門MOOC就成為一個突出的人。類似地,如果你的GitHub上有4到5個Jupyter notebook,內容都是乏味的sklearn/Pandas/seaborn/Keras技術棧,不要再做一個新的了。
總的規則是:如果有一件事看起來是明顯的下一步,因為所有其他人都這么做,這是一件很好的不去做的事。相反,你需要找到其他人不做的事,并且盡快去做。
那是些什么樣的事情?根據我的經歷,我想到5件:
復現論文。如果你是深度學習愛好者,這一點尤其重要。人們不做這事,因為這比獲取一個數據集,然后使用簡單的人工神經網絡或XGBoost進行千篇一律的分類要難。在arXiv上找一篇和你的領域相關的最有趣的論文(最近的論文最理想),閱讀它,理解它。接著,復現它,可能是在一個新的數據集上復現。寫篇博客總結這次復現。
不要呆在舒適區。如果你開始一個新項目,最好學習一些新框架/庫/工具。如果你正創建第6個Jupyter notebook,開頭是df = pd.read_csv(filename),結尾是f1 = f1_score(y_true, y_pred),是時候改變你的策略了。
學習枯燥的東西。其他人不做這事,因為沒人喜歡枯燥的東西。但是,學習正確的Git流程,如何使用Docker,如何使用Flask搭建一個應用,如何部署模型至AWS或Google Cloud,這些都是公司很盼望申請人具備的技能,但大多數申請人低估了這些技能的重要性。
做頭疼的事情。1) 爭取在當地的數據科學聚會上講篇論文。或者,最起碼,參加當地的數據科學聚會。2) 給LinkedIn上的人發冷消息。試著首先提供一些價值(“我剛發現了你網站上的一個筆誤”)。不要直接向他們請求一份工作。你的請求越具體越好(“我希望你能給我的博客文章一點反饋”)。你正試圖建立關系,拓展你的網絡,那需要耐心。3) 參加會議和組織。4) 創辦一個學習小組。
做看起來瘋狂的事情。每個人都用UCI倉庫,或者使用某個股票數據集(沒勁)來創建他們的項目。別這么做。學習如何使用一個網頁抓取庫,或者某個被低估的API創建自己的定制數據集。數據很難獲取,公司常常需要依靠工程師收集數據。你的目標是成為那種癡迷數據科學的瘋子,如果工作需要,會自己創建該死的數據集。
這些策略都是一種在雇主每天面對的噪聲中突出自己的方法。它們都不是銀彈,但它們是在數據科學工作市場上得到更多認同,成為更能干的數據科學家的萬無一失的方法。
最后,記住,培養自己的技能是對自身的投資。那意味著適用于投資的經濟學原則同樣適用于此:如果你想要突出的結果,那么你需要做突出的事情。
如果你對如何優化自己的機器學習或數據科學軌跡存有疑問,我很樂意和你聊聊。在Twitter上給我(jeremiecharris)發DM :)
-
深度學習
+關注
關注
73文章
5523瀏覽量
121714 -
數據科學
+關注
關注
0文章
168瀏覽量
10127
原文標題:想當數據科學家,可別隨大流!
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
NVIDIA RAPIDS cuDF如何賦能AI加速數據科學
AI 推動未來科學 晶泰科技共襄未來科學大獎周

西湖大學:科學家+AI,科研新范式的樣本

AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
受人眼啟發!科學家開發出新型改良相機

中國科學家發現新型高溫超導體
天津大學科學家突破人類大腦器官成功驅動機器人
新華社:突破性成果!祝賀我國科學家成功研發這一傳感器!

前OpenAI首席科學家創辦新的AI公司
科學家研制出一款新型柔性X射線探測器
科學家開發電驅動有機半導體激光器

本源量子參與的國家重點研發計劃青年科學家項目啟動會順利召開

NVIDIA首席科學家Bill Dally:深度學習硬件趨勢

評論