毫無疑問,數據科學如今已經成為并將持續是最熱門的職業選擇領域,很多人一個猛子扎進了這一領域當中。但是,這個21世紀最熱門的職業并不一定適合所有人,這不是說數據科學不值得,恰恰相反它幾乎就是為了解決實際問題而生的。
當然啦,本文僅代表作者觀點,可能存在一定偏頗。不同國家地區的職業設置以及各人掌握的技能存在差異,因而每個人看世界的角度都不一樣。我只從我的經驗和角度聊聊我的想法。
入行以來,筆者每天花費10到12小時在數據科學領域中,撰寫了將近100篇相關文章,自認為已有資格對這個領域里的某些現象發表一點見解,那些現象令人失望卻鮮有人提及。對筆者而言,實用數據科學是最有趣的領域之一,尤其是在進一步深入學習之后更有體會。
然而,為了數據科學而從事數據科學的意義何在呢?這么說吧,除非是研究人員,否則全職從事這個行業幾乎沒有任何意義。花費大量時間訓練模型的理由何在呢?模型會被應用在網頁和/或者手機app中嗎?是會被用來解決一些實際問題嗎?還是只會被閑置在電腦上呢?
數據科學似乎正在成為軟件開發的另一個分支。這不見得是壞事,現如今模型訓練和優化(只要用對工具)幾乎全部都是自動化的,而“數據科學家”需要做的,僅僅是以恰當的方式準備數據,以及向上級匯報工作。
這或許是件好事,你有了更多時間去做有趣的事情,從而交付整個數據包并實際解決問題,而不會將模型閑置在電腦上。
但是,如果計劃在這個領域謀求一份全職工作,請先讀一讀本文,看看行業光鮮外表下的其它方面,了解進入這個行業的優勢和可能存在的劣勢是很有必要的。
1.不關心業務
先說明一下,除了在Medium和TDS上發表博文以外,筆者還是一個全職的數據科學家。筆者所就職的公司并不專門從事于數據科學的某個分支,僅僅是一家以咨詢為主的IT公司。
這意味著筆者并不專注于一個項目或一個產品,而是同時推進三到五個不同行業的不同項目。是的,筆者并不精通于那些行業里的任何一個。這可能是很多人不喜歡數據科學工作的原因,你對所工作的領域了解不多,從業者也并不愿意去學習那么多東西。
不過,對于某些在相關領域從事數據科學的人而言,情況可能并非如此。假設一個人已經在X領域接受了專業教育,并且對數學和統計學掌握得不錯,因而被聘用在該領域里從事大量重數據型工作,這就皆大歡喜了。
我所指的是通才型數據科學家,就是那種從一個項目轉移到另一個項目工作,但是感覺自己從來沒有做出實際貢獻的人。
2.缺乏全局觀
這個缺點對數據科學領域的通才和專家都適用。
假設有某個項目團隊的app需要“數據科學魔法”的加持,于是邀請了一位數據科學家參加會議。這位數據科學家一定會被問到這些問題:
· 你的模型可以做到這點嗎?
· 這些現代神經網絡可以用在10KB的數據集上嗎?
· 你能只用30行數據做一個預測模型嗎?
這就是問題所在了。在完全不了解項目及其架構的情況下,就必須很快提供一個最先進的解決方案,也就是所謂的全局觀問題。
對于專家型數據科學家可能還沒那么麻煩,因為他們至少具備了某些領域的專業知識,并且了解如何去適應全局,這使他們能夠相對輕松地完成工作。
3.老板是商人
外行領導內行這件事很容易鬧出一些荒謬的困難。如果你的上級不是數據相關領域的專家,那么他們對于數據科學的了解與任何一個普通人從新聞里了解到的沒什么兩樣。
不過,這個問題帶來的影響大小在不同的國家是不同的,畢竟不同國家的工作和生活文化可能存在很大差距。
而這帶來了一個潛在的問題,團隊可能接到一項任務,其研究工作需要數月才能完成,但是從商業角度來說這不太可行。理想的情形是,部門主管能夠理解特定解決方案所需要的時間之長和工作量之大,然后在上一級那邊幫忙交流疏通,但這樣的主管可遇而不可求。
這時就是良好的人際交往能力派上用場的時候了。給你的老板解釋清楚為什么花一兩個月去搜查100項用不上的東西,這不是一件輕松愉快的事情,但掌握人際交往和項目展示的技巧可能會讓局面更好一點。
在筆者看來,只有在有實際問題需要解決時,只深耕于數據科學和預測建模的全職數據科學家才有立足之地。歸根結底,數據科學只是一種技能,不應用于解決業務問題就毫無價值。如果不關心相關業務,或者僅僅是不了解業務情況,都可能讓工作無法順利開展。
所以,是否要入行,還請你三思。
-
自動化
+關注
關注
29文章
5654瀏覽量
79773 -
模型
+關注
關注
1文章
3372瀏覽量
49299 -
數據科學
+關注
關注
0文章
168瀏覽量
10116
發布評論請先 登錄
相關推薦
用CPLD控制ADS7229,工作流程是怎么樣的?
數據科學工作流原理
《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
不只是前端,后端、產品和測試也需要了解的瀏覽器知識(二)
![不只是前端,后端、產品和測試也<b class='flag-5'>需要了解</b>的瀏覽器知識(二)](https://file1.elecfans.com//web2/M00/02/02/wKgZoma5rGWAFdf0AAIbzLRvuBs118.png)
NI數據采集板卡如何連接使用?
不只是前端,后端、產品和測試也需要了解的瀏覽器知識
![不只是前端,后端、產品和測試也<b class='flag-5'>需要了解</b>的瀏覽器知識](https://file1.elecfans.com//web2/M00/F6/A1/wKgZomaCfvOAdTpvAAU1WMKtFQ4337.png)
態勢數據如何存儲在數據庫里面呢
【天拓四方】邊緣網關在數據采集中起什么作用?
![【天拓四方】邊緣網關<b class='flag-5'>在數據</b>采集中起什么作用?](https://file1.elecfans.com//web2/M00/C8/1F/wKgZomYY3WCAX4esAADqaP0gAsM782.jpg)
評論