數據平臺 Kaggle 近日發布了 2017 機器學習及數據科學調查報告,這也是 Kaggle 首次進行全行業調查。調查共收到超過 16000 份回復,受訪內容包括最受歡迎的編程語言、不同國家數據科學家的平均年齡、不同國家的平均年薪等。
下面主要看看工具使用方面的結果。請注意,該報告包含多個國家的數據,可能存在收集不夠全面的情況,僅供參考。
年齡
從全球范圍來看,本次調查對象的平均年齡在 30 歲左右。當然,各個國家的數值會有差異,中國的機器學習從業者年齡的中位數是 25 歲。
全球全職工作者為 65.7% ,其中中國為 53.% ,美國占比較高,達 70.9% 。
Logistic 回歸是除了軍事和國安領域外,最常用的數據科學研究方法。在軍事和國防安全領域,神經網絡被使用更多。
在工具語言使用方面,Python是數據科學家使用最多的語言。同時,統計學家對 R 語言的忠誠度很高。
關系型數據是最常用的數據類型,學術研究者和國防安全領域則更親睞文本和圖像。
Git 是他們最常用的代碼共享和托管方式。
Dirty Data (臟數據)是從業者遇到的最大障礙。此外,理解不同算法的能力不夠也是困擾數據工作者的一大障礙。缺乏有效管理和資金支持,是面臨的兩大外在困境。
有趣的是,只使用 Python 或只使用 R 的都覺得他們做出了正確的選擇。 但是,如果你去詢問那些既使用 Python 也使用 R 的人,推薦使用 Python 的可能會是 R 的兩倍。
數據科學是個變化極快的領域,業內人員需要不斷更新知識體系,才可以在業內保持一定地位,不被時代淘汰。Stack Overflow Q&A、Conferences 和 Podcasts 是已從業者經常使用的學習平臺。
-
機器學習
+關注
關注
66文章
8418瀏覽量
132646
原文標題:2017 機器學習調查報告:Python是數據科學家使用最多的語言!
文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
bds 行業發展趨勢分析 bds在大數據中的應用
raid 在大數據分析中的應用
emc技術在大數據分析中的角色
云計算在大數據分析中的應用
大數據從業者必知必會的Hive SQL調優技巧
大數據在軍事方面的應用
數據分析除了spss還有什么
數據分析的工具有哪些
大數據分析平臺網站
名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?
大數據在軍事方面的應用有哪些
首批!數勢科技SwiftAgent完成中國信通院大模型驅動的智能數據分析工具專項測試
![首批!數勢科技SwiftAgent完成中國信通院大模型驅動的智能<b class='flag-5'>數據分析</b><b class='flag-5'>工具</b>專項測試](https://file1.elecfans.com//web2/M00/E9/C0/wKgaomZQdCWANMtzAADu8-2pyp8985.png)
評論