91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kaggle機(jī)器學(xué)習(xí)/數(shù)據(jù)科學(xué)現(xiàn)狀調(diào)查

OaXG_jingzhengl ? 來源:未知 ? 作者:胡薇 ? 2018-06-29 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Kaggle是互聯(lián)網(wǎng)上最著名的數(shù)據(jù)科學(xué)競賽平臺之一,今年3月8日,這家機(jī)構(gòu)被谷歌收購,6月6日又宣布用戶數(shù)量超過了100萬人。最近,這一社區(qū)首次進(jìn)行了機(jī)器學(xué)習(xí)/數(shù)據(jù)科學(xué)現(xiàn)狀調(diào)查。在超過16,000名從業(yè)者的詳盡答卷中,我們可以一窺目前業(yè)內(nèi)的發(fā)展趨勢。有趣的是,Kaggle也將調(diào)查結(jié)果封裝成了匿名數(shù)據(jù)集以供大家自行分析。

有史以來第一次,Kaggle對人工智能領(lǐng)域進(jìn)行了全行業(yè)深度調(diào)查,試圖全面了解數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)概況。本次調(diào)查收到了超過16,000份回復(fù),眾多受調(diào)查者的數(shù)據(jù)向我們提供了有關(guān)從業(yè)者人群、業(yè)界最新動態(tài)以及如何進(jìn)入該行業(yè)的洞見。以下報告包括本次調(diào)查的所有主要結(jié)果,其中包含的主要內(nèi)容有:

雖然Python很可能是機(jī)器學(xué)習(xí)最常用的編程語言,但統(tǒng)計學(xué)家更多地使用R語言。

平均而言,數(shù)據(jù)科學(xué)家的年齡在30歲左右,但是這個數(shù)字在不同的國家有所不同。例如,印度的受訪者要比澳大利亞的平均年輕9歲。

有關(guān)被調(diào)查者教育程度,最普遍的學(xué)位是碩士,但是工資最高的($150k+)人群中,擁有博士學(xué)位的人稍稍多一點(diǎn)。

Kaggle已經(jīng)公開了該調(diào)查的匿名數(shù)據(jù)集,以供大家進(jìn)行探究:https://www.kaggle.com/kaggle/kaggle-survey-2017。

如何定義數(shù)據(jù)工作者?

觀察數(shù)據(jù)從業(yè)者的方式有很多,但本文將從有關(guān)數(shù)據(jù)科學(xué)從業(yè)者的工作和背景的人口統(tǒng)計學(xué)信息開始。

調(diào)查對象的年齡

如圖可見,本次調(diào)查對象的平均年齡大約30歲,但這個值在各個國家之間有變動。例如印度的調(diào)查對象的平均年齡就比澳大利亞的小了9歲。

你目前的就業(yè)狀況如何?

受調(diào)查者中,有65.7%表示自己有全職工作。

你的職位是什么?

盡管我們把數(shù)據(jù)科學(xué)家定義為使用代碼分析數(shù)據(jù)的人,我們發(fā)現(xiàn)數(shù)據(jù)科學(xué)領(lǐng)域可涵蓋的工作非常多。比如在伊朗和馬來西亞,數(shù)據(jù)科學(xué)從業(yè)者最流行的工作頭銜是「科學(xué)家或者研究者」。

你的全職年薪是多少?

中位數(shù)$55,441,不過由于很多人沒有全職工作(收入為0),所以這一數(shù)字不甚準(zhǔn)確。盡管在我們的調(diào)查中「補(bǔ)償和福利」的重要性排序稍微比「職業(yè)發(fā)展機(jī)遇」的低一點(diǎn),不過知道什么是合理的補(bǔ)償依然不錯。在美國,一般機(jī)器學(xué)習(xí)工程師帶回家最多的是培根。

131個回復(fù)由于超出最大值而沒有顯示出來,但它們被算進(jìn)了中位數(shù)。

你的最高學(xué)歷是什么?

因此,你需要再獲得一個學(xué)位嗎?通常來講,數(shù)據(jù)科學(xué)從業(yè)者中最普遍的學(xué)歷是碩士,但是獲取最高薪水($150K-$200K和$200k+)的那些人多是有著博士學(xué)位。

被調(diào)查者的平均水平是數(shù)據(jù)科學(xué)家職稱,30歲左右,碩士學(xué)歷,年薪$55,000左右。但實(shí)際情況并不如此平均。這些最初的幾個人口統(tǒng)計學(xué)問題只是展示了復(fù)雜的Kaggle數(shù)據(jù)科學(xué)社區(qū)在年齡、性別、國籍、工作職稱、薪水、經(jīng)驗(yàn)和學(xué)歷方面的表層差異。

數(shù)據(jù)科學(xué)家的工作內(nèi)容是什么?

我們把數(shù)據(jù)科學(xué)家定義為寫代碼以分析數(shù)據(jù)的一群人。他們的日常工作內(nèi)容是什么?以下是我們的調(diào)查結(jié)果。

工作中使用什么數(shù)據(jù)科學(xué)方法?

Logistic回歸是工作之中最為常用的數(shù)據(jù)科學(xué)方法,不過神經(jīng)網(wǎng)絡(luò)使用更為頻繁的國家安全領(lǐng)域除外??偟膩碚f,數(shù)據(jù)科學(xué)中更常見的還是使用經(jīng)典的機(jī)器學(xué)習(xí)算法,簡單的線性與非線性分類器是數(shù)據(jù)科學(xué)中最常見的算法,而功能強(qiáng)大的集成方法也十分受歡迎。我們看到目前神經(jīng)網(wǎng)絡(luò)模型的使用頻率要高于支持向量機(jī),這可能是近來多層感知機(jī)要比使用帶核函數(shù)的SVM更加廣泛的表現(xiàn)。

工作中使用最多的語言是什么?

Python是數(shù)據(jù)科學(xué)家最常用的語言,也是最常用的數(shù)據(jù)分析工具。不過,還有很多數(shù)據(jù)科學(xué)家仍然保持著對R語言的忠誠。

以上僅展示了15個回答,還有38個回答被隱藏。

在工作中常用的數(shù)據(jù)類型是什么?

關(guān)系型數(shù)據(jù)是開發(fā)者在工作中最常用的數(shù)據(jù)類型,因?yàn)榇蠖鄶?shù)產(chǎn)業(yè)工程師都十分關(guān)注于這種關(guān)系型數(shù)據(jù)。而學(xué)術(shù)研究者和國防安全產(chǎn)業(yè)則更注重于文本與圖像。

如何分享工作中的代碼?

盡管很多受訪者(58.4%)使用Git在工作分享他們的代碼。但大公司中的開發(fā)者更傾向于將代碼保留在本地,并通過像Email那樣的文件共享軟件來分享他們的代碼。而初創(chuàng)公司可能需要在云中共享以保持更加敏捷的反應(yīng)。

工作中遇到的障礙主要是什么?

臟數(shù)據(jù)(dirtydata)顯然是排在了第一位,也就是說數(shù)據(jù)科學(xué)家一般最常見的困擾就是需要對數(shù)據(jù)進(jìn)行大量的預(yù)處理工程。除了數(shù)據(jù)預(yù)處理工程以外,還有很多問題困擾著數(shù)據(jù)科學(xué)家,比如說眾多的機(jī)器學(xué)習(xí)算法各有各的擅長領(lǐng)域,所以理解它們的性能也會有一些困難。不過我們注意到向其他人解釋數(shù)據(jù)科學(xué)是什么也會困擾著數(shù)據(jù)科學(xué)家,解決辦法可以是推薦機(jī)器之心呀。

上圖僅展示了前面的15個回答,還有7個回答沒有展示。

此外,如果你們點(diǎn)擊選擇條件,那么就能按照條件過濾回答。很多行業(yè)的受訪者表示他們?nèi)鄙贁?shù)據(jù)科學(xué)相關(guān)的人才,所以數(shù)據(jù)科學(xué)家目前是十分幸運(yùn)的。

數(shù)據(jù)科學(xué)家新手如何入行?

當(dāng)開始一個新的職業(yè)生涯的時候,看看別人的成功秘訣是很有幫助的。我們調(diào)查了在數(shù)據(jù)科學(xué)行業(yè)工作的人們,詢問他們是如何做到的。以下是我們最喜歡的幾條建議:

你們會推薦數(shù)據(jù)科學(xué)家新手最先學(xué)哪門語言?

每一位數(shù)據(jù)科學(xué)家都有自己的對選擇第一門語言的想法。事實(shí)證明,那些僅使用Python或R語言的人們做出了正確的選擇。不過如果你問一下使用過R和Python的人們,他們有兩倍的可能會推薦Python給你。

你們使用哪些數(shù)據(jù)科學(xué)學(xué)習(xí)資源?

數(shù)據(jù)科學(xué)是一個快速變化的領(lǐng)域,有很多有價值的資源可以幫助你學(xué)習(xí)并保持業(yè)內(nèi)的頂尖位置,從而不斷提升你的競爭力。已經(jīng)在數(shù)據(jù)科學(xué)領(lǐng)域中工作的人們會更多使用StackOverflowQ&A,Conferences和Podcasts,以對不斷涌入這個領(lǐng)域的人們保持自己的優(yōu)勢。如果想要發(fā)布內(nèi)容或開源軟件,請時刻記住剛進(jìn)入這個領(lǐng)域的人們通常更多使用官方的文檔和觀看Youtube視頻。

你們在哪里獲取開源數(shù)據(jù)?

沒有數(shù)據(jù),就沒有數(shù)據(jù)科學(xué)。當(dāng)需要學(xué)習(xí)數(shù)據(jù)科學(xué)技巧的時候,知道如何找到干凈的開源數(shù)據(jù)集用于練習(xí)和開發(fā)項(xiàng)目相當(dāng)重要。很高興得知我們的數(shù)據(jù)集聚合器(datasetaggregators,https://www.kaggle.com/datasets)正發(fā)展為數(shù)據(jù)科學(xué)社區(qū)成員中最頻繁使用的工具。

你們怎么找工作,怎么找到的?

找工作的時候,可能到公司網(wǎng)站上,或在指定技術(shù)方向的招聘信息上,但是根據(jù)已經(jīng)在數(shù)據(jù)科學(xué)領(lǐng)域工作的人們的經(jīng)驗(yàn),這些方式是最差的選擇。而直接聯(lián)系招聘者或建立自己的網(wǎng)絡(luò)以進(jìn)入這個領(lǐng)域才是他們的首選。

Note:少于50名受訪者的組別被合并進(jìn)了「Other」類中。其中一些柱狀圖為了美觀而做了縮放處理,希望查看所有問題和結(jié)果的原始數(shù)據(jù)可訪問:https://www.kaggle.com/amberthomas/kaggle-2017-survey-results。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134580
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86700

原文標(biāo)題:Kaggle首份機(jī)器學(xué)習(xí)大調(diào)查:最常用的算法、語言竟然是......

文章出處:【微信號:jingzhenglizixun,微信公眾號:機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI在醫(yī)療健康和生命科學(xué)中的發(fā)展現(xiàn)狀

    NVIDIA 首次發(fā)布的“AI 在醫(yī)療健康和生命科學(xué)中的現(xiàn)狀”調(diào)研,揭示了生成式和代理式 AI 如何幫助醫(yī)療專業(yè)人員在藥物發(fā)現(xiàn)、患者護(hù)理等領(lǐng)域節(jié)省時間和成本。
    的頭像 發(fā)表于 04-14 14:10 ?407次閱讀

    機(jī)器學(xué)習(xí)模型市場前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機(jī)器學(xué)習(xí)模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機(jī)器學(xué)習(xí)模型市場
    的頭像 發(fā)表于 02-13 09:39 ?358次閱讀

    Kaggle知識點(diǎn):7種超參數(shù)搜索方法

    數(shù)據(jù)科學(xué)超參數(shù)搜索確實(shí)是機(jī)器學(xué)習(xí)生命周期中不可或缺的一步,特別是在模型性能方面。正確的超參數(shù)選擇可以顯著提高模型的準(zhǔn)確性、對未見數(shù)據(jù)的泛化能
    的頭像 發(fā)表于 02-08 14:28 ?946次閱讀
    <b class='flag-5'>Kaggle</b>知識點(diǎn):7種超參數(shù)搜索方法

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    用于開發(fā)生物學(xué)數(shù)據(jù)機(jī)器學(xué)習(xí)方法。盡管深度學(xué)習(xí)(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個強(qiáng)大的工具,目前也非常流行,但它的應(yīng)用領(lǐng)域仍然有限。與深度學(xué)習(xí)相比
    的頭像 發(fā)表于 12-30 09:16 ?1181次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    計算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?962次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)機(jī)
    的頭像 發(fā)表于 11-15 09:19 ?1211次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點(diǎn)圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果一個數(shù)據(jù)集中的某個特征值遠(yuǎn)高于其他值,這可能是一個異常值,需要進(jìn)一步調(diào)查。 2. 特
    的頭像 發(fā)表于 11-13 10:42 ?888次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)學(xué)習(xí)
    發(fā)表于 10-24 17:22 ?2974次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    醫(yī)療機(jī)器人發(fā)展現(xiàn)狀與趨勢

    醫(yī)療機(jī)器人作為醫(yī)療領(lǐng)域與現(xiàn)代機(jī)器人科技的融合體,正逐步引領(lǐng)醫(yī)療服務(wù)向更高效、更精準(zhǔn)的方向發(fā)展。以下是對醫(yī)療機(jī)器人發(fā)展現(xiàn)狀與趨勢的詳細(xì)分析:
    的頭像 發(fā)表于 10-21 15:24 ?5004次閱讀

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認(rèn)識。特別是書中提到的基于大數(shù)據(jù)機(jī)器學(xué)習(xí)的能源管理系統(tǒng),通過實(shí)時監(jiān)測和分析能源數(shù)據(jù),實(shí)現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能在科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    云端動態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時還可提供高級安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計
    的頭像 發(fā)表于 09-18 09:16 ?819次閱讀
    AI引擎<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>陣列指南

    【《時間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標(biāo)是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21
    主站蜘蛛池模板: 久久久午夜精品 | 亚洲毛片基地4455ww | 国产精品电影一区 | 天天视频黄 | 奇米影视777欧美在线观看 | 欧美日韩国产一区二区 | 在线观看视频在线观看 | 国产成人啪精品午夜在线观看 | 他也色在线视频 | 夜夜骑狠狠干 | 国产精品va一区二区三区 | 好男人www社区影视在线 | 日日干干| 亚洲激情 | 沟沟人体一区二区 | 国产小视频在线看 | 欧美干色 | bt天堂资源种子在线8 | 天天操夜夜操天天操 | 日本高免费观看在线播放 | 欧美成人免费午夜全 | 国产农村女人一级毛片了 | 我把美女日出白浆 | 六月丁香综合网 | 久久草在线视频国产一 | 色中色综合网 | 夜夜操网站 | 天天干天天摸天天操 | 狠狠色丁香久久婷婷综 | 天天做夜夜做 | 天天做天天爱天天大综合 | 欧美三级免费网站 | 黄 色 片成 人免费观看 | 四虎精品影院在线观看视频 | 天天躁狠狠躁 | 亚洲成av人片在线观看无码 | 日本免费不卡在线一区二区三区 | 四虎精品永久在线 | 又粗又长又色又爽视频 | 二区三区在线 | 国产精品欧美一区二区 |