在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深入研究數(shù)據(jù)科學家使用的常見統(tǒng)計和分析技術(shù)

454398 ? 來源: 企業(yè)網(wǎng)D1Net ? 作者: Ronald Schmelzer ? 2021-01-14 16:09 ? 次閱讀

數(shù)據(jù)科學技術(shù)如今已在許多組織中占有一席之地,數(shù)據(jù)科學家正迅速成為以數(shù)據(jù)為中心的組織最受歡迎的角色之一。數(shù)據(jù)科學的應用程序利用機器學習等技術(shù)和大數(shù)據(jù)的力量來獲取深入的見解和新的功能,其中包括預測分析、圖像和對象識別、會話人工智能系統(tǒng)等。

事實上,那些沒有在數(shù)據(jù)科學上進行充分投資的組織可能很快落后于在數(shù)據(jù)科學方面獲得顯著競爭優(yōu)勢的競爭對手。

數(shù)據(jù)科學家可以做些什么以提供這種變革性的業(yè)務收益?數(shù)據(jù)科學領域是一些關(guān)鍵要素的集合:準確提取可量化數(shù)據(jù)的統(tǒng)計和數(shù)學方法;使用先進的分析技術(shù)和方法從科學角度解決數(shù)據(jù)分析的技術(shù)和算法,有助于處理大型數(shù)據(jù)集;以及可以幫助將大量數(shù)據(jù)整理成獲得高質(zhì)量見解的所需格式的工具和方法。

以下將更深入地研究數(shù)據(jù)科學家使用的常見統(tǒng)計和分析技術(shù)。其中一些數(shù)據(jù)科學技術(shù)植根于數(shù)世紀的數(shù)學和統(tǒng)計工作,而另一些技術(shù)則相對較新,利用了機器學習、深度學習和其他形式的高級分析的研究成果。

數(shù)據(jù)科學如何發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系

當識別大量數(shù)據(jù)中的信息時,數(shù)據(jù)科學家首先需要辨別不同的數(shù)據(jù)元素如何相互關(guān)聯(lián)。例如,如果在一張圖上繪制了一堆數(shù)據(jù)點,那么如何知道它們是否有意義?

數(shù)據(jù)科學家最廣泛使用的有三種統(tǒng)計和分析技術(shù)。也許數(shù)據(jù)表示兩個或多個變量之間的關(guān)系,而其工作是繪制某種最能描述這種關(guān)系的曲線或多維平面。或者,它代表具有某種親和力的集群。其他數(shù)據(jù)可能代表不同的類別。通過發(fā)現(xiàn)這些關(guān)系,可以使數(shù)據(jù)的其他隨機性具有意義,然后可以對其進行分析和可視化,以提供組織可以用來制定決策或計劃策略的信息。

以下了解可用于執(zhí)行分析的各種數(shù)據(jù)科學技術(shù)和方法:

分類技術(shù)

在分類問題中,數(shù)據(jù)科學家要回答的首要問題是:“這些數(shù)據(jù)屬于什么類別?”將數(shù)據(jù)分類的原因很多。也許數(shù)據(jù)是手繪的圖像,人們需要知道圖像代表什么字母或數(shù)字。或者代表貸款申請的數(shù)據(jù),想知道它應該屬于“已批準”還是“已拒絕”類別。其他分類可以集中在確定患者治療方案或電子郵件是否是垃圾郵件。

數(shù)據(jù)科學家用來將數(shù)據(jù)過濾到類別中的算法和方法包括:

?決策樹。這些是分支邏輯結(jié)構(gòu),使用機器生成的參數(shù)和數(shù)值樹將數(shù)據(jù)分類為已定義的類別。

?貝葉斯分類器。利用概率的力量,貝葉斯分類器可以幫助將數(shù)據(jù)分為簡單的類別。

?支持向量機(SVM)。支持向量機的目標是繪制一條寬邊距的曲線或平面,將數(shù)據(jù)分成不同的類別。

?K-近鄰算法。該技術(shù)使用一種簡單的“惰性決策”方法,根據(jù)數(shù)據(jù)集中最鄰近的類別來確定數(shù)據(jù)點應該屬于哪個類別。

?邏輯回歸。盡管使用了分類技術(shù),但它使用將數(shù)據(jù)擬合到一條線的想法來區(qū)分每一邊的不同類別。這條線的形狀使數(shù)據(jù)可以移至某個類別。

?神經(jīng)網(wǎng)絡。這種方法使用訓練有素的人工神經(jīng)網(wǎng)絡,尤其是具有多個隱藏層的深度學習網(wǎng)絡。神經(jīng)網(wǎng)絡已經(jīng)顯示出強大的分類能力,其中包含大量的訓練數(shù)據(jù)。

回歸技術(shù)

如果不知道數(shù)據(jù)屬于哪一類,而是想知道不同數(shù)據(jù)點之間的關(guān)系該怎么辦?回歸的主要思想是回答以下問題:“這個數(shù)據(jù)的預測值是多少?”一個簡單的概念來自“均值回歸”的統(tǒng)計概念,它可以是一個獨立變量和一個因變量之間的直接回歸,也可以是一個試圖找到多個變量之間關(guān)系的多維回歸。

例如決策樹支持向量機(SVM)和神經(jīng)網(wǎng)絡一些分類技術(shù),也可以用來進行回歸。此外,數(shù)據(jù)科學家可以使用的回歸技術(shù)包括:

?線性回歸。作為數(shù)據(jù)科學中應用最廣泛的方法之一,這種方法試圖根據(jù)兩個變量之間的相關(guān)性找到最適合所分析數(shù)據(jù)的曲線。

?套索回歸。Lasso(套索)是“最小絕對收縮和選擇算符”的縮寫,是一種通過在最終模型中使用數(shù)據(jù)子集來提高線性回歸模型預測準確性的技術(shù)。

?多元回歸。這涉及尋找適合可能包含多個變量的多維數(shù)據(jù)的線或平面的不同方法。

聚類和關(guān)聯(lián)分析技術(shù)

另一組數(shù)據(jù)科學技術(shù)側(cè)重于回答這樣一個問題:“這些數(shù)據(jù)是如何分組的,不同的數(shù)據(jù)點屬于哪些組?”數(shù)據(jù)科學家可以發(fā)現(xiàn)相關(guān)數(shù)據(jù)點的聚類,這些數(shù)據(jù)點具有共同的各種特征,從而在分析應用程序中產(chǎn)生有用的信息。

可用于聚類用途的方法包括:

?K-均值聚類。K-均值算法確定數(shù)據(jù)集中的一定數(shù)量的聚類,并找到“質(zhì)心”,以標識不同聚類的位置,并將數(shù)據(jù)點分配給最接近的聚類。

?均值漂移聚類。另一種基于質(zhì)心的聚類技術(shù),它可以單獨使用,也可以通過移動指定的質(zhì)心來改進k-均值聚類。

?DBSCAN。DBSCAN是“基于密度的帶噪空間聚類算法DBSCAN”的縮寫,是另一種發(fā)現(xiàn)聚類的技術(shù),它使用一種更高級的方法來識別聚類的密度。

?高斯混合模型。高斯混合模型通過使用高斯分布將數(shù)據(jù)分組在一起而不是將數(shù)據(jù)視為奇點來幫助找到聚類。

?分層聚類。與決策樹類似,這種技術(shù)使用層次化的分支方法來查找聚類。

關(guān)聯(lián)分析是一種相關(guān)但獨立的技術(shù)。其背后的主要思想是找到描述不同數(shù)據(jù)點之間公共性的關(guān)聯(lián)規(guī)則。與聚類類似,人們正在尋找數(shù)據(jù)所屬的組。但是在這種情況下,試圖確定何時數(shù)據(jù)點一起出現(xiàn),而不是僅僅識別它們的集群。在聚類中,其目標是將大數(shù)據(jù)集劃分為可識別的組,而通過關(guān)聯(lián)分析,人們正在測量數(shù)據(jù)點之間的關(guān)聯(lián)程度。

數(shù)據(jù)科學應用實例

數(shù)據(jù)科學工具帶中的上述方法和技術(shù)需要適當?shù)貞糜谔囟ǖ姆治鰡栴}以及可用于解決這些問題的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學家必須能夠理解當前問題的本質(zhì)——是聚類、分類還是回歸?以及在給定數(shù)據(jù)特征的情況下可以產(chǎn)生所需答案的最佳算法。這就是數(shù)據(jù)科學實際上是一個科學過程而不是具有嚴格規(guī)則的過程,并允許通過編程解決問題的原因。

使用這些技術(shù),數(shù)據(jù)科學家可以處理廣泛的應用程序,其中許多應用程序通常出現(xiàn)在不同類型的行業(yè)和組織中。以下是一些例子:

·異常檢測。如果可以找到預期或正常數(shù)據(jù)的模式,那么也可以找到那些不符合模式的數(shù)據(jù)點。金融服務、醫(yī)療保健、零售和制造業(yè)等行業(yè)組織經(jīng)常采用各種數(shù)據(jù)科學方法來識別其數(shù)據(jù)中的異常情況,以用于欺詐檢測、客戶分析、網(wǎng)絡安全和IT系統(tǒng)監(jiān)控。異常檢測還可以用來消除數(shù)據(jù)集中的異常值,以提高分析的準確性。

·二分類和多分類。分類技術(shù)的一個主要應用是確定某物是否屬于某一特定類別。這就是所謂的二分類,因為人們可能會問諸如“圖片中是否有貓?”之類的問題。實際的業(yè)務應用是使用圖像識別在大量文件中識別合同或發(fā)票。在多類分類中,在數(shù)據(jù)集中有許多不同的類別,正在努力尋找最適合數(shù)據(jù)點的類別。例如,美國勞工統(tǒng)計局會對工傷進行自動分類。

·個性化。希望與客戶進行個性化交互或向客戶推薦產(chǎn)品和服務的組織首先需要將數(shù)據(jù)分組到具有共享特征的數(shù)據(jù)桶中。有效的數(shù)據(jù)科學工作可以使用推薦引擎和超個性化系統(tǒng)等技術(shù),根據(jù)個人的具體需求和喜好量身來定制網(wǎng)站,推銷產(chǎn)品及更多內(nèi)容,這些技術(shù)是通過匹配人員詳細資料中的數(shù)據(jù)來驅(qū)動的。

這只是數(shù)據(jù)科學應用程序的一些示例。通過采用數(shù)據(jù)分析的各種工具和方法,數(shù)據(jù)科學家可以幫助使用它們的組織獲得戰(zhàn)略和競爭優(yōu)勢。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4798

    瀏覽量

    102467
  • 決策樹
    +關(guān)注

    關(guān)注

    3

    文章

    96

    瀏覽量

    13754
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    我國科學家制備出可控手性石墨烯卷

    日前,我國科學家開發(fā)了一種名為“石蠟輔助浸入法”的新技術(shù),成功讓二維材料“卷起來”,制備出具有可控手性的石墨烯卷,為未來量子計算和自旋電子器件的發(fā)展奠定了堅實基礎。 由天津大學教授胡文平、雷圣賓、李
    的頭像 發(fā)表于 02-26 11:17 ?382次閱讀

    為何選擇GraphPad Prism

    節(jié)省統(tǒng)計分析的時間 專為科學家(而非統(tǒng)計學家)設計的多功能統(tǒng)計工具。直接將數(shù)據(jù)輸入專為科學研究
    的頭像 發(fā)表于 02-18 09:23 ?232次閱讀
    為何選擇GraphPad Prism

    西湖大學:科學家+AI,科研新范式的樣本

    ,創(chuàng)新科研新范式。這一點在西湖大學的科研項目中已得到體現(xiàn)。 成立于2018年的西湖大學是由施一公院士領銜創(chuàng)辦的、聚焦前沿科學研究研究型大學,該校鼓勵科學家們探索AI與各學科交叉融合,為科研創(chuàng)新提速。為此,西湖大學在浪潮信息等企
    的頭像 發(fā)表于 12-12 15:59 ?421次閱讀
    西湖大學:<b class='flag-5'>科學家</b>+AI,科研新范式的樣本

    三維電子背散射衍射(EBSD)技術(shù):FIB-SEM與EBSD的結(jié)合應用案例

    就顯得不夠全面。為了深入研究晶粒組織、晶粒尺寸和界面等三維特征,科學家們發(fā)展了一種新的技術(shù)——三維電子背散射衍射(3D-EBSD)。從二維到三維的跨越對于大尺度區(qū)
    的頭像 發(fā)表于 11-29 17:31 ?659次閱讀
    三維電子背散射衍射(EBSD)<b class='flag-5'>技術(shù)</b>:FIB-SEM與EBSD的結(jié)合應用案例

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    了傳統(tǒng)學科界限,使得科學家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術(shù)的引入也催生了一種全新的科學研究范式,即數(shù)據(jù)驅(qū)動的
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    和數(shù)量直接影響到模型的準確性和可靠性。因此,數(shù)據(jù)獲取、處理、分析和質(zhì)量控制在AI for Science中至關(guān)重要。此外,數(shù)據(jù)驅(qū)動的研究范式也促使
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù)
    發(fā)表于 10-14 09:12

    上海科學家精準操控原子“人造”藍寶石 為低功耗芯片研制開辟新路

    當芯片中的晶體管隨著摩爾定律向納米級不斷縮小時,發(fā)揮絕緣作用的介質(zhì)材料卻因為厚度縮小而性能快速降低。如何為更小的晶體管匹配更佳的介質(zhì)材料,成為集成電路領域科學家們的苦苦追尋的目標。 如今,中國科學
    的頭像 發(fā)表于 08-09 15:38 ?548次閱讀

    中國科學家發(fā)現(xiàn)新型高溫超導體

    據(jù)新華社報道,我國科學家再立新功,又一新型高溫超導體被發(fā)現(xiàn)。 復旦大學物理學系趙俊團隊利用高壓光學浮區(qū)技術(shù)成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導的體超導電性,而且超導體積分數(shù)達到
    的頭像 發(fā)表于 07-19 15:14 ?994次閱讀

    天津大學科學家突破人類大腦器官成功驅(qū)動機器人

    在科技探索的征途上,天津大學的科研團隊再次邁出了令人矚目的步伐。7月5日,該校宣布了一項革命性的成果——科學家們利用前沿的干細胞技術(shù),成功培育出了高度模擬人類大腦的類腦器官,并創(chuàng)新性地將其與機器人系統(tǒng)通過先進的片上腦機接口技術(shù)
    的頭像 發(fā)表于 07-08 16:00 ?831次閱讀

    倫敦商學院深入研究中國神州數(shù)碼戰(zhàn)略轉(zhuǎn)型

    China)數(shù)字化轉(zhuǎn)型歷程的深入研究為基礎,共同撰寫了案例研究「神州數(shù)碼的轉(zhuǎn)型:駕馭數(shù)據(jù)、云和人工智能的潛力(The Transformation of Digital China
    的頭像 發(fā)表于 07-02 11:25 ?672次閱讀
    倫敦商學院<b class='flag-5'>深入研究</b>中國神州數(shù)碼戰(zhàn)略轉(zhuǎn)型

    新華社:突破性成果!祝賀我國科學家成功研發(fā)這一傳感器!

    6月25日,新華社以《突破性成果!祝賀我國科學家》為標題,報道了由我國科學家研發(fā)的傳感器成果。 我國科學家研發(fā)高通道神經(jīng)探針實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測 神經(jīng)探針是一種用來記錄神經(jīng)活動的針狀電傳
    的頭像 發(fā)表于 06-27 18:03 ?750次閱讀
    新華社:突破性成果!祝賀我國<b class='flag-5'>科學家</b>成功研發(fā)這一傳感器!

    前OpenAI首席科學家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因為蘇茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學家,并在去年在OpenAI董事會上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?696次閱讀

    助力科學發(fā)展,NVIDIA AI加速HPC研究

    科學家研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應用于代碼生成、天氣預報、遺傳學和材料科學領域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?635次閱讀
    助力<b class='flag-5'>科學</b>發(fā)展,NVIDIA AI加速HPC<b class='flag-5'>研究</b>

    本源量子參與的國家重點研發(fā)計劃青年科學家項目啟動會順利召開

    2024年4月23日,國家重點研發(fā)計劃“先進計算與新興軟件”重點專項“面向復雜物理系統(tǒng)求解的量子科學計算算法、軟件、應用與驗證”青年科學家項目啟動會暨實施方案論證會在合肥順利召開。該項目由合肥綜合性國家科學中心人工智能
    的頭像 發(fā)表于 05-11 08:22 ?1112次閱讀
    本源量子參與的國家重點研發(fā)計劃青年<b class='flag-5'>科學家</b>項目啟動會順利召開
    主站蜘蛛池模板: 97综合久久| 亚洲黄色网址 | 国产农村一级特黄α真人毛片 | 欧美四虎 | 91插插视频 | 性过程很黄的小说男男 | 午夜久久久 | 国产午夜精品久久久久 | 性视频在线| 又长又大又粗又硬3p免费视 | 大又大粗又爽又黄少妇毛片 | 久久久精品波多野结衣 | 色人在线 | 插吧插吧综合网 | 国产肥女bbwbbw | 国产免费好大好硬视频 | 国产亚洲午夜精品a一区二区 | 亚洲视频在线网 | 国产成人综合亚洲怡春院 | 欧美另类图片亚洲偷 | 久久精品国产大片免费观看 | 免费一级欧美在线观看视频片 | 韩漫免费网站无遮挡羞羞漫画 | 天堂资源吧 | 丁香五香天堂网 | 人人精品久久 | 天天干天天拍天天射天天添天天爱 | 深爱五月网 | 爆操欧美| 男人的天堂在线免费视频 | 一级黄色毛片免费看 | 美女张开大腿让男人捅 | 国产午夜免费视频 | 香港日本三级在线播放 | 黄色欧美 | freesex性| 美女用手扒开尿口给男生桶爽 | 色婷婷丁香六月 | 亚洲日本中文字幕天天更新 | www.色播| 日本一区不卡视频 |