在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

決策樹(shù)和隨機(jī)森林模型

DPVg_AI_era ? 來(lái)源:lp ? 2019-04-19 14:38 ? 次閱讀

這是一個(gè)系列教程,試圖將機(jī)器學(xué)習(xí)這門(mén)深?yuàn)W的課程,以更加淺顯易懂的方式講出來(lái),讓沒(méi)有理科背景的讀者都能看懂。

前情提要:這是一個(gè)系列教程。如果你剛好第一次看到這篇文章,那么你可能需要收藏一下本篇文章,然后先看一下這個(gè)系列的前一篇《文科生都能看懂的機(jī)器學(xué)習(xí)教程:梯度下降、線(xiàn)性回歸、邏輯回歸》。如果你已經(jīng)看過(guò)了,那么就不再多說(shuō),讓我們繼續(xù)吧。

本次主要講的是決策樹(shù)和隨機(jī)森林模型,

決策樹(shù)

決策樹(shù)是個(gè)超簡(jiǎn)單結(jié)構(gòu),我們每天都在頭腦中使用它。它代表了我們?nèi)绾巫龀鰶Q策的表現(xiàn)形式之一,類(lèi)似if-this-then-that:

首先從一個(gè)問(wèn)題開(kāi)始;然后給出這個(gè)問(wèn)題的可能答案,然后是這個(gè)答案的衍生問(wèn)題,然后是衍生問(wèn)題的答案…直到每個(gè)問(wèn)題都有答案。程序員和PM應(yīng)該這個(gè)流程非常熟悉的。

先看一個(gè)決策樹(shù)的例子,決定某人是否應(yīng)該在特定的一天打棒球。

圖片來(lái)源:Ramandeep Kaur的 “ 機(jī)器學(xué)習(xí)與決策樹(shù)”

這棵樹(shù)從上往下,首先提出一個(gè)問(wèn)題:今天的天氣預(yù)期如何?接下來(lái)會(huì)有三種可能的答案:晴;陰;雨。

1. if 天氣=晴天,那么判斷濕度如何

1. if 濕度高,then 取消

2. if 濕度低,then 去玩

2. if 天氣=陰天,then 去

3. if 天氣=下雨,then 取消

一棵簡(jiǎn)單的決策樹(shù)就出來(lái)了。決策樹(shù)具備以下特性:

決策樹(shù)用于建模非線(xiàn)性關(guān)系(與線(xiàn)性回歸模型和邏輯回歸模型相反)

決策樹(shù)可以對(duì)分類(lèi)和連續(xù)結(jié)果變量進(jìn)行建模,盡管它們主要用于分類(lèi)任務(wù)(即分類(lèi)結(jié)果變量)

決策樹(shù)很容易理解! 您可以輕松地對(duì)它們進(jìn)行可視化,并準(zhǔn)確找出每個(gè)分割點(diǎn)發(fā)生的情況。 您還可以查看哪些功能最重要

決策樹(shù)容易過(guò)擬合。這是因?yàn)闊o(wú)論通過(guò)單個(gè)決策樹(shù)運(yùn)行數(shù)據(jù)多少次,因?yàn)橹皇且幌盗衖f-this-then-that語(yǔ)句,所以總是會(huì)得到完全相同的結(jié)果。這意味著決策樹(shù)可以非常精確地適配訓(xùn)練數(shù)據(jù),但一旦開(kāi)始傳遞新數(shù)據(jù),它可能無(wú)法提供有用的預(yù)測(cè)

決策樹(shù)有多種算法,最常用的是ID3(ID代表“迭代二分法”)和CART(CART代表“分類(lèi)和回歸樹(shù)”)。這些算法中的每一個(gè)都使用不同的度量來(lái)決定何時(shí)分割。ID3樹(shù)使用信息增益 ,而CART樹(shù)使用基尼指數(shù) 。

ID3樹(shù)和信息增益

基本上ID3樹(shù)的全部意義在于最大限度地提高信息收益,因此也被稱(chēng)為貪婪的樹(shù)。

從技術(shù)上講,信息增益是使用熵作為雜質(zhì)測(cè)量的標(biāo)準(zhǔn)。好吧。我們先來(lái)了解一下熵。

簡(jiǎn)單地說(shuō),熵是(dis)順序的衡量標(biāo)準(zhǔn),它能夠表示信息的缺失流量,或者數(shù)據(jù)的混亂程度。缺失大量信息的東西被認(rèn)為是無(wú)序的(即具有高度熵),反之則是低度熵。

舉例說(shuō)明:

假設(shè)一個(gè)凌亂的房間,地板上是臟衣服,也許還有一些樂(lè)高積木,或者switch、iPad等等。總之房間非常亂,那么它就是熵很高、信息增益很低。

現(xiàn)在你開(kāi)始清理這個(gè)房間,把散落各處的東西意義歸類(lèi)。那么就是低熵和高信息增益。

好,回到?jīng)Q策樹(shù)。ID3樹(shù)將始終做出讓他們獲得最高收益的決定,更多信息、更少的熵。

在決策樹(shù)中的可視化的熵

在上面的樹(shù)中,你可以看到起始點(diǎn)的熵為0.918,而停止點(diǎn)的熵為0.這棵樹(shù)以高信息增益和低熵結(jié)束,這正是我們想要的。

除了向低熵方向發(fā)展外,ID3樹(shù)還將做出讓他們獲得最高純度的決定。 因?yàn)镮D3希望每個(gè)決定都盡可能清晰,具有低熵的物質(zhì)也具有高純度,高信息增益=低熵=高純度。

其實(shí)結(jié)合到現(xiàn)實(shí)生活中,如果某些事情令人困惑和混亂(即具有高熵),那么對(duì)該事物的理解就會(huì)是模糊的,不清楚的或不純的。

CART樹(shù)和基尼指數(shù)

和ID3算法不同,CART算法的決策樹(shù)旨在最小化基尼指數(shù)。

基尼指數(shù)可以表示數(shù)據(jù)集中隨機(jī)選擇的數(shù)據(jù)點(diǎn)可能被錯(cuò)誤分類(lèi)的頻率。 我們總是希望最小化錯(cuò)誤標(biāo)記數(shù)據(jù)可能性對(duì)吧,這就是CART樹(shù)的目的。

線(xiàn)性模型下線(xiàn)性函數(shù)的可視化

隨機(jī)森林

隨機(jī)森林可以說(shuō)是初學(xué)數(shù)據(jù)科學(xué)家最受歡迎的集合模型。

集合模型顧名思義。是許多其他模型的集合。

來(lái)自KDNuggets的隨機(jī)森林結(jié)構(gòu)。

正如你在左邊的圖表中看到的3個(gè)決策樹(shù),像Random Forest這樣的集合模型只是一堆決策樹(shù)。

像隨機(jī)森林這樣的集合模型,旨在通過(guò)使用引導(dǎo)聚集算法(裝袋算法)來(lái)減少過(guò)度擬合和方差。

我們知道決策樹(shù)容易過(guò)擬合。換句話(huà)說(shuō),單個(gè)決策樹(shù)可以很好地找到特定問(wèn)題的解決方案,但如果應(yīng)用于以前從未見(jiàn)過(guò)的問(wèn)題則非常糟糕。俗話(huà)說(shuō)三個(gè)臭皮匠賽過(guò)諸葛亮,隨機(jī)森林就利用了多個(gè)決策樹(shù),來(lái)應(yīng)對(duì)多種不同場(chǎng)景。

然而在數(shù)據(jù)科學(xué)領(lǐng)域,除了過(guò)度擬合,我們還要解決另一個(gè)問(wèn)題叫做方差。具有“高方差”的模型,盡管輸入最微小的位改變,其結(jié)果也會(huì)有很大的變化,類(lèi)似于失之毫厘謬以千里,這意味著具有高方差的模型不能很好地概括為新數(shù)據(jù)。

裝袋算法

在深入研究隨機(jī)森林依賴(lài)的裝袋算法之前,仍然了解一個(gè)概念:learner。

在機(jī)器學(xué)習(xí)中,分為弱learner和強(qiáng)learner,裝袋算法主要用于處理弱learner。

弱learner

弱learner構(gòu)成了隨機(jī)森林模型的支柱,它是一種算法,可以準(zhǔn)確地對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)/分類(lèi)!

像隨機(jī)森林這樣的集合模型使用裝袋算法來(lái)避免高方差和過(guò)度擬合的缺陷,而單個(gè)決策樹(shù)等更簡(jiǎn)單的模型更容易出現(xiàn)。

當(dāng)算法通過(guò)隨機(jī)數(shù)據(jù)樣本建立決策樹(shù)時(shí),所有數(shù)據(jù)都是可以被利用起來(lái)的。

綜上所述: 隨機(jī)森林模型使用裝袋算法來(lái)構(gòu)建較少的決策樹(shù),每個(gè)決策樹(shù)與數(shù)據(jù)的隨機(jī)子集同時(shí)構(gòu)建。

隨機(jī)森林模型中的每個(gè)樹(shù)不僅包含數(shù)據(jù)的子集,每個(gè)樹(shù)也只使用數(shù)據(jù)的特征子集。

隨機(jī)森林模型的基本結(jié)構(gòu)( 隨機(jī)森林,決策樹(shù)和集合方法由Dylan Storey 解釋 )

通過(guò)這篇文章,我們學(xué)習(xí)了所有關(guān)于決策樹(shù)、過(guò)度擬合和方差以及隨機(jī)森林等集合模型。第三部分將介紹兩個(gè)線(xiàn)性模型:SVM和樸素貝葉斯。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:文科生也能看懂的機(jī)器學(xué)習(xí)教程2:決策樹(shù)和隨機(jī)森林

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    關(guān)于決策樹(shù),這些知識(shí)點(diǎn)不可錯(cuò)過(guò)

    的一種算法。它既是分類(lèi)算法,也是回歸算法,還可以用在隨機(jī)森林中。咱們學(xué)計(jì)算機(jī)的同學(xué)經(jīng)常敲if 、else if、else其實(shí)就已經(jīng)在用到決策樹(shù)的思想了。決策樹(shù)是一種簡(jiǎn)單常用的分類(lèi)器,通
    發(fā)表于 05-23 09:38

    機(jī)器學(xué)習(xí)的決策樹(shù)介紹

    機(jī)器學(xué)習(xí)——決策樹(shù)算法分析
    發(fā)表于 04-02 11:48

    ML之決策樹(shù)隨機(jī)森林

    ML--決策樹(shù)隨機(jī)森林
    發(fā)表于 07-08 12:31

    介紹支持向量機(jī)與決策樹(shù)集成等模型的應(yīng)用

    本文主要介紹支持向量機(jī)、k近鄰、樸素貝葉斯分類(lèi) 、決策樹(shù)決策樹(shù)集成等模型的應(yīng)用。講解了支持向量機(jī)SVM線(xiàn)性與非線(xiàn)性模型的適用環(huán)境,并對(duì)核函數(shù)技巧作出深入的分析,對(duì)線(xiàn)性L(fǎng)inear核函
    發(fā)表于 09-01 06:57

    決策樹(shù)的生成資料

    在本文中,我們將討論一種監(jiān)督式學(xué)習(xí)算法。最新一代意法半導(dǎo)體 MEMS 傳感器內(nèi)置一個(gè)基于決策樹(shù)分類(lèi)器的機(jī)器學(xué)習(xí)核心(MLC)。這些產(chǎn)品很容易通過(guò)后綴中的 X 來(lái)識(shí)別(例如,LSM6DSOX)。這種
    發(fā)表于 09-08 06:50

    決策樹(shù)的介紹

    關(guān)于決策樹(shù)的介紹,是一些很基礎(chǔ)的介紹,不過(guò)是英文介紹。
    發(fā)表于 09-18 14:55 ?0次下載

    解讀決策樹(shù)隨機(jī)森林模型的概念

    為什么要引入隨機(jī)森林呢。我們知道,同一批數(shù)據(jù),我們只能產(chǎn)生一顆決策樹(shù),這個(gè)變化就比較單一了,這就有了集成學(xué)習(xí)的概念。
    發(fā)表于 10-18 17:47 ?3730次閱讀
    解讀<b class='flag-5'>決策樹(shù)</b>與<b class='flag-5'>隨機(jī)</b><b class='flag-5'>森林</b><b class='flag-5'>模型</b>的概念

    決策樹(shù)的構(gòu)建設(shè)計(jì)并用Graphviz實(shí)現(xiàn)決策樹(shù)的可視化

    種涉及到的算法進(jìn)行總結(jié)并附上自己相關(guān)的實(shí)現(xiàn)代碼。所有算法代碼以及用于相應(yīng)模型的訓(xùn)練的數(shù)據(jù)都會(huì)放到GitHub上。 本文中我將一步步通過(guò)MLiA的隱形眼鏡處方數(shù)集構(gòu)建決策樹(shù)并使用Graphviz將決策樹(shù)可視化。
    發(fā)表于 11-15 13:10 ?1.5w次閱讀
    <b class='flag-5'>決策樹(shù)</b>的構(gòu)建設(shè)計(jì)并用Graphviz實(shí)現(xiàn)<b class='flag-5'>決策樹(shù)</b>的可視化

    人工智能機(jī)器學(xué)習(xí)之隨機(jī)森林(RF)

    決策樹(shù)主要用來(lái)解決分類(lèi)和回歸問(wèn)題,但是決策樹(shù)(DT)會(huì)產(chǎn)生過(guò)擬合現(xiàn)象,導(dǎo)致泛化能力變?nèi)酢_^(guò)擬合是建立決策樹(shù)模型時(shí)面臨的重要挑戰(zhàn)之一。鑒于決策樹(shù)
    發(fā)表于 05-30 06:59 ?3325次閱讀

    決策樹(shù)的原理和決策樹(shù)構(gòu)建的準(zhǔn)備工作,機(jī)器學(xué)習(xí)決策樹(shù)的原理

    希望通過(guò)所給的訓(xùn)練數(shù)據(jù)學(xué)習(xí)一個(gè)貸款申請(qǐng)的決策樹(shù),用于對(duì)未來(lái)的貸款申請(qǐng)進(jìn)行分類(lèi),即當(dāng)新的客戶(hù)提出貸款申請(qǐng)時(shí),根據(jù)申請(qǐng)人的特征利用決策樹(shù)決定是否批準(zhǔn)貸款申請(qǐng)。
    的頭像 發(fā)表于 10-08 14:26 ?6109次閱讀

    什么是決策樹(shù)模型決策樹(shù)模型的繪制方法

    決策樹(shù)是一種解決分類(lèi)問(wèn)題的算法,本文將介紹什么是決策樹(shù)模型,常見(jiàn)的用途,以及如何使用“億圖圖示”軟件繪制決策樹(shù)模型
    發(fā)表于 02-18 10:12 ?1.3w次閱讀
    什么是<b class='flag-5'>決策樹(shù)</b><b class='flag-5'>模型</b>,<b class='flag-5'>決策樹(shù)</b><b class='flag-5'>模型</b>的繪制方法

    基于遺傳優(yōu)化決策樹(shù)的建筑能耗預(yù)測(cè)模型

    基于遺傳優(yōu)化決策樹(shù)的建筑能耗預(yù)測(cè)模型
    發(fā)表于 06-27 16:19 ?6次下載

    使用TensorFlow決策森林創(chuàng)建提升樹(shù)模型

      隨機(jī)森林和梯度提升樹(shù)這類(lèi)的決策森林模型通常是處理表格數(shù)據(jù)最有效的可用工具。與神經(jīng)網(wǎng)絡(luò)相比,
    的頭像 發(fā)表于 04-19 10:46 ?1786次閱讀

    大數(shù)據(jù)—決策樹(shù)

    大數(shù)據(jù)————決策樹(shù)(decision tree) 決策樹(shù)(decision tree):是一種基本的分類(lèi)與回歸方法,主要討論分類(lèi)的決策樹(shù)。 在分類(lèi)問(wèn)題中,表示基于特征對(duì)實(shí)例進(jìn)行分類(lèi)的過(guò)程,可以
    的頭像 發(fā)表于 10-20 10:01 ?1276次閱讀

    什么是隨機(jī)森林隨機(jī)森林的工作原理

    隨機(jī)森林使用名為“bagging”的技術(shù),通過(guò)數(shù)據(jù)集和特征的隨機(jī)自助抽樣樣本并行構(gòu)建完整的決策樹(shù)。雖然決策樹(shù)基于一組固定的特征,而且經(jīng)常過(guò)擬
    發(fā)表于 03-18 14:27 ?3761次閱讀
    什么是<b class='flag-5'>隨機(jī)</b><b class='flag-5'>森林</b>?<b class='flag-5'>隨機(jī)</b><b class='flag-5'>森林</b>的工作原理
    主站蜘蛛池模板: 欧美一级免费看 | 欧美大全| 免费视频精品 | 你懂得的在线观看免费视频 | 深夜免费视频 | 欧美激情一欧美吧 | 日本黄色片在线观看 | 在线观看一区二区三区视频 | 五月婷亚洲 | 国产一区精品视频 | 亚洲欧美一区二区三区四区 | 四虎影午夜成年免费精品 | 天天操夜夜草 | 欧美一级视频精品观看 | 狠狠干网址 | 二区久久国产乱子伦免费精品 | 理论免费 | 欧美人与zoxxxx视频 | 中文字幕第五页 | 亚州国产精品精华液 | 丁香婷婷成人 | freesexvideo性大全 | 亚洲黄色激情网 | 天堂网在线看 | 久久久国产精品免费 | 亚欧一区 | 激情综合激情五月 | 亚洲五月综合网色九月色 | 国产全部理论片线观看 | 国产在线视频你懂得 | 亚洲精品电影天堂网 | 2021国产成人精品国产 | 国产午夜精品一区二区三区 | 男人的天堂一区二区视频在线观看 | 九草伊人 | 午夜影院色 | 国产69精品久久 | 一区二区三区四区免费视频 | 涩涩高清无乱码在线观看 | 天天噜噜噜 | 在线亚洲综合 |