在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

詳談機器學習的決策樹模型

如意 ? 來源:逍遙埠 ? 作者:逍遙埠 ? 2020-07-06 09:49 ? 次閱讀

決策樹模型是白盒模型的一種,其預測結果可以由人來解釋。我們把機器學習模型的這一特性稱為可解釋性,但并不是所有的機器學習模型都具有可解釋性。

作為可解釋性屬性的一部分,特征重要性是一個衡量每個輸入特征對模型預測結果貢獻的指標,即某個特征上的微小變化如何改變預測結果。

直覺

不同于基尼不純度或熵,沒有一個通用的數學公式來定義特征的重要性,而特征的重要性在不同的模型中是不同的。

例如,對于線性回歸模型,假設所有輸入特征具有相同的尺度(如[0,1],那么每個特征的特征重要性就是與該特征相關的權值的絕對值。從這個公式可以看出線性回歸模型的f (X) =∑i = 1 n (wixi),模型的結果是線性正比于每個組件(wixi)這是由重量決定的(wi)的組件。

對于決策樹,為了度量特征的重要性,我們需要研究模型,看看每個特征是如何在模型的最終“決策”中發揮作用的。從前面的文章中我們了解到,在決策樹模型中,在每個決策節點上,我們選擇最佳的特征進行分割,以便進一步區分到達該決策節點的樣本。在每一次分割中,我們都更接近最終的決定(即葉節點)。因此,我們可以說,在每個決策節點上,所選擇的分割特征決定了最終的預測結果。直觀地說,我們也可以說,那些被選擇的特征比那些實際上在決策過程中沒有作用的非被選擇的特征更重要。現在,剩下的問題是我們如何量化地衡量這種重要性。

有人可能還記得,我們使用信息增益或基尼系數來衡量分割的質量。當然,還可以將增益與所選擇的特性關聯起來,并使用增益來量化該特性在這個特定的分裂發生時的貢獻。此外,我們可以累積決策樹中出現的每個特征的增益。

最后,每個特征的累積增益可以作為決策樹模型的特征重要性。

另一方面,作為一個可能會注意到,這一決定節點不是同樣重要的是,自從決定節點樹的根可以幫助過濾所有的輸入樣本,而決定節點樹的底部有助于區分總樣本的只有少數。因此,一個特征在每個決策節點獲得的增益的權重并不相同,即一個特征在一個決策節點獲得的增益應按該決策節點幫助區分的樣本比例進行加權。

基于上述直覺,我們可以推導出以下公式來計算決策樹中每個特征的重要性I:

詳談機器學習的決策樹模型

注:我們可以用上述公式中的信息增益來代替基尼系數增益度量,只要我們對所有特征都使用相同的度量。

通過上面的公式,我們可以得到一個值來衡量決策樹中每個特征的重要性。有時,可能需要對值進行規范化,以便更直觀地比較這些值,即將所有值縮放到(0,1)的范圍內。例如,如果有兩個特征經過歸一化后得分相同(即0.5),我們可以說它們在決策樹中同等重要。

舉個例子

讓我們看一個具體的例子,看看我們如何應用上面的公式來計算決策樹中的特征重要性。首先,我們在下圖中展示了一個實例決策樹。

詳談機器學習的決策樹模型

從圖中可以看出,該樹中共有3個決策節點。在每個決策節點中,我們指出了三條信息:

1、選擇要分割的特性。

2、特征獲得的基尼系數

3、分別分配給左子節點和右子節點的樣本數量。

此外,我們可以看出決策樹總共訓練了100個樣本。

因此,我們可以計算出樹中涉及的兩個特征的特征重要性如下:

詳談機器學習的決策樹模型

進一步,我們可以得到歸一化特征重要性如下:

詳談機器學習的決策樹模型

后記:路漫漫其修遠兮,吾將上下而求索!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8478

    瀏覽量

    133803
  • 決策樹
    +關注

    關注

    3

    文章

    96

    瀏覽量

    13728
  • 白盒測試
    +關注

    關注

    1

    文章

    15

    瀏覽量

    10711
收藏 人收藏

    評論

    相關推薦

    十大鮮為人知卻功能強大的機器學習模型

    本文轉自:QuantML當我們談論機器學習時,線性回歸、決策樹和神經網絡這些常見的算法往往占據了主導地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強大的算法,它們能夠
    的頭像 發表于 04-02 14:10 ?303次閱讀
    十大鮮為人知卻功能強大的<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編將探討機器學習
    的頭像 發表于 02-13 09:39 ?224次閱讀

    Kaggle知識點:7種超參數搜索方法

    問題。一些常見的超參數例子包括梯度基算法中的學習率,或者決策樹算法中的深度,這些可以直接影響模型準確擬合訓練數據的能力。超參數調優涉及在復雜的、高維的超參數空間中
    的頭像 發表于 02-08 14:28 ?690次閱讀
    Kaggle知識點:7種超參數搜索方法

    科技在物聯網方面

    。 人工智能算法優化:宇科技不斷優化其機器人的人工智能算法,使其能夠在物聯網環境中更好地進行智能決策。通過機器學習、深度
    發表于 02-04 06:48

    xgboost超參數調優技巧 xgboost在圖像分類中的應用

    一、XGBoost超參數調優技巧 XGBoost(eXtreme Gradient Boosting)是一種基于梯度提升決策樹(GBDT)的高效梯度提升框架,在機器學習競賽和實際業務應用中取得了卓越
    的頭像 發表于 01-31 15:16 ?643次閱讀

    xgboost與LightGBM的優勢對比

    Gradient Boosting) 是一種基于梯度提升決策樹(GBDT)的優化分布式梯度提升庫,由陳天奇等人于2014年提出。它通過優化目標函數的負梯度來構建樹模型,并支持并行和GPU加速。 LightGBM
    的頭像 發表于 01-19 11:18 ?709次閱讀

    xgboost的并行計算原理

    之一。 XGBoost簡介 XGBoost是一種基于梯度提升框架的集成學習算法,它通過構建多個決策樹來提高模型的預測性能。與傳統的梯度提升相比,XGBoost在算法上進行了優化,包括
    的頭像 發表于 01-19 11:17 ?731次閱讀

    xgboost在圖像分類中的應用

    XGBoost(eXtreme Gradient Boosting)是一種高效的機器學習算法,它基于梯度提升框架,通過構建多個弱學習器(通常是決策樹)來提高
    的頭像 發表于 01-19 11:16 ?675次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能
    的頭像 發表于 11-16 01:07 ?716次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發表于 10-23 15:25 ?2385次閱讀

    AI大模型與傳統機器學習的區別

    AI大模型與傳統機器學習在多個方面存在顯著的區別。以下是對這些區別的介紹: 一、模型規模與復雜度 AI大模型 :通常包含數十億甚至數萬億的參
    的頭像 發表于 10-23 15:01 ?2161次閱讀

    Al大模型機器

    豐富的知識儲備。它們可以涵蓋各種領域的知識,并能夠回答相關問題。靈活性與通用性: AI大模型機器人具有很強的靈活性和通用性,能夠處理各種類型的任務和問題。持續學習和改進: 這些模型可以
    發表于 07-05 08:52

    人工神經網絡與傳統機器學習模型的區別

    人工神經網絡(ANN)與傳統機器學習模型之間的不同,包括其原理、數據處理能力、學習方法、適用場景及未來發展趨勢等方面,以期為讀者提供一個全面的視角。
    的頭像 發表于 07-04 14:08 ?2195次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?1956次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    設備的運行狀況,生成各種維度的報告。 同時,通過大數據分析和機器學習技術,可以對業務進行預測和預警,從而協助社會和企業進行科學決策、降低成本并創造新的價值。 當今時代,數據無處不在,而時間序列數據更是
    發表于 06-25 15:00
    主站蜘蛛池模板: 天天综合色天天综合色sb | 婷婷综合激情网 | 天堂ww | 户外露出 自拍系列 | 午夜精品网站 | 极品美女写真菠萝蜜视频 | 午夜国产精品久久久久 | 国产精品一级毛片不收费 | 性欧美大战久久久久久久久 | 亚洲午夜免费视频 | 性喷潮久久久久久久久 | 手机看片日韩高清1024 | 日本一区二区免费看 | 色综合天天综合网国产成人网 | 久久xxx | www在线播放 | 黄色免费看网站 | 日本高清午夜色wwwσ | 欧美日a | 久操青青| 亚洲欧美日韩另类精品一区二区三区 | 久久15 | 欧美一区二区三区性 | 久久精品亚洲 | 亚洲综合丁香婷婷六月香 | 91在线色| 人人爽人人澡 | 国产主播精品在线 | 色吧首页 | 伊人丁香婷婷综合一区二区 | 深爱开心激情 | 91tm视频| 免费a网 | 日韩1| 久久精品人人做人人看 | 丁香婷婷开心激情深爱五月 | 成人a视频 | 国内真实下药迷j在线观看 国内自拍 亚洲系列 欧美系列 | 五月婷婷婷婷 | 天堂成人在线观看 | 国产精品你懂的在线播放 |