在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

隨機森林的概念、工作原理及用例

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-08-05 10:00 ? 次閱讀

隨機森林是一種監督式算法,使用由眾多決策樹組成的一種集成學習方法,輸出是對問題最佳答案的共識。隨機森林可用于分類或回歸。

什么是隨機森林?

隨機森林是用于分類和回歸的一種主流集成學習方法。

集成學習方法結合了多種機器學習 (ML) 算法,以獲得更好的模型 – 應用于數據科學的群體智慧。此類學習方法基于這樣一種概念:一群對問題領域知之有限的人集思廣益,可以獲得比一個知識豐富的人更好的解決方案。

隨機森林是一組決策樹,是幾乎人人都熟悉的解決問題的比喻。決策樹通過針對數據集元素,詢問一系列回答是否的問題來得出答案。在下面的示例中,為了預測一個人的收入,決策會考慮變量(特征),例如此人是否有工作(是或否)以及此人是否有房子。在算法環境中,機器會不斷搜索特征,以允許將一組中的觀察結果按如下方式進行分割,即結果組之間盡可能不同,而每個不同子組的成員之間盡可能相似。

ae1d5a88-13f4-11ed-ba43-dac502259ad0.png

隨機森林使用名為“bagging”的技術,通過數據集和特征的隨機自助抽樣樣本并行構建完整的決策樹。雖然決策樹基于一組固定的特征,而且經常過擬合,但隨機性對森林的成功至關重要。

ae35625e-13f4-11ed-ba43-dac502259ad0.png

隨機性可確保單個樹之間的相關性較低,從而減少偏差風險。大量樹的存在也減少了過擬合問題,如果模型在訓練數據中加入過多“噪聲”并因此做出糟糕決策,這種問題就會出現。

使用隨機森林模型,隨著模型中不相關樹的數量增加,做出正確預測的可能性也會增加。結果的質量更高,因為它們反映了大多數樹做出的決策。此投票過程通過限制誤差來保護每個樹不互相傷害。即使有些樹錯誤,也會有一些樹正確,因此這組樹集體朝正確的方向前行。雖然隨機森林模型在考慮許多特征時可能會運行緩慢,但即使是使用有限數量特征的小模型也會產生非常好的結果。

隨機森林的工作原理是什么?

隨機森林中的每棵樹在稱為自助聚集 (bagging) 的過程中隨機對訓練數據子集進行抽樣。該模型適合這些較小的數據集,并匯總預測結果。通過有放回抽樣,可以重復使用同一數據的幾個實例,結果就是,這些樹不僅基于不同的數據集進行訓練,而且還使用不同的特性做出決策。

ae53b4e8-13f4-11ed-ba43-dac502259ad0.png

圖像來源:KDNuggets

用例

分類示例包括:

欺詐檢測

垃圾郵件檢測

文本情感分析

預測患者風險、敗血癥或癌癥

回歸示例包括:

預測欺詐數量

預測銷售額

為何選擇隨機森林?

隨機森林模型有五個主要優點:

非常適合回歸和分類問題。回歸中的輸出變量是一個數字序列,例如某個街區的房價。分類問題的輸出變量通常是一個單一答案,例如房屋的售價是否高于或低于要價。

可以處理缺失值并保持高準確性,即使由于 bagging 和有放回抽樣而缺失大量數據時也是如此。

算法由于輸出的是“多數規則”,使得模型幾乎不可能過擬合。

該模型可以處理包含數千個輸入變量的龐大數據集,因此成為降維的不錯工具。

其算法可用于從訓練數據集中識別非常重要的特征。

其也有一些缺點:

隨機森林優于決策樹,但其準確性低于 XGBoost 等梯度提升樹集成。

隨機森林包含大量樹,因此速度比 XGBoost 慢。

梯度提升決策樹

梯度提升決策樹 (GBDT) 是一種決策樹集成學習算法,類似于用于分類和回歸的隨機森林。隨機森林和 GBDT 都構建了由多個決策樹組成的模型。兩者的區別在于重建和組合的方式。

GBDT 使用一種稱為 boosting 的技術,以迭代方式訓練一組淺層決策樹,每次迭代都使用上一個模型的殘差擬合下一個模型。最終得到的預測結果是所有樹預測結果的加權總和。隨機森林 bagging 可大幅減少差異和過擬合,而 GBDT boosting 則可減少偏差和欠擬合。

XGBoost(極端梯度提升)是 GBDT 的領先、可擴展的分布式變體。使用 XGBoost 時,樹并行構建,而非順序構建。GBoost 遵循按層生長策略,掃描梯度值并使用這些部分和來評估訓練集中每個可分割點的分割質量。

XGBoost 因其廣泛的用例、可移植性、多樣化的語言支持以及云集成而廣受歡迎。

與 XGBoost 相比,隨機森林模型的準確性可能會因兩個不同的誤差來源(偏差和方差)而下降:

梯度提升模型通過以低學習率進行多輪提升來消除偏差和方差。

梯度提升模型超參數也有助于消除方差。

隨機森林模型使用樹深度和樹的數量消除偏差和方差。

隨機森林樹可能需要比梯度提升樹更深入。

更多數據可減少偏差和方差。

NVIDIA GPU 加速的

隨機森林、XGBOOST 和端到端數據科學

在架構方面,CPU 僅由幾個具有大緩存內存的核心組成,一次只可以處理幾個軟件線程。相比之下,GPU 由數百個核心組成,可以同時處理數千個線程。

ae784146-13f4-11ed-ba43-dac502259ad0.jpg

基于 CUDA-X AI 創建的 NVIDIA RAPIDS開源軟件庫套件使您完全能夠在 GPU 上執行端到端數據科學和分析流程。此套件依靠 NVIDIA CUDA 基元進行低級別計算優化,但通過用戶友好型 Python 接口實現了 GPU 并行化和高帶寬顯存速度。

ae947f64-13f4-11ed-ba43-dac502259ad0.png

借助 RAPIDS GPU DataFrame,數據可以通過一個類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機器學習和圖形分析算法,而無需離開 GPU。這種級別的互操作性可通過 Apache Arrow 等庫實現,并且可加速端到端流程(從數據準備到機器學習,再到深度學習)。

RAPIDS 的機器學習算法和數學基元遵循熟悉的類似于 scikit-learn 的 API。單塊 GPU 和大型數據中心部署均支持 XGBoost、隨機森林等主流工具。針對大型數據集,相較于同等功效的 CPU,這些基于 GPU 的實施方案能夠以 10 到 50 倍的速度更快地完成任務。

NVIDIA RAPIDS 團隊與 DMLC XGBoost 組織建立了緊密的合作關系,而且 GPU 加速 XGBoost 現已包括無縫嵌入式 GPU 加速,可顯著加快模型訓練速度并提高準確性。對在配備 NVIDIA P100 加速器和 32 個英特爾至強 E5-2698 CPU 核心的系統上運行的 XGBoost 腳本進行的測試表明,相較于在輸出質量相同的非 GPU 系統上運行相同的測試,速度提升了 4 倍。這一點尤為重要,因為數據科學家通常會多次運行 XGBoost,以便調整參數并找到出色的準確性。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5258

    瀏覽量

    105864
  • 算法
    +關注

    關注

    23

    文章

    4701

    瀏覽量

    94861
  • 隨機森林
    +關注

    關注

    1

    文章

    22

    瀏覽量

    4357

原文標題:NVIDIA 大講堂 | 什么是 隨機森林?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    FLASH的工作原理與應用

    14FLASHFLASH的工作原理與應用OWEIS1什么是FLASH?Flash閃存是一種非易失性半導體存儲器,它結合了ROM(只讀存儲器)和RAM(隨機訪問存儲器)的優點,具有電子可擦除和可編程
    的頭像 發表于 05-27 13:10 ?314次閱讀
    FLASH的<b class='flag-5'>工作原理</b>與應用

    DDR內存的工作原理與結構

    電子設備的內存技術。以下是對DDR內存的工作原理與結構的介紹: 一、工作原理 時鐘同步 :DDR內存是同步的,這意味著數據傳輸與系統時鐘同步。時鐘信號用于協調內存控制器和內存模塊之間的數據傳輸。 雙倍
    的頭像 發表于 11-20 14:32 ?2257次閱讀

    邏輯異或與異或門的工作原理

    邏輯異或(Exclusive OR,簡稱XOR)與異或門的工作原理是數字邏輯電路中的核心概念。以下是對邏輯異或和異或門工作原理的介紹: 一、邏輯異或的定義 邏輯異或是一種邏輯運算,其輸出取決于兩個
    的頭像 發表于 11-19 09:52 ?3676次閱讀

    靜態隨機存儲器的定義和工作原理

    靜態隨機存取存儲器(SRAM)是隨機存取存儲器(RAM)的一種,以其獨特的靜態存儲方式而著稱。所謂“靜態”,意味著只要保持通電狀態,SRAM內部存儲的數據就可以恒常保持,無需像動態隨機
    的頭像 發表于 09-26 16:25 ?5379次閱讀
    靜態<b class='flag-5'>隨機</b>存儲器的定義和<b class='flag-5'>工作原理</b>

    光電三極管的基本概念工作原理

    光電三極管,又稱為光敏三極管或光控三極管,是一種重要的光電轉換器件,能夠將光信號轉化為電流或電壓信號。這種器件在光電通信、光電測量、光電控制等領域有著廣泛的應用。下面,我們將詳細探討光電三極管的基本概念工作原理以及其在不同領域的應用。
    的頭像 發表于 09-24 11:08 ?4579次閱讀

    cmos電流反饋運放的工作原理是什么?

    這是一個cmos電流反饋型運放的原理圖 誰能詳細的解釋一下它的工作原理 具體每個mos有什么 如何實現放大的 謝謝了
    發表于 09-23 07:40

    邏輯和翻譯優化資產跟蹤器

    電子發燒友網站提供《邏輯和翻譯優化資產跟蹤器.pdf》資料免費下載
    發表于 09-21 11:24 ?0次下載
    <b class='flag-5'>用</b>邏輯和翻譯<b class='flag-5'>用</b><b class='flag-5'>例</b>優化資產跟蹤器

    可視門鈴設計優化和通用邏輯

    電子發燒友網站提供《可視門鈴設計優化和通用邏輯.pdf》資料免費下載
    發表于 08-27 09:34 ?0次下載
    可視門鈴設計優化和通用邏輯<b class='flag-5'>用</b><b class='flag-5'>例</b>

    無源傳感器的基本概念工作原理及分類

    、維護方便等優點,因此在許多領域得到了廣泛應用。 一、無源傳感器的基本概念 1.1 定義 無源傳感器是一種不需要外部能源的傳感器,它通過檢測被測量對象自身的物理或化學特性變化來實現測量。無源傳感器的工作原理是利用被測量對象的特性變化來
    的頭像 發表于 08-19 09:53 ?2912次閱讀

    功分器的基本概念工作原理及分類

    信號功率分配到多個輸出端口的器件。它通常由一個輸入端口和多個輸出端口組成,輸入信號通過功分器后,被等比例或不等比例地分配到各個輸出端口。 1.2 功分器的工作原理 功分器的工作原理基于電磁波的傳輸和分配。當輸入信號通過功分
    的頭像 發表于 08-14 09:53 ?5094次閱讀

    DRAM的內部結構和工作原理

    今天我們來聊聊在計算機領域中非常關鍵的技術——DRAM(動態隨機存取存儲器)的內部結構和工作原理
    的頭像 發表于 07-26 11:40 ?2946次閱讀
    DRAM的內部結構和<b class='flag-5'>工作原理</b>

    電流驅動型電子器件的基本概念工作原理及分類

    的基本概念 1.1 電流驅動型電子器件的定義 電流驅動型電子器件是指以電流作為輸入信號來控制電子器件的工作原理的電子元件。與電壓驅動型電子器件相比,電流驅動型電子器件具有更高的穩定性、更低的噪聲和更好的線性度等優點。
    的頭像 發表于 07-17 15:46 ?3138次閱讀

    森林火災監控是一項關系到社會安定,快速發展息息相關的重要工作

    隨著國內全國各地林木業的高速發展,森林面積也是逐年不斷增加,森林資源保護范圍也在逐步擴大,防火工作已經成為當今各地林業有關部門不可耽誤的大事。森林火災是一種突發、
    的頭像 發表于 07-12 11:16 ?411次閱讀
    <b class='flag-5'>森林</b>火災監控是一項關系到社會安定,快速發展息息相關的重要<b class='flag-5'>工作</b>

    卷積神經網絡的基本概念工作原理

    工作原理,在處理圖像數據時展現出了卓越的性能。本文將從卷積神經網絡的基本概念、結構組成、工作原理以及實際應用等多個方面進行深入解讀。
    的頭像 發表于 07-02 18:17 ?5065次閱讀

    極化繼電器的工作原理是什么

    、應用領域以及發展趨勢。 一、極化繼電器的工作原理 1.1 極化繼電器的基本概念 極化繼電器是一種具有極性識別功能的繼電器,它可以根據輸入信號的極性來控制輸出信號的狀態。極化繼電器的工作原理基于電磁感應原理,通過檢測輸入信
    的頭像 發表于 06-24 09:33 ?1786次閱讀
    主站蜘蛛池模板: 97人人插| 一级骚片超级骚在线观看 | 日韩毛片 | 一区二区中文字幕在线观看 | 国产黄视频在线观看 | 国产视频久 | 俺来也婷婷 | 最近高清在线视频观看免费 | 欧美黄视频在线观看 | 天天色图片| bt天堂电影 | 日韩一级高清 | 黄网站在线观看永久免费 | 视频高清正版在线观看 | 欧美视频一区在线观看 | 久久久免费网站 | 免费国产综合视频在线看 | 手机看片精品国产福利盒子 | 亚洲成a人片77777潘金莲 | 亚洲综合激情另类专区 | 欧美污视频网站 | 婷婷五月色综合香五月 | 亚洲444kkk | 奇米欧美 | 欧美色视频日本片高清在线观看 | 久久综合九色欧美综合狠狠 | 一区在线播放 | 欧美啪啪小视频 | 97影院理伦在线观看 | 四虎www成人影院免费观看 | 性精品 | 美女张开腿让男人桶爽 | 亚洲综合久久综合激情久久 | 色天使色护士 在线视频观看 | 五月月色开心婷婷久久合 | 免费一级欧美片在线观免看 | 天天综合色网 | www.九色视频| 日本三级黄视频 | 成人黄色在线 | 成人伊人青草久久综合网 |