91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用SHAP實現機器學習模型的輸出預測

汽車玩家 ? 來源:人工智能遇見磐創 ? 作者:人工智能遇見磐創 ? 2020-05-04 18:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

解釋產生特定NBA球員預測薪水的特征(github)

利用SHAP實現機器學習模型的輸出預測

我最喜歡的庫之一是SHAP,它是解釋機器學習模型生成的輸出不可或缺的工具。 SHAP是幾種不同的當前解釋模型的頂點,并且通過為每個特征分配重要性值來表示用于解釋模型預測的統一框架。反過來,可以繪制這些重要性值,并用于產生任何人都可以輕易解釋的漂亮可視化。在您閱讀時,您會注意到主題是可解釋性,以及為什么它在機器學習中如此迫切。

在本文中,我提供了一個外行人對其作者Scott Lundberg和Su-In Lee的原始論文的評論

目的

線性模型易于解釋。 考慮用于預測NBA球員薪水的經典線性回歸模型(假設薪水完全基于每場比賽得分):

利用SHAP實現機器學習模型的輸出預測

我們簡單地將其解釋為β1,即X對Y單位增加的平均影響。換句話說,如果凱文杜蘭特得到27.5分,那么我們所要做的就是乘以β1來預測他的薪水。 使用線性模型,很明顯模型如何達到預測。

但是神經網絡呢,那里有重復的矩陣乘法和激活函數? 我們如何在輸出的上下文中解釋這一點?

利用SHAP實現機器學習模型的輸出預測

隨著我們轉向更復雜的模型,具有更高的準確性,我們發現越來越難以解釋這些模型如何產生預測。 由于以下幾個原因,這是一個岌岌可危的困境:

·模型偏差是一個重要問題,因為它們最終可能會對決策產生不公平的影響。 一些數據存在內在偏差,特別是在涉及種族和性別偏見時,這會對模型的預測產生負面影響。 由于沒有好的方法來解釋模型如何做出決定,因此很難確定這些固有的偏見。

·模型改進也很困難如果您不知道要改進什么。當然,您可以調整超參數,直到獲得最佳分數,但您擁有的數據類型更為重要。了解模型中不同特征的價值可為數據收集提供有價值的反饋,告知我們哪些類型的數據最重要.

·用戶信任對于采用人工智能系統非常重要。 在人工智能治理中心最近的一份報告中,作者報告說:"有更多的美國人認為高級機器智能會比那些認為對人類有益的人有害。"復雜模型的可解釋性有助于 更好的理解,建立模型如何做出決策的直覺,并最終產生用戶信任。

添加功能歸因方法

為了解釋更復雜的模型,我們需要一個更接近原始模型的簡單解釋模型。

假設我們有一個形式為f(x)的復雜模型,那么解釋模型g(z')≈f(x)。

利用SHAP實現機器學習模型的輸出預測

稍微分解g(z'),我們將一些效應φ?歸因于每個特征z'。 通過總結所有這些效果及其特征,我們可以近似原始模型的輸出。 這被定義為附加特征歸屬方法。 事實證明,其他當前的解釋模型遵循相同的解釋模型,允許它們全部統一到一個單一的框架中。

附加特征歸屬方法的屬性

1.局部精度:最重要的屬性之一是解釋模型能夠匹配原始模型的輸出。

2.缺失:如果缺少特征,則該特征沒有效果,或φ?= 0。

3.一致性:如果模型發生變化,使得特征貢獻增加或保持不變,那么特征屬性或φ?不應減少。

這導致我們SHAP值,它統一了以前的方法,并展示了上述屬性。

SHAP值

SHAP值(φ?)用于描述特征的重要性。 請考慮以下圖表:

利用SHAP實現機器學習模型的輸出預測

f(x)是模型預測的輸出,E[f(z)]是如果沒有特征則預測的基值。 換句話說,E[f(z)]只是平均模型輸出。

當我們包括一個特征x 1,然后φ1,解釋我們如何從基值到新的預測值,現在由E [f(z)|給出。 z 1 = x 1]。 對剩余的變量x 1,x 2,x 3重復這個過程,估計φ1,φ2和φ3的SHAP值,顯示模型最終如何到達預測輸出f(x)。

不同口味的SHAP(different favours of SHAP)

SHAP有多種實現方式,每種方式都適用于特定的模型類型,可以實現更快的逼近。

·TreeExplainer

TreeExplainer專為樹集合方法開發,如XGBoost,LightGBM或CatBoost。

·DeepExplainer

DeepExplainer是為深度學習模型開發的,支持TensorFlow / Keras。

·GradientExplainer

GradientExplainer也是為深度學習模型中的SHAP值而開發的,但速度比DeepExplainer慢,并且做出了不同的假設。 此方法基于Integrated Gradient歸因方法,并支持TensorFlow / Keras / PyTorch。

·KernelExplainer

KernelExplainer使用加權線性回歸近似任何類型模型的SHAP值。

使用特定于模型類型的算法(TreeExplainer,DeepExplainer)而不是通用KernelExplainer更快更有效。

總結

作者發現人類解釋和SHAP解釋之間的關聯比任何其他方法更強,這表明了SHAP的強大和直觀性。 計算出的SHAP值很容易在美觀,簡單的圖中顯示,這些圖解釋了特征如何影響特定預測。 這使得SHAP成為一個令人信服的工具,可以自信地解釋和解釋任何模型。

有關如何實現SHAP的教程,請查看我的筆記本,看看我們如何解釋漸變提升樹的預測結果。 SHAP github還提供了很多資源,可以提供有關如何實現DeepExplainer,KernelExplainer和其他有用功能的更多示例。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4709

    瀏覽量

    95336
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134570
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模型在半導體行業的應用可行性分析

    的應用,比如使用機器學習分析數據,提升良率。 這一些大模型是否真的有幫助 能夠在解決工程師的知識斷層問題 本人純小白,不知道如何涉足這方面 應該問什么大模型比較好,或者是看什么視頻能夠
    發表于 06-24 15:10

    邊緣計算中的機器學習:基于 Linux 系統的實時推理模型部署與工業集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學習模型(神經網絡)部署到邊緣設備上,利用從ModbusTCP寄存器獲取的實時數據來
    的頭像 發表于 06-11 17:22 ?334次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>:基于 Linux 系統的實時推理<b class='flag-5'>模型</b>部署與工業集成!

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編將探討機器學習
    的頭像 發表于 02-13 09:39 ?358次閱讀

    【ELF 2學習板試用】利用RKNN-Toolkit2實現rknn模型轉換

    為rknn模型,然后在板端利用RKNN-Toolkit2-Lite2運行rknn模型實現GPU加速。而rknn模型的轉換則需要用的瑞芯微官
    發表于 02-09 17:57

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    中取得了令人矚目的效果。 閱讀感悟 從傳統的手動編程到借助大模型實現智能化、自主化,從單一模態的交互到多模態信息的深度融合,再到擴散模型的應用,機器人控制技術正在以驚人的速度進化。這不
    發表于 12-29 23:04

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    醫療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用模型優化手術路徑規劃。工業場景中,協作機器人面臨的主要挑戰是快速適應新工藝流程。具身智
    發表于 12-24 15:03

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發表于 10-23 15:25 ?2876次閱讀

    AI大模型與傳統機器學習的區別

    AI大模型與傳統機器學習在多個方面存在顯著的區別。以下是對這些區別的介紹: 一、模型規模與復雜度 AI大模型 :通常包含數十億甚至數萬億的參
    的頭像 發表于 10-23 15:01 ?2561次閱讀

    構建語音控制機器人 - 線性模型機器學習

    輪子并識別音頻信號,但它仍然無法通過語音命令控制或按預定義路徑行駛。 線性控制模型 首先要解決的問題是實現直線驅動。為此,我們使用線性模型來控制提供給車輪的電壓。使用線性模型適合對汽車
    的頭像 發表于 10-02 16:31 ?567次閱讀
    構建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    。 可以探索現象發展變化的規律,對某些社會經濟現象進行預測利用時間序列可以在不同地區或國家之間進行對比分析,這也是統計分析的重要方法之一。 而《時間序列與機器學習》一書的后幾章分別
    發表于 08-11 17:55

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    數據中提取特征并將其轉化為交易策略,以及機器學習在其他金融領域(包括資產定價、資產配置、波動率預測)的應用。 全書彩版印刷,內容結構嚴整,條理清晰,循序漸進,由淺入深,是很好的時間序列學習
    發表于 08-07 23:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    今天來學習大語言模型在自然語言理解方面的原理以及問答回復實現。 主要是基于深度學習和自然語言處理技術。 大語言模型涉及以下幾個過程: 數據收
    發表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    今天開始學習《大語言模型應用指南》第一篇——基礎篇,對于人工智能相關專業技術人員應該可以輕松加愉快的完成此篇閱讀,但對于我還是有許多的知識點、專業術語比較陌生,需要網上搜索學習更多的資料才能理解書中
    發表于 07-25 14:33
    主站蜘蛛池模板: 美女被视频网站在线看九色 | 久久综合成人网 | 亚洲成在人线中文字幕 | 又黑又长黑人欧美三级 | 鲁久久 | 六月婷婷激情综合 | 日本一本视频 | 天天爽夜夜爽精品视频一 | 午夜在线视频观看版 | 一个综合色 | 亚洲九色 | 日韩高清毛片 | 久久青草18免费观看网站 | 免费我看视频在线观看 | 天天干视频在线观看 | 伊人色综合久久天天爱 | 青青热久免费精品视频在线观看 | 女人张开腿让男人桶视频免费大全 | 国产福利2021最新在线观看 | 亚洲 欧美 日韩 在线 中文字幕 | 最近国语视频免费观看在线播放 | 国产精品爱啪在线线免费观看 | 色六月丁香 | 精品一级毛片 | 天天成人 | 午夜高清免费在线观看 | 看片在线观看免费 | 天堂bt种子资源地址在线 | 伊人网视频在线 | dyav午夜片| 免费抓胸吻胸激烈视频网站 | 天天操中文字幕 | 一区二区三区视频在线观看 | 天天爽夜夜爽夜夜爽 | 天天草视频 | 在线三级网 | 奇米影视一区 | 欧美成人3d动漫在线播放网站 | 日韩毛片免费线上观看 | 欧美人与z0zoxxxx | 中文字幕导航 |