在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習特征選擇的三種方法

倩倩 ? 來源:云溪初閣 ? 2020-04-15 15:56 ? 次閱讀

特征選擇,這是一個在機器學習中非常重要的東西,那些好的特征可以從整體上來提升模型的性能,可以幫助我們更加清晰的理解真個數據的特點及底層結構,對于后面的模型,算法有著非常重要的作用。

備注:在很多情況下,特征選擇并非必要的,業務特征的選擇有很強烈的業務契合度在里面,代表著這些特征在業務中的重要性也是很高,如果去掉,很有可能會有一定的副作用,但是無法說清這個副作用,這個需要進入到訓練中去訓練數據來驗證這個效果。

特征選擇作用

這里有些同學可能是剛開始接觸做特征選擇,并不是很了解為什么要做特征選擇,做了有什么作用?是否只是簡單地減少特征?是否這樣子做了,對結果有沒有影響?

這里每個人都有自己的理解,小編根據自己的經驗,總結有兩個,參考一下:

1、減少特征的數量,降低維度,這樣子可以在一定程度上加強模型的泛化能力,從而盡可能地減少過擬合,這里要注意一下:過擬合只能減少,無法消滅,好比這個世上,其實沒有最優解的一樣,擁有的只有不滿足。

2、在一定程度上降低特征后,從直觀上來看,很多時候可以一目了然看到特征與特征值之間的關聯,這個場景,需要實際業務的支撐,生產上的業務數據更加明顯,有興趣的同學可以私信我加群,一起研究。

特征選擇從何入手

這是一個非常重要的問題,有很多同學可能剛開始接觸或者想往這方面發展,拿到了一組數組,很多時候就是直接拿了一個算法,直接做分類或者做回歸或者做聚類,但是這樣子正常情況下,數據會存在很多噪音(科普:噪音可以理解為一些垃圾數據,對我們的結果或者期望造成了干擾),這樣子的數據不會很好。

那如果我要特征選擇呢,又不知從何入手?

這里有兩個方法,可以作為參考:

1、從業務范圍分析,直接觀察特征與業務的相關性,這點非常重要,那些對業務有著直接指標的數據,建議保留,否則,可以考慮手動刪除掉。

2、從發散特性分析,這個很多同學畢業后,就忘了這個東西,簡單用成語一個成語來理解一下:一成不變。如果這個特征滿足這種條件,那證明不發散,其實在數學中,用方差來計算的,這種不發散的特征,基本就沒有什么差異性了,例如某一項特征都是0,怎么有影響呢,這樣子的特征其實就沒什么用。

特征選擇的三種方法

進行特征選擇的時候,其實有一定的方法或者規律可言,總結起來有三個

1、過濾法:目前這是小編用的最普遍的方法,因為最簡單,與業務契合度最高,操作過程就是我可以設定某一個閾值,然后根據數據的發散情況或者與業務是否相關來打分,一般都是當低于這個閾值的時候,就可以考慮過濾掉。

2、嵌入法:這個方法無法直接從字面來理解,但是其實也是很好的東西,小編把它叫做過濾法的進化版。如何理解這個進化版,原先我們采用過濾法的時候,很多時候是人肉直接擼一擼,但是這時候特征多呢,給你200個特征,然后我就可能瞎了或者手廢掉了,此時的做法是此案用機器學習的算法或者模型來訓練,然后可以得到各個特征的權重值,做個排序,干掉那些排序地的,例如樹的特征選擇,這些算法,后面會逐一介紹。

3、包裝法:聽這個名字,是不是也是很迷糊,其實這個也比較好理解,不斷循環訓練模型,進行目標函數的計算,一般我們是采用預測的效果來評分,逐一選擇一定量的特征來做,不斷循環,得到結果進行對比,這樣就可以看到哪些特征不好。不過這個小編比較少用,計算上比較費時費力,后面的具體算法也會介紹到。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4702

    瀏覽量

    94976
  • 機器學習
    +關注

    關注

    66

    文章

    8497

    瀏覽量

    134243
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    精選好文!噪聲系數測量的三種方法

    器件噪聲系數的三種方法。每種方法都有其優缺點,適用于特定的應用。下表是三種方法優缺點的總結。理論上,同一個射頻器件的測量結果應該一樣,但是由于射頻設備的限制(可用性、精度、頻率范圍、噪聲基底等),必須
    發表于 05-07 10:18

    雙極型極管放大電路的三種基本組態的學習課件免費下載

      本文檔的主要內容詳細介紹的是雙極型極管放大電路的三種基本組態的學習課件免費下載包括了:共集電極放大電路,共基極放大電路,三種基本組態的比較   輸入信號ui
    發表于 04-11 16:39 ?26次下載

    redis三種集群方案詳解

    在Redis中提供的集群方案總共有三種(一般一個redis節點不超過10G內存)。
    的頭像 發表于 03-31 10:46 ?619次閱讀
    redis<b class='flag-5'>三種</b>集群方案詳解

    FPGA頻率測量的三種方法

    1、FPGA頻率測量? 頻率測量在電子設計和測量領域中經常用到,因此對頻率測量方法的研究在實際工程應用中具有重要意義。 通常的頻率測量方法三種:直接測量法,間接測量法,等精度測量法。 2、直接
    的頭像 發表于 01-09 09:37 ?691次閱讀
    FPGA頻率測量的<b class='flag-5'>三種方法</b>

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師
    的頭像 發表于 12-30 09:16 ?1096次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?413次閱讀

    ADS8688,ADS8688A,ADS8688AT三種型號有什么區別?如何選擇

    問一下官方,ADS8688有三種型號,ADS8688,ADS8688A,ADS8688AT,好像還不是同一個手冊上的型號,請問這三種型號有什么區別?如何選擇?如果芯片有區別,萬一買錯了怎么辦?
    發表于 12-12 07:51

    三種常見平方根算法的電路設計及Verilog實現與仿真

    、圖形顯示等領域具有重要的地位,所以如何在硬件上實現該運算可以提高計算單元的性能,加快計算速度。 本文實現的算法包括二分迭代法、牛頓迭代法、逐次逼近法,前兩種方法來源于數值計算方法,第三種方法類似于逐次漸進型A
    的頭像 發表于 11-26 10:12 ?1288次閱讀
    <b class='flag-5'>三種</b>常見平方根算法的電路設計及Verilog實現與仿真

    相異步電動機三種調速方法

    。為了滿足不同的應用需求,人們開發了多種調速方法。 1. 變極調速 變極調速是通過改變電動機的極數來實現調速的一種方法。這種方法適用于恒轉矩負載,如鼓風機、水泵等。 原理 相異步電動
    的頭像 發表于 10-12 15:30 ?5007次閱讀

    光纖測試方法有哪三種

    光纖測試是確保光纖通信系統性能和可靠性的重要環節。光纖測試方法多樣,主要包括插入損耗測試、回波損耗測試和光纖端面檢查。以下是對這三種測試方法的介紹: 1. 插入損耗測試 插入損耗測試是測量光纖鏈路中
    的頭像 發表于 09-24 09:31 ?2453次閱讀

    單片機的三種總線結構

    、控制信號傳遞和地址選擇中發揮著至關重要的作用。下面將詳細闡述這三種總線結構的特點及其在單片機系統中的應用。
    的頭像 發表于 09-10 11:32 ?6872次閱讀

    MCUXpresso IDE下在線聯合調試雙核MCU工程的三種方法

    大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是MCUXpresso IDE下在線聯合調試i.MXRT1170雙核工程的三種方法
    的頭像 發表于 08-08 15:18 ?1276次閱讀
    MCUXpresso IDE下在線聯合調試雙核MCU工程的<b class='flag-5'>三種方法</b>

    數字示波器的測量方法有哪三種

    數字示波器是一廣泛應用于電子測量領域的儀器,它能夠實時顯示電壓波形,幫助工程師和技術人員對電子信號進行分析和測量。數字示波器的測量方法有很多種,不同的測量方法適用于不同的應用場景。以下是三種
    的頭像 發表于 07-17 18:02 ?3052次閱讀

    機器學習中的數據預處理與特征工程

    機器學習的整個流程中,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這
    的頭像 發表于 07-09 15:57 ?1303次閱讀

    人臉檢測的五種方法各有什么特征和優缺點

    人臉檢測是計算機視覺領域的一個重要研究方向,主要用于識別和定位圖像中的人臉。以下是五常見的人臉檢測方法及其特征和優缺點的介紹: 基于膚色的方法
    的頭像 發表于 07-03 14:47 ?1501次閱讀
    主站蜘蛛池模板: 亚州怡红院 | 性欧美黑人xxxx | 2021天天操 | 最新中文字幕在线资源 | 嘿嘿午夜 | 五月婷婷亚洲综合 | 人人澡人人澡人人看青草 | 天天射日日操 | 视频精品一区二区三区 | 色综合色综合色综合色综合 | 欧美色惰aⅴ | yy肉戏多纯黄的小说 | 91久久福利国产成人精品 | ts人妖在线 | 四虎www成人影院免费观看 | 欧美成人性动漫在线观看 | xxxx日本在线播放免费不卡 | 激情五月婷婷网 | 亚洲无线码一区在线观看 | 国产精品色婷婷在线观看 | 国产精品久久久久久久9999 | 黄色网页在线播放 | 68日本xxxxxxxxx xx | 嘿嘿嘿视频在线观看网站 | 亚洲人成伊人成综合网久久 | 国产xxxx极品bbw视色 | 日韩欧美国产电影 | 黄色片香蕉视频 | 又粗又硬又爽又黄毛片 | 免费网站日本永久免费观看 | 99久久成人国产精品免费 | 男女爱爱爽爽福利免费视频 | 国产婷婷色一区二区三区深爱网 | 久久久久久国产精品mv | 国产色视频一区 | 亚洲娇小性色xxxx | 亚洲香蕉网久久综合影院3p | 免费一看一级毛片 | 天堂bt在线网bt| 天天综合网在线 | 国产精品女人在线观看 |