在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何給工業(yè)大數(shù)據(jù)降維去噪,你可以試試特征選擇

格創(chuàng)東智 ? 2018-12-18 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者:格創(chuàng)東智OT團隊 (轉(zhuǎn)載請注明來源及作者)


在之前格物匯的文章中,我們介紹了特征構(gòu)建的幾種常用方法。特征構(gòu)建是一種升維操作,針對特征解釋能力不足,可以通過特征構(gòu)建的方法來增加特征解釋力,從而提升模型效果。隨著近幾年大數(shù)據(jù)技術(shù)的普及,我們可以獲取海量數(shù)據(jù),但是這些海量數(shù)據(jù)帶給我們更多信息的同時,也帶來了更多的噪音和異常數(shù)據(jù)。如何降維去噪成為很多企業(yè)關(guān)注的焦點,今天我們將介紹特征工程中的一種降維方法——特征選擇


什么是特征選擇

特征選擇( Feature Selection )也稱特征子集選擇( FeatureSubset Selection , FSS ),或屬性選擇( Attribute Selection )。是指從已有的N個特征(Feature)中選擇M個特征使得系統(tǒng)的特定指標最優(yōu)化。

圖1.jpg



特征選擇主要有兩個功能

  • 減少特征數(shù)量、降維,使模型泛化能力更強,減少過擬合

  • 增強對特征和特征值之間的理解


特征選擇的流程


特征選擇的目標是尋找一個能夠有效識別目標的最小特征子集。尋找的一般流程可用下圖表示:


一般來說,通過枚舉來對特征子集進行選擇是一個比較費時的步驟,所以應(yīng)使用一些策略來進行特征選擇,通常來說,我們會從兩個方面考慮來選擇特征:

>>>>

特征是否發(fā)散

如果一個特征不發(fā)散,例如方差接近于0,也就是說樣本在這個特征上基本上沒有差異,這個特征對于樣本的區(qū)分并沒有什么用。

>>>>

特征與目標的相關(guān)性

這點比較顯見,與目標相關(guān)性高的特征,應(yīng)當優(yōu)選選擇。除方差法外,本文介紹的其他方法均從相關(guān)性考慮。

根據(jù)特征選擇的形式又可以將特征選擇方法分為3種:

  • Filter

  • Wrapper

  • Embedded

特征選擇的方法


01

Filter


過濾法,按照發(fā)散性或者相關(guān)性對各個特征進行評分,設(shè)定閾值或者待選擇閾值的個數(shù),選擇特征。

評分指標有:

  • 方差:評價指標的離散程度,越離散說明包含的信息越多。

  • 相關(guān)性:衡量特征對目標的解釋能力,相關(guān)系數(shù)越大說明解釋能力越強。

  • 卡方檢驗:檢驗定性自變量對定性因變量的相關(guān)性。

圖3.jpg

  • 互信息:也是評價定性自變量對定性因變量的相關(guān)性的。

圖4.jpg


02

Wrapper

包裝法,根據(jù)目標函數(shù)(通常是預(yù)測效果)評分,每次選擇若干特征,或者排除若干特征,主要的方法是遞歸特征消除法。遞歸消除特征法使用一個基模型來進行多輪訓(xùn)練,每輪訓(xùn)練后,減少若干特征,或者新增若干特征,進行評估看新增的特征是否需要保留,剔除的特征是否需要還原。最后再基于新的特征集進行下一輪訓(xùn)練。

03

Embedded


嵌入法,先使用某些機器學(xué)習(xí)算法和模型進行訓(xùn)練,得到各個特征的權(quán)值系數(shù),根據(jù)系數(shù)從大到小選擇特征。類似于Filter方法,但是是通過訓(xùn)練來確定特征的優(yōu)劣。

一般分為如下兩大類:

>>>>

基于懲罰項的特征選擇法

這個方法可以用線性回歸模型來舉例說明,我們在線性模型的目標函數(shù)中增加L1正則項(實際上這就是lasso模型)。由于該正則項的存在,某些與目標y不太相關(guān)的特征的系數(shù)將縮減至0,而保留的特征系數(shù)將相應(yīng)調(diào)整,從而達到了對特征進行篩選的效果,L1正則項系數(shù)越大,篩選的力度也就越大。

>>>>

基于樹模型的特征選擇法

在我們之前的文章中介紹過隨機森林,GDBT等等基于樹的模型,他們均有一個特點就是模型可以計算出特征的重要性。決策樹會優(yōu)先將對預(yù)測目標y幫助最大的特征放在模型的頂端,因此根據(jù)這個效果我們計算得到特征的重要性,進而我們可以根據(jù)特征重要性對特征進行選擇。


今天我們大致了解了如何給工業(yè)大數(shù)據(jù)降維去噪,進行特征選擇,在后續(xù)文章中,我們將繼續(xù)帶大家了解特征工程的另一個內(nèi)容——特征抽取,敬請期待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    工業(yè)大數(shù)據(jù)管理平臺是什么?有什么功能?

    PLC跨網(wǎng)段通信網(wǎng)關(guān)是一種用于解決工業(yè)自動化領(lǐng)域中不同網(wǎng)絡(luò)段內(nèi)PLC(可編程邏輯控制器)設(shè)備通信問題的關(guān)鍵設(shè)備,其核心作用是實現(xiàn)不同網(wǎng)絡(luò)協(xié)議、IP網(wǎng)段之間的數(shù)據(jù)交互與信息傳輸,下面從多個方面詳細介紹
    的頭像 發(fā)表于 06-13 15:43 ?118次閱讀

    哈爾濱工業(yè)大學(xué)與華為舉行智慧校園創(chuàng)新成果發(fā)布會

    近日,哈爾濱工業(yè)大學(xué)(以下簡稱“哈工大”)與華為舉行智慧校園創(chuàng)新成果發(fā)布會,推出“通感一體智慧校園方案”與“校園網(wǎng)運管AI中樞方案”。這兩大創(chuàng)新成果深度融合華為CSI(Channel State
    的頭像 發(fā)表于 06-11 11:17 ?500次閱讀

    京東工業(yè)大模型Joy industrial重磅發(fā)布

    京東工業(yè)多年深耕工業(yè)數(shù)智供應(yīng)鏈領(lǐng)域形成的經(jīng)驗積累和數(shù)據(jù)沉淀,通過“工業(yè)大模型+供應(yīng)鏈場景應(yīng)用”雙引擎,構(gòu)建從底層算力、算法、數(shù)據(jù)到應(yīng)用的全棧
    的頭像 發(fā)表于 05-28 17:12 ?416次閱讀

    數(shù)據(jù)聚類工具介紹——SpatialPCA

    ,NMF)等,多是基于單細胞數(shù)據(jù)進行開發(fā)的,因此不一定完全適用于空間轉(zhuǎn)錄組數(shù)據(jù)。例如,常用的聚類方法并沒有運用空間轉(zhuǎn)錄組所特有的組織空間定位信息,而僅僅只是基于表達譜進行聚類。但是
    的頭像 發(fā)表于 02-07 11:19 ?563次閱讀
    <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>降</b><b class='flag-5'>維</b>聚類工具介紹——SpatialPCA

    使用DAC3484+TRF3705,測試發(fā)現(xiàn)調(diào)制出來的射頻150M左右底很高怎么解決?

    各位TI專家,最近使用DAC3484+TRF3705,測試發(fā)現(xiàn)調(diào)制出來的射頻150M左右底很高,目前確認是模擬IQ信號帶來的,但是無論怎么調(diào)試都不下去,目前將進行改板設(shè)計,心理沒底,畢竟成本
    發(fā)表于 12-03 07:03

    西北工業(yè)大學(xué)OpenHarmony技術(shù)俱樂部正式揭牌成立

    11月15日,由OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)項目群技術(shù)指導(dǎo)委員會與西北工業(yè)大學(xué)共同舉辦的“西北工業(yè)大學(xué)OpenHarmony技術(shù)俱樂部成立大會”在
    的頭像 發(fā)表于 11-19 18:04 ?922次閱讀
    西北<b class='flag-5'>工業(yè)大</b>學(xué)OpenHarmony技術(shù)俱樂部正式揭牌成立

    CASAIM與北京工業(yè)大學(xué)合作開展鋼桁梁鋼材三掃描試驗,研究高服役期鋼材銹蝕特征及力學(xué)性能退化規(guī)律

    近期,CASAIM與北京工業(yè)大學(xué)攜手,開展鋼桁梁鋼材三掃描試驗,此次研究結(jié)合了北京工業(yè)大學(xué)在材料科學(xué)方面的深厚積累,以及CASAIM在實際工程應(yīng)用上的豐富經(jīng)驗,共同推進鋼桁梁鋼材銹蝕機理的深入研究和力學(xué)性能退化規(guī)律的探索。
    的頭像 發(fā)表于 11-12 15:01 ?406次閱讀

    基于工業(yè)物聯(lián)網(wǎng)的電力智能運分析管理系統(tǒng)

    分析管理系統(tǒng)應(yīng)運而生,它極大地提升了電力系統(tǒng)的運效率,推動了運向智能化、自動化的方向發(fā)展。 電力智能運分析管理系統(tǒng)是利用物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等技術(shù)手段,對電力設(shè)備進行實時監(jiān)控、
    的頭像 發(fā)表于 11-08 11:01 ?649次閱讀
    基于<b class='flag-5'>工業(yè)</b>物聯(lián)網(wǎng)的電力智能運<b class='flag-5'>維</b>分析管理系統(tǒng)

    PCM1864采樣音頻數(shù)據(jù)的諧波及底可能會是由什么引入的呢?

    輸入1KHz 0dB音頻信號 600mRMSPCM1864,通過I2S連接DSP C5517。DSP通過USB傳輸給電腦。測試數(shù)據(jù)如下。模擬增益配置0dB 采樣到的信號有較大的諧波失真。如果直接
    發(fā)表于 10-15 06:17

    工業(yè)智能網(wǎng)關(guān)在設(shè)備遠程運中的作用

    地實現(xiàn)不同工業(yè)設(shè)備(如PLC、儀器儀表、CNC機床、傳感器等)與云平臺之間的通信,為設(shè)備遠程運提供了堅實的基礎(chǔ)。隨著物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等技術(shù)的飛速發(fā)展,工業(yè)智能網(wǎng)關(guān)作為連接
    的頭像 發(fā)表于 10-14 11:40 ?549次閱讀

    tlv320aic3106底過大要如何解決?

    輸入(斷開電路),依然有比較大的底,初步確定為3106本身存在底, 錄音文件見附件, 請問要怎么消除或者降低這個底
    發(fā)表于 10-12 08:23

    PCM1808模擬輸入短接到GND,I2S端底數(shù)據(jù)過大怎么解決?

    之前自己做的板子也有底問題,后面逛了論壇給出的答案也是說按照DEMO板,后面按照官方的gerber文件,自行打了DEMO板樣板。然后BOM方面也是按照官方的。測試發(fā)現(xiàn)當模擬輸入的左右聲道通過
    發(fā)表于 09-29 07:44

    工業(yè)裝備智能保平臺是什么

    應(yīng)運而生,成為保障生產(chǎn)連續(xù)性和設(shè)備高效運行的重要工具。 什么是工業(yè)裝備智能保平臺? 工業(yè)裝備智能保平臺是一種集成了大數(shù)據(jù)、云計算、人工智
    的頭像 發(fā)表于 08-21 14:19 ?503次閱讀

    小鵬汽車榮獲2024年機械工業(yè)大型重點骨干企業(yè)

    近日,由中國機械工業(yè)聯(lián)合會主辦的“2024年機械工業(yè)大型重點骨干企業(yè)發(fā)展論壇暨機械、鋼鐵產(chǎn)業(yè)鏈融通發(fā)展大會”在北京舉行,小鵬汽車榮獲“機械工業(yè)大型重點骨干企業(yè)”稱號。
    的頭像 發(fā)表于 08-05 10:26 ?768次閱讀

    圖像識別技術(shù)的原理是什么

    值化、濾波、邊緣檢測等操作。這些操作可以提高圖像的質(zhì)量,減少噪聲,突出圖像的特征,為后續(xù)的特征提取和分類器設(shè)計提供基礎(chǔ)。 1.1
    的頭像 發(fā)表于 07-16 10:46 ?2446次閱讀
    主站蜘蛛池模板: 手机看片福利 | 日本免费a级片 | 国产精品 色 | 久久久久久天天夜夜天天 | 狠狠干干干 | 欧美极品第1页专区 | 亚洲精品蜜桃久久久久久 | 在线不卡一区 | 亚洲一区二区三区首页 | 一级黄色免费毛片 | 免费91视频 | 亚洲综合欧美日本另类激情 | 日本免费观看完整视频 | 酒色激情网 | 成人在线播放av | 午夜神马嘿嘿 | 福利视频自拍偷拍 | 国产精品高清久久久久久久 | 沟沟人体一区二区 | 亚洲国产女人aaa毛片在线 | www.男人的天堂 | 国产精品大尺度尺度视频 | 欧美黄色精品 | 国产骚b | 亚洲w码欧洲s码免费 | 看全色黄大色大片免费久久怂 | 国产成人免费无庶挡视频 | 国产黄视频在线观看 | 色五月激情小说 | 国内精品久久久久久久久野战 | www.av在线.com| 日本一级成人毛片免费观看 | 天天寡妇色 | 黄色在线免费看 | 日本三级黄色录像 | 最新久久精品 | 免费国产成人午夜私人影视 | 三级四级特黄在线观看 | 婷婷sese| 天天干免费视频 | 色婷婷亚洲精品综合影院 |