在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

快速掌握特征構建的常用方法

格創(chuàng)東智 ? 2018-12-12 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在之前格物匯的文章中,我們介紹了工業(yè)數據預處理的方法以及特征工程的基本知識,今天要帶大家來了解如何做特征構建。


特征構建常用方法


特征構建的常用方法是屬性分割和結合,這一般根據我們具體的問題所決定。我們通過具體的應用場景來看看:


時間列處理

時間戳屬性通常需要分離成多個維度比如年、月、日、小時、分鐘、秒鐘。通常時間序列數據會含有一定的趨勢和周期性,這時需要我們去構建趨勢因子和周期因子


分解類別屬性

一些屬性是類別型而不是數值型,舉一個簡單的例子,由{紅,綠、藍}組成的顏色屬性,最常用的方式是把每個類別屬性轉換成二元屬性,即從{0,1}取一個值。因此基本上增加的屬性等于相應數目的類別,并且對于你數據集中的每個實例,只有一個是1(其他的為0),這也就是獨熱(one-hot)編碼方式。我們在前面的文章中介紹過了,在此不再贅述。


分箱和分區(qū)

有時候,將數值型屬性轉換成類別呈現更有意義,同時能使算法減少噪聲的干擾,通過將一定范圍內的數值劃分成確定的塊。舉個例子,我們預測一個人是否擁有某款衣服,這里年齡是一個確切的因子。其實年齡組是更為相關的因子,所以我們可以將年齡分布劃分成1-10,11-18,19-25,26-40等年齡段,分別表示 幼兒,青少年,青年,中年四個年齡組,讓相近的年齡組表現出相似的屬性。此外,我們還可以對分箱,分區(qū)做一些統計量字段作為數據的特征。


只有在了解屬性的領域知識的基礎,確定屬性能夠劃分成簡潔的范圍時分區(qū)才有意義。即所有的數值落入一個分區(qū)時能夠呈現出共同的特征。在實際應用中,當你不想讓你的模型總是嘗試區(qū)分值之間是否太近時,分區(qū)能夠避免出現過擬合。例如,如果你所感興趣的是將一個城市作為整體,這時你可以將所有落入該城市的維度值進行整合成一個整體。分箱也能減小小錯誤的影響,通過將一個給定值劃入到最近的塊中。如果劃分范圍的數量和所有可能值相近,或對你來說準確率很重要的話,此時分箱就不適合了。

交叉特征

交叉特征是特征工程中重要的方法之一,交叉特征是一種很獨特的方式,它將兩個或更多的類別屬性組合成一個。當組合的特征要比單個特征更好時,這是一項非常有用的技術。數學上來說,是對類別特征的所有可能值進行交叉相乘。當然我們不僅僅會去查找交叉項關系,還可以去尋找更加復雜的二次項,三次項乃至更復雜的關系,這根據問題求解的需要決定。


經度與緯度的組合便是交叉特征的應用實例,一個相同的經度對應了地圖上很多的地方,緯度也是一樣。但是一旦你將經度和緯度組合到一起,它們就代表了地理上特定的一塊區(qū)域,區(qū)域中每一部分是擁有著類似的特性。

小結

一般我們會收集與問題相關的數據作為我們的特征,但是這些特征有時不足以解釋我們的問題,我們還是會通過特征構建來增加解釋能力。這其實是對數據進行升維操作,總的來說,特征構建可以給我們的模型提供一些關鍵的信息,來解決模型解釋能力不足的情況。但如果我們收集的數據包含了過多的特征,如何對這些特征進行提純呢?請繼續(xù)關注格物匯,我們將在之后的文章中詳細講解。


本文作者:格創(chuàng)東智 OT團隊 (轉載請注明來源及作者)


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 智能制造
    +關注

    關注

    48

    文章

    5881

    瀏覽量

    77775
  • 工業(yè)互聯網

    關注

    28

    文章

    4362

    瀏覽量

    95021
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PLC梯形圖編程方法(PPT版)

    梯形圖經驗設計法 經驗設計方法也叫試湊法,經驗設計方法需要設計者掌握大量的典型電路,在掌握這些典型電路的基礎上,充分理解實際的控制問題,將實際控制問題分解成典型控制電路,然后用典型電路
    發(fā)表于 05-30 16:46

    瑞芯微RK平臺開發(fā)必備的20個常用命令,幫您效率翻倍

    本文將系統地梳理飛凌嵌入式RK平臺主控產品在開發(fā)過程中常用的命令,助力更多開發(fā)者快速掌握RK系列芯片的開發(fā)方法
    的頭像 發(fā)表于 04-16 15:36 ?780次閱讀
    瑞芯微RK平臺開發(fā)必備的20個<b class='flag-5'>常用</b>命令,幫您效率翻倍

    一種基于點、線和消失點特征的單目SLAM系統設計

    本文提出了一種穩(wěn)健的單目視覺SLAM系統,該系統同時利用點、線和消失點特征來進行精確的相機位姿估計和地圖構建,有效解決了傳統基于點特征的SLAM的局限性。
    的頭像 發(fā)表于 03-21 17:07 ?437次閱讀
    一種基于點、線和消失點<b class='flag-5'>特征</b>的單目SLAM系統設計

    如意玲瓏應用構建的基礎知識

    在Linux生態(tài)中,軟件包的分發(fā)與管理一直是開發(fā)者與用戶關注的焦點。如意玲瓏(Linyaps)作為一種新興的容器化應用格式,憑借其輕量化、強隔離、跨發(fā)行版兼容等特性,正在為 Linux 應用生態(tài)注入新的活力。無論是開發(fā)者還是技術愛好者,掌握玲瓏應用的構建
    的頭像 發(fā)表于 03-03 09:53 ?425次閱讀
    如意玲瓏應用<b class='flag-5'>構建</b>的基礎知識

    以智能制造為導向的數字孿生工廠構建方法與應用

    數字孿生工廠的構建方法與應用,以期為制造企業(yè)實現智能制造提供參考與指導。 1?數字孿生的概念及內涵 1.1?數字孿生的概念 數字孿生(Digital Twin,DT)是信息科學與物理工程學交叉領域中涌現的一個創(chuàng)新概念。其誕生可以追溯到
    的頭像 發(fā)表于 01-06 10:41 ?478次閱讀

    《HarmonyOS第一課》煥新升級,賦能開發(fā)者快速掌握鴻蒙應用開發(fā)

    《HarmonyOS第一課》煥新升級,賦能開發(fā)者快速掌握鴻蒙應用開發(fā) 隨著HarmonyOS NEXT發(fā)布,鴻蒙生態(tài)日益壯大,廣大開發(fā)者對于系統化學習平臺和課程的需求愈發(fā)強烈。近日,華為精心打造
    發(fā)表于 01-02 14:24

    tmp117有快速測試的方法嗎?

    項目使用tmp117進行腋下測溫時,室溫22度,5S內腋下可升溫到34度。但再往上上升就是0.01度的速度進行,上升到36.5度需要一二十分鐘。 請教下有快速測試的方法嗎?
    發(fā)表于 12-05 07:08

    新能源磷酸鐵鋰電池充電正確方法,你掌握了嗎?

    磷酸鐵鋰電池133-2632-1310作為一種重要的動力電池,其正確的充電方法至關重要。掌握正確的充電方式,不僅可以延長電池的使用壽命,還能確保行車安全。下面就為大家詳細介紹新能源磷酸鐵鋰電池的正確充電方法
    的頭像 發(fā)表于 11-26 17:07 ?5301次閱讀
    新能源磷酸鐵鋰電池充電正確<b class='flag-5'>方法</b>,你<b class='flag-5'>掌握</b>了嗎?

    Jtti:常用的網絡質量監(jiān)控方法有哪些

    常用的網絡質量監(jiān)控方法包括以下幾種: 1. ICMP探測: ? 使用ICMP協議(如Ping)來檢測網絡連通性和質量。這種方法通過發(fā)送探測數據包并分析回包結果來監(jiān)控網絡,典型指標包括丟包率、延遲等
    的頭像 發(fā)表于 11-15 15:50 ?880次閱讀

    特征工程實施步驟

    數據中提取數值表示以供無監(jiān)督模型使用的方法(例如,試圖從之前非結構化的數據集中提取結構)。特征工程包括這兩種情況,以及更多內容。數據從業(yè)者通常依賴ML和深度學習算法
    的頭像 發(fā)表于 10-23 08:07 ?882次閱讀
    <b class='flag-5'>特征</b>工程實施步驟

    常用的devops工具集成方法

    常用的devops工具集成方法涵蓋了軟件開發(fā)和運維的各個方面,從版本控制到自動化構建、測試、部署和監(jiān)控。這些工具的有效集成可以幫助團隊提高協作效率,減少溝通障礙,實現快速、高質量的軟件
    的頭像 發(fā)表于 10-09 11:21 ?513次閱讀

    特瑞仕DC/DC轉換器實機特性比較工具的特征和使用方法

    本篇文章說明了特瑞仕在官網公開的實機特性比較工具的特征和使用方法
    的頭像 發(fā)表于 09-26 17:03 ?2306次閱讀
    特瑞仕DC/DC轉換器實機特性比較工具的<b class='flag-5'>特征</b>和使用<b class='flag-5'>方法</b>

    高光譜成像的黃瓜病蟲害識別和特征波長提取方法

    高光譜成像的黃瓜病蟲害識別和特征波長提取方法黃瓜霜霉病和斑潛蠅是制約黃瓜產業(yè)發(fā)展的嚴重病蟲害。
    的頭像 發(fā)表于 08-12 15:36 ?1128次閱讀
    高光譜成像的黃瓜病蟲害識別和<b class='flag-5'>特征</b>波長提取<b class='flag-5'>方法</b>

    手動構建Docker鏡像的方法

    不推薦使用docker commit命令,而應該使用更靈活、更強大的dockerfile來構建docker鏡像。
    的頭像 發(fā)表于 08-05 15:30 ?888次閱讀
    手動<b class='flag-5'>構建</b>Docker鏡像的<b class='flag-5'>方法</b>

    DC/DC模擬器的特征和使用方法

    本篇介紹了特瑞仕在官網提供的DC/DC模擬器的特征和使用方法
    的頭像 發(fā)表于 07-18 16:17 ?1274次閱讀
    DC/DC模擬器的<b class='flag-5'>特征</b>和使用<b class='flag-5'>方法</b>
    主站蜘蛛池模板: 久久黄色毛片 | 欧美大片一区二区三区 | 日日舔夜夜操 | 如色网| 台湾一级毛片 | 222www免费观看| 午夜性爽视频男人的天堂在线 | 成 人在线观看视频网站 | 国产黄在线观看免费观看不卡 | 中国毛茸茸bbxx | 曰本裸色私人影院噜噜噜影院 | 日本一区二区视频 | 亚洲人色大成年网站在线观看 | 久久久久久久久综合 | 免费被黄网站在观看 | 一本到卡二卡三卡免费高 | 色视频www在线播放国产人成 | 一级做a爱片就在线看 | 大香线蕉97久久 | 免费午夜影片在线观看影院 | 六月婷婷精品视频在线观看 | 久久久网站亚洲第一 | 色成人综合网 | 夜恋秀场欧美成人影院 | 亚洲国产一区二区在线 | 7m凹凸精品分类大全免费 | 四虎国产精品成人永久免费影视 | 女攻各种play男受h | 天天干天天插天天 | 两性色午夜视频免费老司机 | 色偷偷成人| 哟交小u女国产精品视频 | 精品卡1卡2卡三卡免费视频 | 国产裸体美女视频全黄 | 色成人综合 | 男男扒开后菊惩罚 | aaa一级最新毛片 | 色女人久久 | 亚洲综合激情另类专区 | 免费在线公开视频 | www.99在线观看|