在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習的6個關鍵概念

汽車玩家 ? 來源:今日頭條 ? 作者:聞數起舞 ? 2020-04-14 17:12 ? 次閱讀

機器學習是一種將傳統數學與現代強大的計算處理相結合的技術,以學習數據集中固有的模式。 在機器學習中,目標是產生一種可以使用這些模式執行某些指定任務的算法。

在監督式機器學習的情況下,目標可能是開發一個模型,該模型可以識別一組輸入所屬的類別或類別,或預測連續值,例如房屋價格。

在本文中,我將介紹機器學習中的一些關鍵概念。 如果您是機器學習的新手,這將使您對本領域中使用的一些術語和技術有一個很好的了解。

1.特征

在機器學習中,我們上面討論的輸入稱為特征。 要素是分配給數據點的一組屬性。

以下示例數據集是著名的數據集,通常用于機器學習實踐問題(稱為"波士頓住房價格")。 它由一組與房屋相關的功能(在下圖中以紅色突出顯示)組成,例如年齡,平均房間數和物業稅值以及相應的房價。

為了使機器學習模型成功完成其任務,至少其中一些功能與房屋價格之間需要存在統計關系。

機器學習的6個關鍵概念

> Boston housing prices dataset — features are highlighted red

2.特征選擇與工程

優化機器學習模型的重要一步是優化。 我們開發的模型需要以最佳狀態執行,而要確保做到這一點的一種方法是使用最佳功能來訓練模型。

包括每個特征并不總是有用的。 有些特征可能與我們嘗試預測的變量沒有有意義的統計關系,而另一些特征可能彼此緊密相關。 這兩種情況都將噪聲引入訓練階段,這可能會降低模型性能。 特征選擇是選擇最佳特征以包含在訓練階段中的過程。

同樣,原始形式的特征可能無法提供足夠的有意義的數據來訓練性能模型。 另外,某些特征根本不能以其原始形式使用,一個很好的例子就是基于日期/時間的功能。 機器學習模型不能使用日期或時間戳作為特征,我們需要首先從日期中導出有意義的特征,才能包含此信息。 我們可以使用整數形式的日期部分(例如月,日或星期數),或計算兩個日期之間的差,以提供算法可以理解的模式。 這就是所謂的特征工程。

3.標簽

有監督的機器學習需要一些被稱為標記數據的東西。 這意味著每組要素都具有相應標簽的數據。 這些標簽可以是類別或類型(例如貓或狗),也可以是連續值,例如在波士頓房屋價格數據集中以標簽為價格的情況。

在開發機器學習模型時,功能通常稱為X,標簽稱為y。

機器學習的6個關鍵概念

> Boston housing prices dataset — labels are highlighted red

4.訓練

監督式機器學習需要標記數據,因為算法使用這些示例特征值及其對應的標記來"學習"模式,如果成功,則將使模型能夠準確地預測新的未標記數據上的標記。

在機器學習過程中,學習的這一階段稱為訓練階段。 在此階段結束時,您將擁有一個可用于預測新的未標記數據的標簽或值的模型。 訓練階段通常稱為擬合模型。

5.調參

在本文前面介紹功能選擇時,我曾討論過一個優化過程。 此過程的另一部分稱為調參,涉及優化算法參數以找到適合您特定數據集的最佳組合。

所有機器學習模型都包含具有多種選項的參數。 例如,隨機森林模型具有許多可調參數。 一個示例是n_estimators,它確定森林中樹木的數量。 通常,樹的數量越多,結果越好,但是在特定點(并且這取決于數據集),隨著您添加更多的樹,改進會降低。 為您的數據集找到最佳樹數是一種調整隨機森林算法參數的方法。

每種算法都有許多可調參數,并且每個參數都有大量潛在的選項。 幸運的是,有自動方法可以找到這些參數的最佳組合,這就是所謂的超參數優化。

6.驗證

建立模型后,我們需要確定其執行給定任務的能力。 在我們的示例數據中,我們將要了解模型可以多么準確地預測房屋價格。 在機器學習中,建立最佳性能指標很重要,這將根據我們要解決的問題而有所不同。

通常,在開始機器學習項目時,我們將首先將要使用的數據集分為兩部分。 我們一個用來訓練模型,另一個用于測試階段。

機器學習中的測試通常稱為驗證。 我們使用模型對保留的測試數據集進行預測,并測量所選的性能指標,以確定模型能夠很好地執行給定任務。

本文概述了討論機器學習時最常用的一些術語和概念。 如果您剛剛開始學習,它應該可以幫助您了解機器學習教程中使用的一些術語。 如果您想深入學習使用python創建您的第一個模型,可以在這里閱讀我的教程"如何創建您的第一個機器學習模型"。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8485

    瀏覽量

    133975
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    人工智能和機器學習以及Edge AI的概念與應用

    與人工智能相關各種技術的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發展與相關應用。 人工智能和機器學習是現代科技的核心技術 人工智能(AI)和機器
    的頭像 發表于 01-25 17:37 ?759次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>以及Edge AI的<b class='flag-5'>概念</b>與應用

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多
    的頭像 發表于 12-30 09:16 ?968次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一核心領域,它使計算機能夠從數據中學習并做出預測或決策。自然語言處理與機器學習之間有著密切的關系,因為
    的頭像 發表于 12-05 15:21 ?1663次閱讀

    NPU與機器學習算法的關系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設計目標是提高機器學習算法的運行效率,特別是在處理
    的頭像 發表于 11-15 09:19 ?1042次閱讀

    eda在機器學習中的應用

    值和噪聲數據。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數據中的異常值和分布情況。例如,如果一數據集中的某個特征值遠高于其他值,這可能是一異常值,需要進一步調查。 2. 特征選擇 特征選擇 是機器
    的頭像 發表于 11-13 10:42 ?720次閱讀

    具身智能與機器學習的關系

    具身智能(Embodied Intelligence)和機器學習(Machine Learning)是人工智能領域的兩重要概念,它們之間存在著密切的關系。 1. 具身智能的定義 具身
    的頭像 發表于 10-27 10:33 ?867次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨
    發表于 08-12 11:21

    預訓練和遷移學習的區別和聯系

    預訓練和遷移學習是深度學習機器學習領域中的兩重要概念,它們在提高模型性能、減少訓練時間和降低
    的頭像 發表于 07-11 10:12 ?1843次閱讀

    如何理解機器學習中的訓練集、驗證集和測試集

    理解機器學習中的訓練集、驗證集和測試集,是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習
    的頭像 發表于 07-10 15:45 ?6179次閱讀

    機器學習中的數據預處理與特征工程

    機器學習的整個流程中,數據預處理與特征工程是兩至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這
    的頭像 發表于 07-09 15:57 ?1100次閱讀

    遷移學習的基本概念和實現方法

    遷移學習(Transfer Learning)是機器學習領域中的一重要概念,其核心思想是利用在一
    的頭像 發表于 07-04 17:30 ?3040次閱讀

    人工神經網絡與傳統機器學習模型的區別

    在人工智能領域,機器學習和神經網絡是兩核心概念,它們各自擁有獨特的特性和應用場景。雖然它們都旨在使計算機系統能夠自動從數據中學習和提升,但
    的頭像 發表于 07-04 14:08 ?2361次閱讀

    人工智能、機器學習和深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度學習(Deep Learning, DL)已成為
    的頭像 發表于 07-03 18:22 ?2460次閱讀

    機器學習在數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據分析能力。本文將深入探討機器
    的頭像 發表于 07-02 11:22 ?1195次閱讀
    主站蜘蛛池模板: 天天天天天天干 | 色www国产阿娇 | 久久综合久久久 | 伊人久久大杳蕉综合大象 | 久操视频在线播放 | 欧美黄色片在线播放 | 苦瓜se影院在线视频网站 | 欧美在线专区 | 中文在线最新版天堂bt | 美女视频网站免费播放视 | 色多多福利网站 | 日本三级香港三级三级人!妇久 | 天天综合网站 | 午夜高清| 二区视频在线 | 天天碰视频 | 美女扒开尿口让男人30视频 | 日本免费人成在线网站 | 天天做天天爱夜夜想毛片 | 日韩精品在线第一页 | 日本黄色激情视频 | 亚洲最大色网站 | 国产最好的精华液网站 | 免费观看在线永久免费xx视频 | 免费高清特黄a 大片 | 欧美亚洲在线 | 18毛片 | 台湾佬自偷自拍情侣在线 | 中文字幕精品一区二区三区视频 | 99热热热 | 亚洲国产一区二区在线 | 天天上天天操 | 欧美一区二区三区在线观看 | 在线色视频网站 | 四虎网站最新网址 | 一区二区三区高清在线 | 免费黄色在线观看 | 欧美一区高清 | 天天干天天爽天天射 | 口述他拿舌头进去我下面好爽 | 日本经典在线三级视频 |