3 統計機器學習 - 機器學習綜述——機器學習理論基礎與發展脈絡

3 統計機器學習

統計機器學習是近幾年被廣泛應用的機器學習方法,事實上,這是一類相當廣泛的方法。更為廣義地說, 這是一類方法學。當我們獲得一組對問題世界的觀測數據, 如果我們不能或者沒有必要對其建立嚴格物理模型,我們可以使用數學的方法, 從這組數據推算問題世界的數學模型, 這類模型一般沒有對問題世界的物理解釋, 但是, 在輸入輸出之間的關系上反映了問題世界的實際, 這就是“黑箱”原理。一般來說,“黑箱”原理是基于統計方法的(假設問題世界滿足一種統計分布) , 統計機器學習本質上就是“黑箱”原理的延續。與感知機時代不同, 由于這類機器學習科學基礎是感知機的延續, 因此,神經科學基礎不是近代統計機器學習關注的主要問題, 數學方法成為研究的焦點。

3.1 統計機器學習概述

統計機器學習方法的基本假設是同類數據具有一定的統計規律性。其目標是從假設空間（也即模型空間，從輸入空間到輸出空間的映射函數空間）中尋找一個最優的模型。

通過對統計機器學習目標的描述，我們可以發現統計機器學習方法主要研究三個問題：

(1)模型假設：這個問題解決的是如何將樣本從輸入空間轉化到輸出空間的，它往往是一個后驗概率或者是一個映射函數。

(2)模型選擇：模型所在空間也就是假設空間，往往包含無窮多個滿足假設的可選模型，如何從假設空間中選擇一個最優模型，應該采用怎樣的選擇標準？這就是模型選擇應該解決的問題。一般采用損失函數來制定模型選擇策略，將模型選擇轉化為一個最優化問題來求解。常用的損失函數包括0-1損失、平方誤差損失、絕對損失、對數損失等等。通常我們也會在損失函數中加上正則化項，從而降低模型的復雜性，提高模型的泛化能力，拒絕Overfitting。

(3)學習算法：學習算法是用來解決最優化問題的方法。在給定損失函數后，如何快速找到損失函數約定條件下的最優解就是學習算法需要解決的問題。常用的學習算法包括梯度下降、擬牛頓法等等。

統計機器學習方法的三個問題都是非常值得研究的，對于模型假設這個問題，如果模型都選擇錯誤，無論后面如何選擇模型，也都難以反映數據集的正確分布。因此，首先需要選擇對模型做出正確假設，如何選擇模型的假設空間是一個學問，除掉交叉驗證的方法之外還有不少其他方法。模型選擇的關鍵在于如何設計損失函數，而損失函數通常包括損失項和正則化項，不同的模型選擇策略通常選出的模型也非常不同，從而導致模型的預測效果也大大不同。學習算法比較定式，不同的學習算法不僅學習的效率不同，而且學習出來的效果也不一樣。

3.2 統計機器學習的理論基礎

機器學習早期研究的特點是以劃分為主要研究課題, 這個考慮一直延續到Vapnik 在20 世紀70 年代發展的關于有限樣本統計理論, 并于20 世紀80 年代末流傳到西方之后,在泛化能力意義下指導算法設計才成為人們關注的主要問題, 這是本文需要進一步討論的問題。

盡管以Open 問題驅動的BP 算法研究大大推動了感知機研究方向的發展, 然而, 近十年計算機科學與技術的快速發展,使得人們獲得數據的能力大大提高, BP 這類算法已不能完全適應這種需求, 同時,Minsky 的算法設計原則愈顯重要。

然而,沿著Barlow 路線的機器學習研究并沒有終止,自1992年開始,Vapnik 將有限樣本統計理論介紹給全世界, 并出版了統計機器學習理論的著作盡管這部著作更多地是從科學、哲學上討論了機器學習的諸多問題, 但是, 其暗示的算法設計思想對以后機器學習算法研究產生了重要的影響。

Vapnik 的研究主要涉及機器學習中兩個相互關聯的問題, 泛化問題與表示問題。前者包含兩個方面的內容: 其一, 有限樣本集合的統計理論; 其二, 概率近似正確的泛化描述。而后者則主要集中在核函數, 由此, 將算法設計建立在線性優化理論之上。

Valiant的“概率近似正確”學習的考慮在機器學習的發展中扮演了一個重要的角色。1984 年,Valiant 提出了機器學習的一個重要考慮, 他建議評價機器學習算法應該以“概率近似正確(PAC)”為基礎,而不是以傳統模式識別理論中以概率為1 成立為基礎,由此, 他引入了類似在數學分析中的ε-δ語言來描述PAC, 這個考慮對近代機器學習研究產生了重要的影響。首先, 統計機器學習理論中泛化不等式的推導均以這個假設為基礎;其次, 基于這個考慮的“弱可學習理論”,為研究基于Hebb 路線的學習算法設計奠定了理論基礎, 并產生被廣泛應用的集群機器學習理念( ensemble )。

3.3 統計機器學習的研究現狀

3.3.1SVM與Deep Learning的競爭

當前統計學習領域最熱門方法主要有deep learning和SVM（supportvector machine），它們是統計學習的代表方法。

可以認為神經網絡與支持向量機都源自于感知機（Perceptron）。感知機是由Rosenblatt發明的線性分類模型（1958年）。感知機對線性分類有效，但現實中的分類問題通常是非線性的。

神經網絡與支持向量機（包含核方法）都是非線性分類模型。1986年，Rummelhart與McClelland發明了神經網絡的學習算法Back Propagation。后來，Vapnik等人于1992年提出了支持向量機。神經網絡是多層（通常是三層）的非線性模型，支持向量機利用核技巧把非線性問題轉換成線性問題。

神經網絡與支持向量機一直處于“競爭”關系。SVM應用核函數的展開定理，無需知道非線性映射的顯式表達式；由于是在高維特征空間中建立線性學習機，所以與線性模型相比，不但幾乎不增加計算的復雜性，而且在某種程度上避免了“維數災難”。而早先的神經網絡算法比較容易過訓練，大量的經驗參數需要設置；訓練速度比較慢，在層次比較少(小于等于3)的情況下效果并不比其它方法更優。

神經網絡研究領域領軍者Hinton在2006年提出了神經網絡Deep Learning算法，使神經網絡的能力大大提高，向支持向量機發出挑戰。Deep Learning假設神經網絡是多層的，首先用RestrictedBoltzmann Machine（非監督學習）學習網絡的結構，然后再通過Back Propagation（監督學習）學習網絡的權值。

3.3.2 支持向量機SVM

SVM方法是通過一個非線性映射p，把樣本空間映射到一個高維乃至無窮維的特征空間中（Hilber空間），使得在原來的樣本空間中非線性可分的問題轉化為在特征空間中的線性可分的問題。升維，就是把樣本向高維空間做映射，一般情況下這會增加計算的復雜性，甚至會引起“維數災難”，因而人們很少問津。但是作為分類、回歸等問題來說，很可能在低維樣本空間無法線性處理的樣本集，在高維特征空間中卻可以通過一個線性超平面實現線性劃分（或回歸）。一般的升維都會帶來計算的復雜化，SVM方法巧妙地解決了這個難題：應用核函數的展開定理，就不需要知道非線性映射的顯式表達式；由于是在高維特征空間中建立線性學習機，所以與線性模型相比，不但幾乎不增加計算的復雜性，而且在某種程度上避免了“維數災難”．這一切要歸功于核函數的展開和計算理論．

選擇不同的核函數，可以生成不同的SVM，常用的核函數有以下4種：

⑴ 性核函數K(x,y)=x·y；

⑵多項式核函數K(x,y)=[(x·y)+1]d；

⑵ 向基函數K(x,y)=exp(-|x-y|^2/d^2）

⑶ 層神經網絡核函數K(x,y)=tanh(a(x·y)+b）．

3.3.2.1 SVM有如下主要幾個特點：

(1)非線性映射是SVM方法的理論基礎,SVM利用內積核函數代替向高維空間的非線性映射；

(2)對特征空間劃分的最優超平面是SVM的目標,最大化分類邊際的思想是SVM方法的核心；

(3)支持向量是SVM的訓練結果,在SVM分類決策中起決定作用的是支持向量。(4)SVM 是一種有堅實理論基礎的新穎的小樣本學習方法。它基本上不涉及概率測度及大數定律等,因此不同于現有的統計方法。從本質上看,它避開了從歸納到演繹的傳統過程,實現了高效的從訓練樣本到預報樣本的“轉導推理”,大大簡化了通常的分類和回歸等問題。

(5)SVM 的最終決策函數只由少數的支持向量所確定,計算的復雜性取決于支持向量的數目,而不是樣本空間的維數,這在某種意義上避免了“維數災難”。

(6)少數支持向量決定了最終結果,這不但可以幫助我們抓住關鍵樣本、“剔除”大量冗余樣本,而且注定了該方法不但算法簡單,而且具有較好的“魯棒”性。這種“魯棒”性主要體現在:

①增、刪非支持向量樣本對模型沒有影響;

②支持向量樣本集具有一定的魯棒性;

③有些成功的應用中,SVM 方法對核的選取不敏感

3.3.2.2 SVM的兩個不足：

(1) SVM算法對大規模訓練樣本難以實施

由于SVM是借助二次規劃來求解支持向量，而求解二次規劃將涉及m階矩陣的計算（m為樣本的個數），當m數目很大時該矩陣的存儲和計算將耗費大量的機器內存和運算時間。針對以上問題的主要改進有有J.Platt的SMO算法、T.Joachims的SVM、C.J.C.Burges等的PCGC、張學工的 CSVM以及O.L.Mangasarian等的SOR算法。

(2) 用SVM解決多分類問題存在困難

經典的支持向量機算法只給出了二類分類的算法，而在數據挖掘的實際應用中，一般要解決多類的分類問題?？梢酝ㄟ^多個二類支持向量機的組合來解決。主要有一對多組合模式、一對一組合模式和SVM決策樹；再就是通過構造多個分類器的組合來解決。主要原理是克服SVM固有的缺點，結合其他算法的優勢，解決多類問題的分類精度。如：與粗集理論結合，形成一種優勢互補的多類問題的組合分類器。

3.3.2 DeepLearning

DeepLearning本身算是MachineLearning的一個分支，簡單可以理解為Neural Network的發展。大約二三十年前，Neural Network曾經是ML領域特別火熱的一個方向，但是后來確慢慢淡出了，原因包括以下幾個方面：

(1) 比較容易過訓練，參數比較難確定；

(2) 訓練速度比較慢，在層次比較少(小于等于3)的情況下效果并不比其它方法更優；

所以中間有大約20多年的時間，神經網絡被關注很少，這段時間基本上由SVM和Boosting算法主導。但是，Hinton堅持下來并最終（和Bengio、Yann.lecun等）提成了一個實際可行的Deep Learning框架。

3.3.3.1 Deep Learning與傳統的神經網絡異同

Deep Learning與傳統的神經網絡的相同在于Deep Learning采用了神經網絡相似的分層結構，系統由包括輸入層、隱層（多層）、輸出層組成的多層網絡，只有相鄰層節點之間有連接，同一層以及跨層節點之間相互無連接，每一層可以看作是一個Logistic Regression模型；這種分層結構，是比較接近人類大腦的結構的。

而為了克服神經網絡訓練中的問題，DL采用了與神經網絡很不同的訓練機制。傳統神經網絡中，采用的是Back Propagation的方式進行，簡單來講就是采用迭代的算法來訓練整個網絡，隨機設定初值，計算當前網絡的輸出，然后根據當前輸出和label之間的差去改變前面各層的參數，直到收斂（整體是一個梯度下降法）。而DeepLearning整體上是一個Layer-Wise的訓練機制。這樣做的原因是因為，如果采用Back Propagation的機制，對于一個Deep Network（7層以上），殘差傳播到最前面的層已經變得太小，出現所謂的Gradient Diffusion。

3.3.3.2 Deep Learning訓練過程

(1)采用無標定數據（有標定數據也可）分層訓練各層參數，這一步可以看作是一個無監督訓練過程，是和傳統神經網絡區別最大的部分（這個過程可以看作是feature learning過程）：具體的，先用無標定數據訓練第一層，訓練時可以采用auto-encoder來學習第一層的參數（這一層可以看作是得到一個使得輸出和輸入差別最小的三層神經網絡的隱層），由于模型capacity的限制以及稀疏性約束，使得得到的模型能夠學習到數據本身的結構，從而得到比輸入更具有表示能力的特征；在學習得到第n-1層后，將n-1層的輸出作為第n層的輸入，訓練第n層，由此分別得到各層的參數；這里面需要重點理解auto-encoder以及sparse的機制的原理和作用?？梢詤⒖歼@篇文章。

(2)基于第一步得到的各層參數進一步fine-tune整個多層模型的參數，這一步是一個有監督訓練過程；第一步類似神經網絡的隨機初始化初值過程，由于DL 的第一步不是隨機初始化，而是通過學習輸入數據的結構得到的，因而這個初值更接近全局最優，從而能夠取得更好的效果；所以deep learning效果好很大程度上歸功于第一步的feature learning過程。

總之，deep learning能夠得到更好地表示數據的feature，同時由于模型的層次、參數很多，capacity足夠，因此，模型有能力表示大規模數據，所以對于圖像、語音這種特征不明顯（需要手工設計且很多沒有直觀物理含義）的問題，能夠在大規模訓練數據上取得更好的效果。此外，從模式識別特征和分類器的角度，deep learning框架將feature和分類器結合到一個框架中，用數據去學習feature，在使用中減少了手工設計feature的巨大工作量（這是目前工業界工程師付出努力最多的方面），因此，不僅僅效果可以更好，而且，使用起來也有很多方便之處。

閱讀全文

本文導航

第 1 頁：機器學習綜述——機器學習理論基礎與發展脈絡
第 2 頁：3 統計機器學習
第 3 頁：4 集群機器學習

人工智能(229980) 人工智能(229980)
機器學習(130422) 機器學習(130422)

機器學習與軟件平臺的融合

本文將探討機器學習與軟件平臺的融合。

2021-01-28 06:36:35

機器學習入門篇：一個完整的機器學習項目

機器學習項目入門篇：一個完整的機器學習項目

2020-05-11 14:47:49

機器學習在醫療保健中有哪些應用？

的發展這項技術進步為行業利益相關者之間更緊密的合作，負擔得起且侵入性較小的手術選擇，整體療法以及新的護理模式奠定了基礎。以下是當前和新興機器學習創新的五個

2020-11-24 07:15:44

機器學習對中文的理解

機器學習基礎教程實踐(一)——中文的向量化

2019-08-27 14:19:29

機器學習小白的總結

機器學習小白第一周自我總結

2020-07-08 08:27:34

機器學習的創新/開發和應用能力

機器學習的未來在工業領域采用機器學習機器學習和大數據工業人工智能生態系統

2020-12-16 07:47:35

機器學習的基礎內容

文檔文章目錄系列文章目錄前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數據總結前言提示：這里可以添加本文要記錄的大概內容：例如：隨著人工智能的不斷發展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內容。提示：以下是本篇文章正文內容，下面案例

2022-02-09 06:47:38

機器學習的基礎內容

文章目錄前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數據總結前言提示：這里可以添加本文要記錄的大概內容：例如：隨著人工智能的不斷發展，機器學習這門技術也越來越重要，很多人都開啟了學習機器

2021-08-20 08:07:49

機器學習的基礎內容

：隨著人工智能的不斷發展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內容。提示：以下是本篇文章正文內容，下面案例可供參考一、hc6800-es v2.0示例：pandas 是基于NumPy 的一種工具，該工具是為了解決數據分析任務而創建的。二、使用步

2021-11-24 06:00:24

機器學習的基礎內容介紹

2022-01-12 08:12:18

機器學習的基礎內容大合集

，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內容。提示：以下是本篇文章正文內容，下面案例可供參考一、位帶操作二、使用步驟1.引入庫代碼如下（示例）：import numpy as npimport pandas as pdimport

2022-01-07 06:35:58

機器學習的基礎內容匯總

人工智能的不斷發展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內容。提示：以下是本篇文章正文內容，下面案例可供參考一、pandas是什么？示例：pandas 是基于NumPy 的一種工具，該工具是為了解決數據分析任務而創建的。二、使用步驟1.引入庫代碼

2022-02-28 06:12:58

機器學習的未來

機器學習的未來在工業領域采用機器學習機器學習和大數據

2021-01-27 06:02:18

機器學習的相關資料下載

https://www.toutiao.com/a6712245202418926083/機器學習最重要的應用之一是嵌入式機器視覺領域，各類系統正在從視覺使能系統演進為視覺引導自動化系統。嵌入式視覺

2021-12-14 07:03:28

機器學習的資源分享

機器學習資源分享

2020-06-09 16:31:04

機器學習簡介與經典機器學習算法人才培養

上課時間安排：2022年05月27日 — 2022年05月30日No.1 第一天一、機器學習簡介與經典機器學習算法介紹什么是機器學習？機器學習框架與基本組成機器學習的訓練步驟機器學習問題的分類

2022-04-28 18:56:07

機器學習算法分享

機器學習算法（1）——Logistic Regression

2020-06-09 13:30:03

機器學習算法如何用于制造無人駕駛汽車？

機器學習算法如何用于制造無人駕駛汽車

2021-03-18 06:27:18

機器人技術和機器學習

機器人技術和機器學習正成為嵌入式系統硬件和軟件供應商的下一個重大事件。嵌入式系統可以通過網絡連接和物聯網（IoT）來傳遞信息、共享資源。無論是智能，低能耗，邊緣設備，中間網關還是計算節點，都需要

2021-12-20 06:03:10

機器人工程師學習計劃

如何定義機器人？機器人工程師學習計劃分享

2021-12-20 06:11:57

Labview機器學習

請問Labview機器學習工具箱里有SVM，BP等工具，如果自己用SVR做了一個回歸，可以用Labview實現嗎？這方面的小白，跟各位老師請教一下

2019-10-28 11:11:09

MATLAB圖像處理及機器學習入門交流

深度學習交流大群： 372526178 （課件資料共享，加群備注楊春嬌邀請）MATLAB與機器學習大群: 626611806 （加群備注楊春嬌邀請）

2018-09-12 10:44:56

Microchip的機器學習開發工具有哪些

Microchip的機器學習開發工具

2020-11-25 07:58:55

Python機器學習入門之pandas的使用提示

2021-08-13 07:36:45

tensorflow機器學習日志

tensorflow學習日志(四)機器學習（泛化,過擬合, 數據集，驗證集，測試集）

2020-04-14 06:32:33

【下載】《機器學習》+《機器學習實戰》

方法（決策樹、神經網絡、支持向量機、貝葉斯分類器、集成學習、聚類、降維與度量學習）；第3 部分（第11～16 章）為進階知識，內容涉及特征選擇與稀疏學習、計算學習理論、半監督學習、概率圖模型、規則學習以及

2017-06-01 15:49:24

【阿里云大學免費精品課】機器學習入門：概念原理及常用算法

學習與人工智能技術的強大之處。你是不是也想學機器學習了？機器學習是人工智能的一個分支。人工智能的研究是從以“推理”為重點到以“知識”為重點，再到以“學習”為重點，一條自然、清晰的脈絡。顯然，機器學習

2017-06-23 13:51:15

人工智能和機器學習技術在2021年的五個發展趨勢

人工智能和機器學習如今一直在改變著我們的世界，2020年發生的冠狀病毒疫情為這兩種技術帶來了新的機會和緊迫性，預計在2021年將會有更大的發展。疫情顯然已經成為一種催化劑，從產品創新到消費者偏好

2021-01-27 06:10:12

人工智能和機器學習的前世今生

摘要：閱讀本文以了解更多關于人工智能、機器學習和深度學習方面的知識，以及它們對商業化意味著什么。如果正確的利用模式識別進行商業預測和決策，那么會為企業帶來巨大的利益。機器學習（ML）研究這些模式

2018-08-27 10:16:55

什么是機器學習? 機器學習基礎入門

本文旨在為硬件和嵌入式工程師提供機器學習(ML)的背景，它是什么，它是如何工作的，它為什么重要，以及 TinyML 是如何適應的機器學習是一個始終存在并經常被誤解的技術概念。數十年來，使用復雜

2022-06-21 11:06:37

什么是TinyML？微型機器學習

了解一個叫做微型機器學習(Tiny Machine Learning，TinyML)的機器學習分部，它是什么，它的應用，硬件和軟件需求，以及它的好處。機器學習(ML)是計算機科學中一個動態而強大

2022-04-12 10:20:35

介紹機器學習的基礎內容

參考右邊的幫助文檔文章目錄嵌入式系統之硬件總復習前言一、pandas是什么？二、使用步驟1.引入庫2.讀入數據總結前言提示：這里可以添加本文要記錄的大概內容：例如：隨著人工智能的不斷發展，機器學習這門技術也越來越重要，很多人都開啟了學習機器學習，本文就介紹了機器學習的基礎內容。提示：以下是本篇文

2021-12-16 06:27:44

介紹機器學習的基礎內容

2021-08-13 07:39:46

關于機器學習的日志

機器學習日志

2020-07-08 12:54:25

決策樹在機器學習的理論學習與實踐

決策樹在機器學習的理論學習與實踐

2019-09-20 12:48:44

分析一個不錯的機器學習項目簡歷收集冊

2021-09-26 06:03:10

可解釋的機器學習——打開機器學習黑匣子

【資源下載】《可解釋的機器學習》，打開機器學習黑匣子

2020-05-20 14:16:57

基于機器學習理論之圖像辨識技術應用 – 傳統水表附加遠程抄表功能

。下圖為智能數字辨識水表的架構示意圖，新唐科技除了提供M48xxGCAE系列開發平臺外，還提供了基于機器學習理論的數字辨識技術范例代碼，可降低開發難度與節省客戶大量的開發時間。若您想對新唐M480

2022-03-01 14:21:29

基于流形學習的毫米波探測器目標識別方法研究【個人收藏】

流形學習是一種機器學習理論，旨在發現高維數據分布的內在規律，并從中恢復低維流形結構，實現維數約簡。本文將流形學習方法應用于毫米波探測器目標識別，并對現有流形學習算法進行了改進和推廣。

2021-12-20 15:43:44

基于深度學習技術的智能機器人

——工業機器人的智能化程度要求也越來越高，采用深度學習技術為工業機器人賦能是目前各大廠商的統一認知。本文結合實際案例，簡要說明一下智能機器人的實現流程。一、智能機器人概念人工智能技術，其主要作用就是用

2018-05-31 09:36:03

如何學習機器學習

【吳恩達機器學習】學習筆記13（Normal Equation& 與梯度下降比較）

2020-04-26 11:05:59

如何實現機器人的自我學習？

不等式得到這樣的推論：訓練樣本足夠大時，訓練數據上的結果與全部數據上的結果會足夠接近。這就是機器學習為什么能“舉一反三”的理論基礎。[hide]訓練樣本足夠大時，訓練數據上的結果與全部數據上的結果會足夠

2016-03-04 10:34:38

如何用卷積神經網絡方法去解決機器監督學習下面的分類問題？

人工智能下面有哪些機器學習分支？如何用卷積神經網絡（CNN）方法去解決機器學習監督學習下面的分類問題？

2021-06-16 08:09:03

如果只是應用機器學習，而不是研究，需要哪些知識

如果只是應用機器學習，而不是研究，需要哪些知識？還用深入學習數字么

2019-08-30 14:51:02

微型機器學習

人工智能 AI 正在加快速度從云端走向邊緣，進入到越來越小的物聯網設備中。而這些物聯網設備往往體積很小，面臨著許多挑戰，例如功耗、延時以及精度等問題，傳統的機器學習模型無法滿足要求，那么微型機器學習又如何呢？

2021-09-15 09:23:12

最值得學習的機器學習編程語言

選擇最能滿足個人需求，以及保證自己將來能夠在 AI 和機器學習領域順利發展的編程語言。在本文中，我們將介紹最值得學習的 5 種編程語言，這些語言不僅能夠為機器學習征服世界鋪平道路，而且也能夠幫助你處理好日常工作。下面，我們來看看為了在 AI 和機器學習領域站穩腳跟，你需要學習的五種語言。

2021-03-02 06:22:38

物聯網防火墻與機器學習技術解析

物聯網防火墻與機器學習技術

2021-02-25 06:05:58

軟體機器人學習問題探討

，學習并探討軟體機器人結構設計、柔性制造、運動控制、裝配和調試等內容，使學員熟練應用控制工程理論、自動化、材料力學、機械原理、機械設計、3D打印等基礎知識，培養和提高學員對軟體機器人目標分析、模型建立、設計制作和實驗測試的能力；

2019-08-12 15:09:17

部署基于嵌入的機器學習模型

1、如何在生產中部署基于嵌入的機器學習模型　　由于最近大量的研究，機器學習模型的性能在過去幾年里有了顯著的提高。雖然這些改進的模型開辟了新的可能性，但是它們只有在可以部署到生產應用中時才開始提供真正

2022-11-02 15:09:52

基于建構主義學習理論的藏文音素拼讀法MCAI設計

建構主義是符合人類認知規律的一種學習理論,而MCAI是廣泛使用且行之有效的教學輔助工具。文章介紹基于建構主義學習理論的藏文音素拼讀法多媒體教學軟件的設計。

2010-03-01 15:08:32

計算學習理論(1)#機器學習

機器學習

未來加油dz發布于 2023-07-14 17:02:21

計算學習理論(2)#機器學習

機器學習

未來加油dz發布于 2023-07-14 17:03:16

Spark機器學習庫的各種機器學習算法

本文將簡要介紹Spark機器學習庫（Spark MLlibs APIs）的各種機器學習算法，主要包括：統計算法、分類算法、聚類算法和協同過濾算法，以及各種算法的應用。你不是一個數據科學家。根據

2017-09-28 16:44:43

機器學習理論基礎介紹

成為一名合格的開發工程師不是一件簡單的事情，需要掌握從開發到調試到優化等一系列能力，這些能力中的每一項掌握起來都需要足夠的努力和經驗。而要成為一名合格的機器學習算法工程師（以下簡稱算法工程師）更是

2017-12-12 11:27:55

3612

面向認知的多源數據學習理論和算法研究進展

多源數據學習在大數據時代具有極其重要的意義，目前，多源數據學習算法研究遠遠超前于多源數據學習理論研究，經典的機器學習理論難以應用于多源數據學習。更難以提供多源數據學習算法在實際應用中的理論保障

2017-12-26 16:10:41

2018年IoT領域即將爆發的兩大應用：區塊鏈及機器學習

機器學習是人工智能（AI）的一個分支。人工智能的研究是從「推理」到「知識」，再到以「學習」為重點，有一條自然、清晰的脈絡可循。機器學習則是實現人工智能的一個途徑，即以機器學習為手段解決人工智能中的問題。

2018-01-02 08:39:24

2649

什么是機器學習？機器學習能解決什么問題？（案例分析）

隨著大數據時代的到來，機器學習成為解決問題的一種重要且關鍵的工具。不管是工業界還是學術界，機器學習都是一個炙手可熱的方向，但是學術界和工業界對機器學習的研究各有側重，學術界側重于對機器學習理論

2018-05-18 13:13:00

15976

如何開始接觸機器學習_機器學習入門方法盤點

機器學習入門方法一說到機器學習，我被問得最多的問題是：給那些開始學習機器學習的人的最好的建議是什么？

2018-05-20 07:10:00

3755

機器學習心得總結

接觸機器學習有一年了，是從上張敏老師的課開始的。后來師兄推薦了一本《統計學習理論的本質》，還記得第一印象覺得“統計”二字很奇怪。之后就漸漸習以為常了，接觸到的機器學習方法都是基于統計的，以至于統計學習與機器學習成了一個概念，以至于最近看了一些東西突然覺得自己長見識了。

2018-07-07 09:40:00

12720

機器學習的100天作戰計劃與教程

其實機器學習涵蓋的知識面非常多，而且不僅要學習理論還有實踐同樣不能忽視。如果基礎薄弱，學習起來肯定是會遇到很多困難的，但就一定不行嗎？如何在基礎薄弱的條件下進行有效的學習是很多人都非常關心的。至此

2018-08-03 09:50:30

4199

機器學習入門資料之機器學習的詳細資料介紹

機器學習是計算機科學的一個子領域，根據Arthur Samuel在1959年提出的，它賦予“計算機在不被明確地編程的情況下學習的能力?！?_是人工智能中模式識別和計算學習理論研究的進展，2_機器學習

2018-11-15 15:35:39

機器學習中應用數學應該要注意的幾點注記

只是一般機器學習中使用的數學的一小部分（例如，機器學習理論的處理將包括基本泛化誤差邊界的數學）下游經常使用EST。我包括兩種作業，‘練習’和‘謎題’。練習開始時很容易，反之亦然；這些謎題是帶有一點馬基雅維利惡作

2018-11-16 16:17:37

精選10本機器學習暢銷書,玩轉機器學習

人工智能和大數據時代，分布式機器學習解決了大量最具挑戰性的問題，《分布式機器學習：算法、理論與實踐》全面分析了分布式機器學習的現狀，深入分析其中核心問題，討論該領域的未來發展方向。

2018-12-10 09:36:38

4246

機器學習在嵌入式系統中的應用

機器學習已從一個有趣的研究課題迅速發展成為廣泛應用的有效解決方案。它顯而易見的有效性迅速吸引了人工智能理論學者群體之外的開發者社區的興趣。在某些方面，機器學習開發能力已經擴展到其它基于強大理論基礎的技術應用層面。

2019-04-05 09:32:00

4640

自動化機器學習是什么情況

機器學習發展中遇到的問題，一個核心因素是人，而機器學習的工作又有大量的人工干預，如特征提取、模型選擇、參數調節等機器學習的各個方面。

2019-11-04 16:35:08

1245

機器學習該怎么學習

網上關于機器學習的文章，視頻不計其數，本來寫這么一篇東西，我自己也覺得有點多余，但是我還真沒找到一個能幫助像我這樣零基礎的人，快速接觸和上手機器學習的文章。這篇文章不能讓你深入學習和掌握機器學習

2020-05-12 08:54:38

811

目前機器學習面臨的常見問題和挑戰

由于我們的主要任務是選擇一種學習算法，并對某些數據進行訓練，所以最可能出現的兩個問題不外乎是“壞算法”和“壞數據”，本文主要從壞數據出發，帶大家了解目前機器學習面臨的常見問題和挑戰，從而更好地學習機器學習理論。

2020-10-23 11:42:49

14230

機器學習的范圍和算法

什么是機器學習？機器學習是英文名稱MachineLearning（簡稱ML）的直譯。機器學習涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。

2020-11-12 10:19:12

1203

機器學習的范圍/算法/分類

什么是機器學習？機器學習是英文名稱MachineLearning（簡稱ML）的直譯。機器學習涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。

2021-01-21 09:29:06

3315

機器學習和深度學習有什么區別？

深度學習算法現在是圖像處理軟件庫的組成部分。在他們的幫助下，可以學習和訓練復雜的功能;但他們的應用也不是萬能的。 “機器學習”和“深度學習”有什么區別？在機器視覺和深度學習中，人類視覺的力量和對視

2021-03-12 16:11:00

7762

基于機器學習的哈希檢索算法綜述

2021-06-10 11:05:56

機器學習在故障檢測與診斷領域中的應用綜述

2021-06-24 11:12:16

基于DNN與規則學習的機器翻譯算法綜述

2021-06-29 15:44:06

機器學習在衛星遙測分析建模中的應用綜述

2021-06-29 16:40:48

自動機器學習的優點與痛點

自動機器學習綜述自從計算機時代開始，科學家和工程師們就一直想知道如何像人類一樣，給計算機注入學習的能力。艾倫·圖靈是第一批提出智能理論的科學家之一，該理論設想有一天計算機能夠達到與人類同等的智能

2021-09-01 14:29:50

4091

水聲被動定位中的機器學習方法研究進展綜述

向量機、隨機森林及以卷積網絡層和全連接層為主要組成單元的深度神經網絡。本文通過重點引述近幾年發表在國際期刊和會議上的相關前沿研究工作,詳細論述了將機器學習方法應用于水聲被動定位的關鍵理論基礎、單水聽器和陣列前端信號

2021-12-24 11:18:27

467

機器學習是什么，機器學習的定義

機器學習是一門能夠讓編程計算機從數據中學習的計算機科學（和藝術）。

2022-02-03 09:18:00

7631

基于機器學習的效用和理論理解

機器學習領域近年的發展非常迅速，然而我們對機器學習理論的理解還很有限，有些模型的實驗效果甚至超出了我們對基礎理論的理解。

2022-03-24 13:50:14

2083

機器學習找一個好用的函數的原因是什么

（1）機器學習中經典的“支持向量機（SVM）”的主要提出者弗拉基米爾·萬普尼克（Vladimir Vapnik），在其著作《統計學習理論的本質》中這樣定義機器學習“機器學習就是一個基于經驗數據的函數估計問題”。

2022-11-02 16:15:41

492

機器學習技術的理論背景

近年來，所謂的深度學習范式徹底改變了機器學習領域。深度學習通過解決以前傳統模式識別方法無法解決的挑戰，對機器學習社區產生了巨大影響（LeCun et al. 2015）。深度學習的引入極大地提高了

2022-12-02 14:53:35

1005

基于機器學習的效用和理論理解機器學習幾大領域未來進展預測

機器學習領域中，有些模型非常有效，但我們并不能完全確定其原因。相反，一些相對容易理解的研究領域則在實踐中適用性有限。本文基于機器學習的效用和理論理解，探討各個子領域的進展。

2023-01-06 09:59:40

347

AI是干什么的？機器學習的基礎流程和理論基礎

機器學習的“訓練”部分就是找到f( )，即成本函數按照梯度下降的方法找到最優的f( )。大家理解了找f()，才能進入各種算法討論。

2023-02-01 10:46:46

664

機器學習理論：k近鄰算法

KNN(k-Nearest Neighbors)思想簡單，應用的數學知識幾乎為0，所以作為機器學習的入門非常實用、可以解釋機器學習算法使用過程中的很多細節問題。能夠更加完整地刻畫機器學習應用的流程。

2023-06-06 11:15:02

392

基于機器學習理論之圖像辨識技術應用-傳統水表附加遠程抄表功能

基于機器學習理論之圖像辨識技術應用-傳統水表附加遠程抄表功能

2023-08-10 11:19:07

293

機器學習和深度學習的區別

機器學習和深度學習的區別隨著人工智能技術的不斷發展，機器學習和深度學習已經成為大家熟知的兩個術語。雖然它們都屬于人工智能技術的研究領域，但它們之間有很大的差異。本文將詳細介紹機器學習和深度學習

2023-08-17 16:11:40

2726

機器學習算法匯總機器學習算法分類機器學習算法模型

機器學習算法匯總機器學習算法分類機器學習算法模型機器學習是人工智能的分支之一，它通過分析和識別數據模式，學習從中提取規律，并用于未來的決策和預測。在機器學習中，算法是最基本的組成部分之一。算法

2023-08-17 16:11:48

632

機器學習算法總結機器學習算法是什么機器學習算法優缺點

機器學習算法總結機器學習算法是什么?機器學習算法優缺點? 機器學習算法總結機器學習算法是一種能夠從數據中自動學習的算法。它能夠從訓練數據中學習特征，進而對未知數據進行分類、回歸、聚類等任務。通過

2023-08-17 16:11:50

938

機器學習算法入門機器學習算法介紹機器學習算法對比

機器學習算法入門機器學習算法介紹機器學習算法對比機器學習算法入門、介紹和對比隨著機器學習的普及，越來越多的人想要了解和學習機器學習算法。在這篇文章中，我們將會簡單介紹機器學習算法的基本概念

2023-08-17 16:27:15

569

機器學習是什么意思？機器學習屬于什么分支？機器學習有什么用處？

機器學習是什么意思？機器學習屬于什么分支？機器學習是什么有什么用處？機器學習是指讓計算機通過經驗來不斷優化和改進自身的算法和模型的過程。因此，機器學習可以被理解為是一種從數據中自動獲取規律和知識

2023-08-17 16:30:04

1145

機器學習theta是什么？機器學習tpe是什么？

機器學習theta是什么？機器學習tpe是什么？機器學習是近年來蓬勃發展的一個領域，其相關技術和理論受到了廣泛的關注和應用。在機器學習中，theta和tpe是兩個非常重要的概念。首先，我們來了

2023-08-17 16:30:08

1017

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？

機器學習有哪些算法？機器學習分類算法有哪些？機器學習預判有哪些算法？機器學習是一種人工智能技術，通過對數據的分析和學習，為計算機提供智能決策。機器學習算法是實現機器學習的基礎。常見的機器學習算法

2023-08-17 16:30:11

1244

機器學習發展歷程

機器學習發展歷程：機器學習發展現狀、機器學習發展前景和機器學習發展歷史隨著科技的快速發展，全球各個行業都在加速數字化轉型，從而加速了人工智能和機器學習的發展。機器學習已經成為許多公司和組織實現商業

2023-08-17 16:30:15

1038

機器學習的研究現狀和發展趨勢機器學習的常見算法和優缺點

隨著計算能力和大數據的崛起，機器學習算法正迎來快速發展的時期。在研究層面上，機器學習和深度學習是當前最主要的熱點。在計算能力的推動下，機器學習算法取得了許多重大突破，如AlphaGo戰勝人類棋手

2023-08-22 17:49:27

1657

已全部加載完成

搜索歷史

3 統計機器學習 - 機器學習綜述——機器學習理論基礎與發展脈絡

3 統計機器學習

本文導航

評論