在Vladimir Vapnik創(chuàng)立支持向量機(jī)前,已有如下結(jié)論:在二分類情況中,如果一個數(shù)據(jù)集線性可分,即存在一個超平面可將兩個類別完全分開,那么一定存在無數(shù)個超平面將這兩個類別完全分開。
在特征空間為二維平面時,分類訓(xùn)練數(shù)據(jù)的超平面的具體圖形為直線,下文介紹在無數(shù)個此類直線中選擇可使分類效果最優(yōu)的直線。
一、直觀感覺分類效果最優(yōu)的直線
如圖一左圖所示,有三條直線可將圖一左圖中的圓圈和叉分為兩類,該三條直線分別為1號線、2號線、3號線。在選擇可使圓圈和叉分類效果最優(yōu)的直線(下文簡稱“最優(yōu)分類直線”)時,可能多數(shù)人會選擇2號線。但根據(jù)免費午餐定理,在未假設(shè)訓(xùn)練數(shù)據(jù)的先驗分布的情況下,三條直線對于圓圈和叉分類效果相同。人的直觀感覺似乎和免費午餐定理產(chǎn)生矛盾。
其實,似乎矛盾的原因是人們在選擇最優(yōu)分類直線時,已對訓(xùn)練樣本的先驗分布做出假設(shè)。例如,多數(shù)人選擇2號線為最優(yōu)分類直線可能的假設(shè)為訓(xùn)練樣本的位置在空間中具有測量誤差(選擇2號線為最優(yōu)分類直線的先驗分布假設(shè)不唯一)。
如圖一右圖所示,如果紅色實線圓圈的位置分布具有測量誤差,其實際位置處于虛線圓圈位置,那么1號線的分類效果不如2號線的分類效果;如果紅色叉的位置分布具有測量誤差,其實際位置處于虛線圓圈位置,那么3號線的分類效果不如2號線的分類效果,即2號線更可抵御訓(xùn)練樣本誤差,因此,在訓(xùn)練樣本的位置在空間中具有測量誤差的先驗假設(shè)下,2號線為最優(yōu)分類直線。
圖一,圖片來源:中國慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
二、尋找最優(yōu)分類直線
Vladimir Vapnik基于最優(yōu)化理論,對尋找最優(yōu)分類直線的回答如下:任意一條可將圓圈和叉完全分類的直線向一側(cè)平行移動,直至其穿過一側(cè)一個或幾個訓(xùn)練樣本;再向另一側(cè)平行移動,直至其穿過另一側(cè)一個或幾個訓(xùn)練樣本。如圖二所示,定義被穿過的數(shù)據(jù)(圖二中的紅圓圈和叉)為支持向量(Support Vector),定義穿過圓圈和叉的直線間的距離為間隔,則最優(yōu)分類直線為間隔最大的直線。
圖二,圖片來源:中國慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
根據(jù)Vladimir Vapnik的回答,因為前文所述問題中的2號線的間隔最大,所以2號線為最優(yōu)分類直線。
圖片來源:中國慕課大學(xué)《機(jī)器學(xué)習(xí)概論》
但僅根據(jù)間隔最大不能得出唯一的最優(yōu)分類直線,例如,前文所述問題中,所有與2號線平行的線均為間隔最大的直線。因此,為可得出唯一直線,最優(yōu)分類直線被限定處于穿過兩側(cè)支持向量的兩條直線中間的直線,即最優(yōu)直線與兩側(cè)支持向量的距離相等。
綜上,支持向量機(jī)尋找的最優(yōu)分類直線應(yīng)滿足:
(1)該直線可將訓(xùn)練數(shù)據(jù)完全分為兩類。
(2)該直線可最大化間隔。
(3)該直線處于間隔的中間,其與所有支持向量的距離相等。
審核編輯:劉清
-
向量機(jī)
+關(guān)注
關(guān)注
0文章
166瀏覽量
20934
原文標(biāo)題:機(jī)器學(xué)習(xí)相關(guān)介紹(7)——支持向量機(jī)(解決線性可分問題)
文章出處:【微信號:行業(yè)學(xué)習(xí)與研究,微信公眾號:行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
特征加權(quán)支持向量機(jī)
基于改進(jìn)支持向量機(jī)的貨幣識別研究
支持向量機(jī)在電力系統(tǒng)中的應(yīng)用
![<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>在電力系統(tǒng)中的應(yīng)用](https://file.elecfans.com/web2/M00/49/03/pYYBAGKhtDOAOZumAAAOWwedxxg027.jpg)
基于支持向量機(jī)(SVM)的工業(yè)過程辨識
![基于<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>(SVM)的工業(yè)過程辨識](https://file.elecfans.com/web2/M00/49/55/pYYBAGKhtEaAFqVIAAASrPzLBCc118.jpg)
基于標(biāo)準(zhǔn)支持向量機(jī)的陣列波束優(yōu)化及實現(xiàn)
![基于標(biāo)準(zhǔn)<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>的陣列波束優(yōu)化及實現(xiàn)](https://file.elecfans.com/web2/M00/49/4F/poYBAGKhwJ2ANqcKAAAXjXkSG8w655.jpg)
多分類孿生支持向量機(jī)研究進(jìn)展
基于支持向量機(jī)的測深激光信號處理
支持向量機(jī)的故障預(yù)測模型
人工智能之機(jī)器學(xué)習(xí)Analogizer算法-支持向量機(jī)(SVM)
介紹七本在注重打好數(shù)據(jù)科學(xué)的數(shù)學(xué)基礎(chǔ)上的技術(shù)讀物
什么是支持向量機(jī) 什么是支持向量
![什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b> 什么是<b class='flag-5'>支持</b><b class='flag-5'>向量</b>](https://file.elecfans.com/web1/M00/B1/09/o4YBAF33OXaAQ1J3AAEEMv6BbwI705.png)
介紹支持向量機(jī)的基礎(chǔ)概念
![介紹<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>的基礎(chǔ)概念](https://file1.elecfans.com/web2/M00/82/5E/wKgaomRLHVmARm3KAAA6gi0--g8345.png)
支持向量機(jī)(核函數(shù)的定義)
![<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機(jī)</b>(核函數(shù)的定義)](https://file1.elecfans.com/web2/M00/88/7B/wKgaomRoM6WAWgS-AAAYhy9MlcU332.png)
評論