文章詳情頁(yè)

詳解python 支持向量機(jī)(SVM)算法

瀏覽：2日期：2022-07-10 18:19:31

相比于邏輯回歸，在很多情況下，SVM算法能夠?qū)?shù)據(jù)計(jì)算從而產(chǎn)生更好的精度。而傳統(tǒng)的SVM只能適用于二分類(lèi)操作，不過(guò)卻可以通過(guò)核技巧（核函數(shù)），使得SVM可以應(yīng)用于多分類(lèi)的任務(wù)中。

本篇文章只是介紹SVM的原理以及核技巧究竟是怎么一回事，最后會(huì)介紹sklearn svm各個(gè)參數(shù)作用和一個(gè)demo實(shí)戰(zhàn)的內(nèi)容，盡量通俗易懂。至于公式推導(dǎo)方面，網(wǎng)上關(guān)于這方面的文章太多了，這里就不多進(jìn)行展開(kāi)了~

1.SVM簡(jiǎn)介

支持向量機(jī)，能在N維平面中，找到最明顯得對(duì)數(shù)據(jù)進(jìn)行分類(lèi)的一個(gè)超平面！看下面這幅圖：

詳解python 支持向量機(jī)(SVM)算法

如上圖中，在二維平面中，有紅和藍(lán)兩類(lèi)點(diǎn)。要對(duì)這兩類(lèi)點(diǎn)進(jìn)行分類(lèi)，可以有很多種分類(lèi)方法，就如同圖中多條綠線，都可以把數(shù)據(jù)分成兩部分。

但SVM做的，是找到最好的那條線（二維空間），或者說(shuō)那個(gè)超平面（更高維度的空間），來(lái)對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。這個(gè)最好的標(biāo)準(zhǔn)，就是最大間距。

至于要怎么找到這個(gè)最大間距，要找到這個(gè)最大間距，這里大概簡(jiǎn)單說(shuō)一下，兩個(gè)類(lèi)別的數(shù)據(jù)，到超平面的距離之和，稱(chēng)之為間隔。而要做的就是找到最大的間隔。

這最終就變成了一個(gè)最大化間隔的優(yōu)化問(wèn)題。

2.SVM的核技巧

核技巧，主要是為了解決線性SVM無(wú)法進(jìn)行多分類(lèi)以及SVM在某些線性不可分的情況下無(wú)法分類(lèi)的情況。

比如下面這樣的數(shù)據(jù)：

詳解python 支持向量機(jī)(SVM)算法

這種時(shí)候就可以使用核函數(shù)，將數(shù)據(jù)轉(zhuǎn)換一下，比如這里，我們手動(dòng)定義了一個(gè)新的點(diǎn)，然后對(duì)所有的數(shù)據(jù)，計(jì)算和這個(gè)新的點(diǎn)的歐式距離，這樣我們就得到一個(gè)新的數(shù)據(jù)。而其中，離這個(gè)新點(diǎn)距離近的數(shù)據(jù)，就被歸為一類(lèi)，否則就是另一類(lèi)。這就是核函數(shù)。

詳解python 支持向量機(jī)(SVM)算法

這是最粗淺，也是比較直觀的介紹了。通過(guò)上面的介紹，是不是和Sigmoid有點(diǎn)像呢？都是通過(guò)將數(shù)據(jù)用一個(gè)函數(shù)進(jìn)行轉(zhuǎn)換，最終得到結(jié)果，其實(shí)啊，Sigmoid就是一鐘核函數(shù)來(lái)著，而上面說(shuō)的那種方式，是高斯核函數(shù)。

這里補(bǔ)充幾點(diǎn)：

1.上面的圖中只有一個(gè)點(diǎn)，實(shí)際可以有無(wú)限多個(gè)點(diǎn)，這就是為什么說(shuō)SVM可以將數(shù)據(jù)映射到多維空間中。計(jì)算一個(gè)點(diǎn)的距離就是1維，2個(gè)點(diǎn)就是二維，3個(gè)點(diǎn)就是三維等等。。。 2.上面例子中的紅點(diǎn)是直接手動(dòng)指定，實(shí)際情況中可沒(méi)辦法這樣，通常是用隨機(jī)產(chǎn)生，再慢慢試出最好的點(diǎn)。 3.上面舉例這種情況屬于高斯核函數(shù)，而實(shí)際常見(jiàn)的核函數(shù)還有多項(xiàng)式核函數(shù)，Sigmoid核函數(shù)等等。

OK，以上就是關(guān)于核技巧（核函數(shù)）的初步介紹，更高級(jí)的這里也不展開(kāi)了，網(wǎng)上的教程已經(jīng)非常多了。

接下來(lái)我們繼續(xù)介紹sklearn中SVM的應(yīng)用方面內(nèi)容。

3.sklearn中SVM的參數(shù)

def SVC(C=1.0, kernel=’rbf’, degree=3, gamma=’auto_deprecated’, coef0=0.0, shrinking=True, probability=False, tol=1e-3, cache_size=200, class_weight=None, verbose=False, max_iter=-1, decision_function_shape=’ovr’, random_state=None) - C：類(lèi)似于Logistic regression中的正則化系數(shù)，必須為正的浮點(diǎn)數(shù)，默認(rèn)為 1.0，這個(gè)值越小，說(shuō)明正則化效果越強(qiáng)。換句話說(shuō)，這個(gè)值越小，越訓(xùn)練的模型更泛化，但也更容易欠擬合。- kernel：核函數(shù)選擇，比較復(fù)雜，稍后介紹- degree：多項(xiàng)式階數(shù)，僅在核函數(shù)選擇多項(xiàng)式（即“poly”）的時(shí)候才生效，int類(lèi)型，默認(rèn)為3。- gamma：核函數(shù)系數(shù)，僅在核函數(shù)為高斯核，多項(xiàng)式核，Sigmoid核（即“rbf“，“poly“ ，“sigmoid“）時(shí)生效。float類(lèi)型，默認(rèn)為“auto”（即值為 1 / n_features）。- coef0：核函數(shù)的獨(dú)立項(xiàng)，僅在核函數(shù)為多項(xiàng)式核核Sigmoid核（即“poly“ ，“sigmoid“）時(shí)生效。float類(lèi)型，默認(rèn)為0.0。獨(dú)立項(xiàng)就是常數(shù)項(xiàng)。- shrinking：不斷縮小的啟發(fā)式方法可以加快優(yōu)化速度。就像在FAQ中說(shuō)的那樣，它們有時(shí)會(huì)有所幫助，有時(shí)卻沒(méi)有幫助。我認(rèn)為這是運(yùn)行時(shí)問(wèn)題，而不是收斂問(wèn)題。- probability：是否使用概率評(píng)估，布爾類(lèi)型，默認(rèn)為False。開(kāi)啟的話會(huì)評(píng)估數(shù)據(jù)到每個(gè)分類(lèi)的概率，不過(guò)這個(gè)會(huì)使用到較多的計(jì)算資源，慎用！！- tol：停止迭代求解的閾值，單精度類(lèi)型，默認(rèn)為1e-3。邏輯回歸也有這樣的一個(gè)參數(shù)，功能都是一樣的。- cache_size：指定使用多少內(nèi)存來(lái)運(yùn)行，浮點(diǎn)型，默認(rèn)200，單位是MB。- class_weight：分類(lèi)權(quán)重，也是和邏輯回歸的一樣，我直接就搬當(dāng)時(shí)的內(nèi)容了：分類(lèi)權(quán)重，可以是一個(gè)dict（字典類(lèi)型），也可以是一個(gè)字符串'balanced'字符串。默認(rèn)是None，也就是不做任何處理，而'balanced'則會(huì)去自動(dòng)計(jì)算權(quán)重，分類(lèi)越多的類(lèi)，權(quán)重越低，反之權(quán)重越高。也可以自己輸出一個(gè)字典，比如一個(gè) 0/1 的二元分類(lèi)，可以傳入{0:0.1,1:0.9}，這樣 0 這個(gè)分類(lèi)的權(quán)重是0.1，1這個(gè)分類(lèi)的權(quán)重是0.9。這樣的目的是因?yàn)橛行┓诸?lèi)問(wèn)題，樣本極端不平衡，比如網(wǎng)絡(luò)攻擊，大部分正常流量，小部分攻擊流量，但攻擊流量非常重要，需要有效識(shí)別，這時(shí)候就可以設(shè)置權(quán)重這個(gè)參數(shù)。- verbose：輸出詳細(xì)過(guò)程，int類(lèi)型，默認(rèn)為0（不輸出）。當(dāng)大于等于1時(shí)，輸出訓(xùn)練的詳細(xì)過(guò)程。僅當(dāng)'solvers'參數(shù)設(shè)置為'liblinear'和'lbfgs'時(shí)有效。- max_iter：最大迭代次數(shù)，int類(lèi)型，默認(rèn)-1（即無(wú)限制）。注意前面也有一個(gè)tol迭代限制，但這個(gè)max_iter的優(yōu)先級(jí)是比它高的，也就如果限制了這個(gè)參數(shù)，那是不會(huì)去管tol這個(gè)參數(shù)的。- decision_function_shape：多分類(lèi)的方案選擇，有“ovo”，“ovr”兩種方案，也可以選則“None”，默認(rèn)是“ovr”，詳細(xì)區(qū)別見(jiàn)下面。- random_state：隨時(shí)數(shù)種子。

sklearn-SVM參數(shù)，kernel特征選擇

kernel：核函數(shù)選擇，字符串類(lèi)型，可選的有“l(fā)inear”，“poly”，“rbf”，“sigmoid”，“precomputed”以及自定義的核函數(shù)，默認(rèn)選擇是“rbf”。各個(gè)核函數(shù)介紹如下：

“l(fā)inear”：線性核函數(shù)，最基礎(chǔ)的核函數(shù)，計(jì)算速度較快，但無(wú)法將數(shù)據(jù)從低維度演化到高維度 “poly”：多項(xiàng)式核函數(shù)，依靠提升維度使得原本線性不可分的數(shù)據(jù)變得線性可分 “rbf”：高斯核函數(shù)，這個(gè)可以映射到無(wú)限維度，缺點(diǎn)是計(jì)算量比較大 “sigmoid”：Sigmoid核函數(shù)，對(duì)，就是邏輯回歸里面的那個(gè)Sigmoid函數(shù)，使用Sigmoid的話，其實(shí)就類(lèi)似使用一個(gè)一層的神經(jīng)網(wǎng)絡(luò) “precomputed”：提供已經(jīng)計(jì)算好的核函數(shù)矩陣，sklearn不會(huì)再去計(jì)算，這個(gè)應(yīng)該不常用 “自定義核函數(shù)”：sklearn會(huì)使用提供的核函數(shù)來(lái)進(jìn)行計(jì)算

說(shuō)這么多，那么給個(gè)不大嚴(yán)謹(jǐn)?shù)耐扑]吧樣本多，特征多，二分類(lèi)，選擇線性核函數(shù)樣本多，特征多，多分類(lèi)，多項(xiàng)式核函數(shù)樣本不多，特征多，二分類(lèi)/多分類(lèi)，高斯核函數(shù)樣本不多，特征不多，二分類(lèi)/多分類(lèi)，高斯核函數(shù)

當(dāng)然，正常情況下，一般都是用交叉驗(yàn)證來(lái)選擇特征，上面所說(shuō)只是一個(gè)較為粗淺的推薦。

sklearn-SVM參數(shù)，多分類(lèi)方案

其實(shí)這個(gè)在邏輯回歸里面已經(jīng)有說(shuō)過(guò)了，這里還是多說(shuō)一下。

原始的SVM是基于二分類(lèi)的，但有些需求肯定是需要多分類(lèi)。那么有沒(méi)有辦法讓SVM實(shí)現(xiàn)多分類(lèi)呢？那肯定是有的，還不止一種。

實(shí)際上二元分類(lèi)問(wèn)題很容易推廣到多元邏輯回歸。比如總是認(rèn)為某種類(lèi)型為正值，其余為0值。

舉個(gè)例子，要分類(lèi)為A，B，C三類(lèi)，那么就可以把A當(dāng)作正向數(shù)據(jù)，B和C當(dāng)作負(fù)向數(shù)據(jù)來(lái)處理，這樣就可以用二分類(lèi)的方法解決多分類(lèi)的問(wèn)題，這種方法就是最常用的one-vs-rest，簡(jiǎn)稱(chēng)OvR。而且這種方法也可以方便得推廣到其他二分類(lèi)模型中（當(dāng)然其他算法可能有更好的多分類(lèi)辦法）。

另一種多分類(lèi)的方案是Many-vs-Many(MvM)，它會(huì)選擇一部分類(lèi)別的樣本和另一部分類(lèi)別的樣本來(lái)做二分類(lèi)。

聽(tīng)起來(lái)很不可思議，但其實(shí)確實(shí)是能辦到的。比如數(shù)據(jù)有A，B，C三個(gè)分類(lèi)。

我們將A，B作為正向數(shù)據(jù)，C作為負(fù)向數(shù)據(jù)，訓(xùn)練出一個(gè)分模型。再將A，C作為正向數(shù)據(jù)，B作為負(fù)向數(shù)據(jù)，訓(xùn)練出一個(gè)分類(lèi)模型。最后B，C作為正向數(shù)據(jù)，C作為負(fù)向數(shù)據(jù)，訓(xùn)練出一個(gè)模型。

通過(guò)這三個(gè)模型就能實(shí)現(xiàn)多分類(lèi)，當(dāng)然這里只是舉個(gè)例子，實(shí)際使用中有其他更好的MVM方法。限于篇幅這里不展開(kāi)了。

MVM中最常用的是One-Vs-One（OvO）。OvO是MvM的特例。即每次選擇兩類(lèi)樣本來(lái)做二元邏輯回歸。

對(duì)比下兩種多分類(lèi)方法，通常情況下，Ovr比較簡(jiǎn)單，速度也比較快，但模型精度上沒(méi)MvM那么高。MvM則正好相反，精度高，但速度上比不過(guò)Ovr。

4.sklearn SVM實(shí)戰(zhàn)

我們還是使用鳶尾花數(shù)據(jù)集，不過(guò)這次只使用其中的兩種花來(lái)進(jìn)行分類(lèi)。首先準(zhǔn)備數(shù)據(jù)：

import matplotlib.pyplot as pltimport numpy as npfrom sklearn import svm,datasetsimport pandas as pdtem_X = iris.data[:, :2]tem_Y = iris.targetnew_data = pd.DataFrame(np.column_stack([tem_X,tem_Y]))#過(guò)濾掉其中一種類(lèi)型的花new_data = new_data[new_data[2] != 1.0]#生成X和YX = new_data[[0,1]].valuesY = new_data[[2]].values

然后用數(shù)據(jù)訓(xùn)練，并生成最終圖形

# 擬合一個(gè)SVM模型clf = svm.SVC(kernel=’linear’)clf.fit(X, Y)# 獲取分割超平面w = clf.coef_[0]# 斜率a = -w[0] / w[1]# 從-5到5，順序間隔采樣50個(gè)樣本，默認(rèn)是num=50# xx = np.linspace(-5, 5) # , num=50)xx = np.linspace(-2, 10) # , num=50)# 二維的直線方程yy = a * xx - (clf.intercept_[0]) / w[1]print('yy=', yy)# plot the parallels to the separating hyperplane that pass through the support vectors# 通過(guò)支持向量繪制分割超平面print('support_vectors_=', clf.support_vectors_)b = clf.support_vectors_[0]yy_down = a * xx + (b[1] - a * b[0])b = clf.support_vectors_[-1]yy_up = a * xx + (b[1] - a * b[0])# plot the line, the points, and the nearest vectors to the planeplt.plot(xx, yy, ’k-’)plt.plot(xx, yy_down, ’k--’)plt.plot(xx, yy_up, ’k--’)plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=80, facecolors=’none’)plt.scatter(X[:, 0].flat, X[:, 1].flat, c=’#86c6ec’, cmap=plt.cm.Paired)# import operator# from functools import reduce# plt.scatter(X[:, 0].flat, X[:, 1].flat, c=reduce(operator.add, Y), cmap=plt.cm.Paired)plt.axis(’tight’)plt.show()

最終的SVM的分類(lèi)結(jié)果如下：

詳解python 支持向量機(jī)(SVM)算法

以上就是詳解python 支持向量機(jī)(SVM)算法的詳細(xì)內(nèi)容，更多關(guān)于python SVM算法的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：python實(shí)現(xiàn)簡(jiǎn)單遺傳算法下一條：python利用線程實(shí)現(xiàn)多任務(wù)

相關(guān)文章：

1. 基于javaweb+jsp實(shí)現(xiàn)學(xué)生宿舍管理系統(tǒng)2. 多級(jí)聯(lián)動(dòng)下拉選擇框，動(dòng)態(tài)獲取下一級(jí)3. 如何封裝一個(gè)Ajax函數(shù)4. ASP.NET MVC實(shí)現(xiàn)樹(shù)形導(dǎo)航菜單5. Spring security 自定義過(guò)濾器實(shí)現(xiàn)Json參數(shù)傳遞并兼容表單參數(shù)(實(shí)例代碼)6. Django模板之基本的 for 循環(huán) 和 List內(nèi)容的顯示方式7. PHP擴(kuò)展之URL編碼、解碼及解析——URLs8. Laravel Eloquent ORM高級(jí)部分解析9. Java 接口和抽象類(lèi)的區(qū)別詳解10. Ajax常用封裝庫(kù)——Axios的使用

排行榜

					
					基于javaweb+jsp實(shí)現(xiàn)學(xué)生宿舍管理系統(tǒng)
多級(jí)聯(lián)動(dòng)下拉選擇框，動(dòng)態(tài)獲取下一級(jí)
如何封裝一個(gè)Ajax函數(shù)
ASP.NET MVC實(shí)現(xiàn)樹(shù)形導(dǎo)航菜單
PHP擴(kuò)展之URL編碼、解碼及解析——URLs
Django模板之基本的 for 循環(huán) 和 List內(nèi)容的顯示方式
Laravel Eloquent ORM高級(jí)部分解析
Java 接口和抽象類(lèi)的區(qū)別詳解
Spring security 自定義過(guò)濾器實(shí)現(xiàn)Json參數(shù)傳遞并兼容表單參數(shù)(實(shí)例代碼)
Ajax常用封裝庫(kù)——Axios的使用
jsp網(wǎng)頁(yè)實(shí)現(xiàn)貪吃蛇小游戲
				

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

詳解python 支持向量機(jī)(SVM)算法