文章詳情頁

Python 機器學習工具包SKlearn的安裝與使用

瀏覽：66日期：2022-06-19 16:35:07

目錄1、SKlearn 是什么2、SKlearn 的安裝3、SKlearn 內置數據集測試問題數據集實際問題數據集4、Sklearn 數模筆記的計劃1、SKlearn 是什么

Sklearn（全稱 SciKit-Learn），是基于 Python 語言的機器學習工具包。

Sklearn 主要用Python編寫，建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基礎上，也用 Cython編寫了一些核心算法來提高性能。

Sklearn 包括六大功能模塊：

分類（Classification）：識別樣本屬于哪個類別，常用算法有 SVM（支持向量機）、nearest neighbors（最近鄰）、random forest（隨機森林）回歸（Regression）：預測與對象相關聯的連續值屬性，常用算法有 SVR（支持向量機）、 ridge regression（嶺回歸）、Lasso 聚類（Clustering）：對樣本進行無監督的自動分類，常用算法有 k-Means（k均值）、spectral clustering（特征聚類）、mean-shift（均值漂移）數據降維（Dimensionality reduction）：減少相關變量維數，常用算法有 PCA（主成分分析）、feature selection（特征選擇）、non-negative matrix factorization（非負矩陣分解）模型選擇（Model Selection）：比較，驗證，選擇參數和模型，常用模塊有 grid search（網格搜索）、cross validation（交叉驗證）、 metrics（度量）數據處理（Preprocessing）：特征提取和歸一化，常用模塊有 preprocessing（預處理），feature extraction（特征提取）這六個功能模塊涉及 4類算法，分類、回歸屬于監督學習，聚類屬于非監督學習。

Python 機器學習工具包SKlearn的安裝與使用

官網地址：https://scikit-learn.org/

官方文檔中文版： https://www.scikitlearn.com.cn/

內置數據集：https://scikit-learn.org/stable/datasets.html

2、SKlearn 的安裝

Sklearn 的安裝要求：Python 3.5 以上版本，需要安裝 NumPy、SciPy、Pandas 工具包的支持，部分內容需要使用 Matplotlib、joblib 工具包。

pip 安裝命令：

pip3 install -U scikit-learnpip3 install -U scikit-learn -i https://pypi.douban.com/simple

注意 Sklearn 建議安裝 Numpy+mkl，可以在網址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本，下載后 pip3安裝：

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

3、SKlearn 內置數據集

Sklearn 內置了一些標準數據集可以用于練習和測試，都是經常被引用的經典問題，數據網址：https://scikit-learn.org/stable/datasets.htmlSklearn 標準數據集主要包括：

測試問題數據集波士頓房價：Boston house prices dataset 鳶尾花問題：Iris plants dataset 糖尿病數據：Diabetes dataset 手寫數字的識別：Optical recognition of handwritten digits dataset 體能訓練：Linnerrud dataset 葡萄酒鑒別：Wine recognition dataset 威斯康星州癌癥診斷：reast cancer wisconsin (diagnostic) dataset 實際問題數據集人臉數據：The Olivetti faces dataset 20個新聞文本數據：The 20 newsgroups text dataset 標記的人臉數據：The Labeled Faces in the Wild face recognition dataset 森林覆蓋類型：Forest covertypes 路透社新聞數據：RCV1 dataset 網絡入侵檢測數據：Kddcup 99 dataset 加州住房數據：California Housing dataset 4、Sklearn 數模筆記的計劃

粗略看看 Sklearn 的文檔，是一個功能強大和豐富的機器學習庫，遠遠超出了數學建模學習的范圍。基于數模教學的目的，本系列主要對應數模學習中的分類、聚類、降維問題，并不打算全面講解 Sklearn 的各種算法，而是以典型問題為例來介紹原理簡單、使用廣泛的基本方法，以便新手入門。

Python 機器學習工具包SKlearn的安裝與使用

以上就是Python 機器學習工具包SKlearn的安裝與使用的詳細內容，更多關于Python SKlearn的安裝與使用的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：python 制作一個gui界面的翻譯工具下一條：python process模塊的使用簡介

相關文章：

1. idea配置jdk的操作方法2. idea導入maven項目的方法3. 一文透徹詳解.NET框架類型系統設計要點4. asp知識整理筆記4（問答模式）5. HTML DOM setInterval和clearInterval方法案例詳解6. XMLHTTP資料7. python csv一些基本操作總結8. Python源碼解析之List9. 寫一個Vue loading 插件10. vue實現購物車案例

排行榜

					
					idea配置jdk的操作方法
idea導入maven項目的方法
Idea部署tomcat服務實現過程圖解
在Python中使用K-Means聚類和PCA主成分分析進行圖像壓縮
Spring如何基于xml實現聲明式事務控制
asp知識整理筆記4（問答模式）
HTML DOM setInterval和clearInterval方法案例詳解
寫一個Vue loading 插件
XMLHTTP資料
一文透徹詳解.NET框架類型系統設計要點
解決django中form表單設置action后無法回到原頁面的問題