Python統(tǒng)計學(xué)一數(shù)據(jù)的概括性度量詳解
一、數(shù)據(jù)的概括性度量
1、統(tǒng)計學(xué)概括:
統(tǒng)計學(xué)是應(yīng)用數(shù)學(xué)的一個分支,主要通過利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化的分析、總結(jié),并進(jìn)而進(jìn)行推斷和預(yù)測,為相關(guān)決策提供依據(jù)和參考。統(tǒng)計學(xué)主要又分為描述統(tǒng)計學(xué)和推斷統(tǒng)計學(xué)。給定一組數(shù)據(jù),統(tǒng)計學(xué)可以摘要并且描述這份數(shù)據(jù),這個用法稱作為描述統(tǒng)計學(xué)。另外,觀察者以數(shù)據(jù)的形態(tài)建立出一個用以解釋其隨機(jī)性和不確定性的數(shù)學(xué)模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統(tǒng)計學(xué)。
2、數(shù)據(jù)的概括性度量:
1)集中趨勢的度量:
眾數(shù):眾數(shù)(Mode),是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù),有時眾數(shù)在一組數(shù)中有好幾個。用M表示。
中位數(shù):中位數(shù)(Median)是指將數(shù)據(jù)按大小順序排列起來,形成一個數(shù)列,居于數(shù)列中間位置的那個數(shù)據(jù)。中位數(shù)用Me表示。計算公式:
四分位數(shù):四分位數(shù)(Quartile)把所有數(shù)值由小到大排列并分成四等份,處于三個分割點(diǎn)位置的數(shù)值就是四分位數(shù)。QL=下四分位數(shù),即第25百分位數(shù)( n / 4);QU=上四分位數(shù),即第75百分位數(shù)( 3n / 4)。
平均數(shù):算術(shù)平均數(shù)(arithmetic mean)算術(shù)平均數(shù)是指資料中各觀測值的總和除以觀測值個數(shù)所得的商,簡稱平均數(shù)或均數(shù)。
2)離散趨勢的度量:
四分位差:四分位差(quartile deviation),也稱為內(nèi)距或四分間距(inter-quartile range),它是上四分位數(shù)(QU,即位于75%)與下四分位數(shù)(QL,即位于25%)的差。
極差:全距(Range),又稱極差,是用來表示統(tǒng)計資料中的變異量數(shù)(measures of variation),其最大值與最小值之間的差距
方差:方差(variance)(樣本方差)是各個數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù),通常以σ2表示,方差的計算公式為:
標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差 (Standard Deviation),也稱均方差(Mean square error), 。
離散系數(shù):離散系數(shù)又稱變異系數(shù),CV(Coefficient of Variance)表示。CV(Coefficient of Variance):標(biāo)準(zhǔn)差與均值的比值。離散系數(shù)越小,數(shù)據(jù)的離散程度就越小,反之,亦然。
3)偏度與峰度的度量:
偏態(tài)系數(shù):偏度(Skewness)亦稱偏態(tài)、偏態(tài)系數(shù),偏度是統(tǒng)計數(shù)據(jù)分布偏斜方向和程度的度量,是統(tǒng)計數(shù)據(jù)分布非對稱程度的數(shù)字特征。Sk>0時,分布呈正偏態(tài)(右偏),Sk<0時,分布呈負(fù)偏態(tài)(左偏)。
峰態(tài)系數(shù):(Kurtosis)峰度系數(shù)是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標(biāo)。在正態(tài)分布情況下,峰度系數(shù)值是3。>3的峰度系數(shù)說明觀察量更集中,有比正態(tài)分布更短的尾部;<3的峰度系數(shù)說明觀測量不那么集中,有比正態(tài)分布更長的尾部,類似于矩形的均勻分布。峰度系數(shù)的標(biāo)準(zhǔn)誤用來判斷分布的正態(tài)性。峰度系數(shù)與其標(biāo)準(zhǔn)誤的比值用來檢驗正態(tài)性。如果該比值絕對值大于2,將拒絕正態(tài)性。
3、Python代碼實現(xiàn):
<span style='font-family:Microsoft YaHei;font-size:12px;'>#以下代碼基于Python3.5環(huán)境編寫import numpy as npimport stats as stsscores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23, 32, 34, 43, 41, 21, 23, 26, 26, 34, 42, 43, 25, 24, 23, 24, 44, 23, 14, 52,32, 42, 44, 35, 28, 17, 21, 32, 42, 12, 34]#集中趨勢的度量print(’求和:’,np.sum(scores))print(’個數(shù):’,len(scores))print(’平均值:’,np.mean(scores))print(’中位數(shù):’,np.median(scores))print(’眾數(shù):’,sts.mode(scores))print(’上四分位數(shù)’,sts.quantile(scores,p=0.25))print(’下四分位數(shù)’,sts.quantile(scores,p=0.75))#離散趨勢的度量print(’最大值:’,np.max(scores))print(’最小值:’,np.min(scores))print(’極差:’,np.max(scores)-np.min(scores))print(’四分位差’,sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))print(’標(biāo)準(zhǔn)差:’,np.std(scores))print(’方差:’,np.var(scores))print(’離散系數(shù):’,np.std(scores)/np.mean(scores))#偏度與峰度的度量print(’偏度:’,sts.skewness(scores))print(’峰度:’,sts.kurtosis(scores))</span>
以上這篇Python統(tǒng)計學(xué)一數(shù)據(jù)的概括性度量詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. ASP實現(xiàn)加法驗證碼2. CSS可以做的幾個令你嘆為觀止的實例分享3. PHP循環(huán)與分支知識點(diǎn)梳理4. Spring注入Date類型的三種方法總結(jié)5. ASP基礎(chǔ)知識Command對象講解6. PHP session反序列化漏洞超詳細(xì)講解7. ASP基礎(chǔ)入門第二篇(ASP基礎(chǔ)知識)8. ASP刪除img標(biāo)簽的style屬性只保留src的正則函數(shù)9. ASP動態(tài)網(wǎng)頁制作技術(shù)經(jīng)驗分享10. jsp+servlet簡單實現(xiàn)上傳文件功能(保存目錄改進(jìn))
