統(tǒng)計(jì)數(shù)據(jù)有什么偏斜?

一些數(shù)據(jù)分布,如鐘形曲線(xiàn)或正態(tài)分布,洗護(hù)小知識(shí)是對(duì)稱(chēng)的。這意味著分布的右側(cè)和左側(cè)是彼此完美的鏡像。并非每個(gè)數(shù)據(jù)分布都是對(duì)稱(chēng)的。非對(duì)稱(chēng)的數(shù)據(jù)集被認(rèn)為是不對(duì)稱(chēng)的。分布不對(duì)稱(chēng)的度量稱(chēng)為偏度。

平均值,中位數(shù)和模式都是一組數(shù)據(jù)中心的度量。數(shù)據(jù)的偏度可以通過(guò)這些數(shù)量如何相互關(guān)聯(lián)來(lái)確定。

斜向右

向右傾斜的數(shù)據(jù)有一條長(zhǎng)尾,向右延伸。談?wù)撈蛴覀?cè)的數(shù)據(jù)集的另一種方式是說(shuō)它是正偏斜的。在這種情況下,平均值和中位數(shù)都大于模式。一般來(lái)說(shuō),大部分時(shí)間數(shù)據(jù)偏向右側(cè),平均值將大于中位數(shù)。總之,對(duì)于向右傾斜的數(shù)據(jù)集:

  • 總是:平均值大于模式
  • 總是:中位數(shù)大于模式
  • 大多數(shù)時(shí)間:平均值大于中位數(shù)

向左傾斜

當(dāng)我們處理向左傾斜的數(shù)據(jù)時(shí),情況會(huì)逆轉(zhuǎn)。偏向左側(cè)的數(shù)據(jù)具有延伸至左側(cè)的長(zhǎng)尾。談?wù)撈蜃髠?cè)的數(shù)據(jù)集的另一種方式是說(shuō)它是負(fù)偏斜的。在這種情況下,平均值和中位數(shù)都小于模式。一般來(lái)說(shuō),大部分時(shí)間數(shù)據(jù)偏向左側(cè),平均值將小于中位數(shù)。總之,對(duì)于偏向左側(cè)的數(shù)據(jù)集:

  • 總是:平均值小于模式
  • 總是:中位數(shù)小于模式
  • 大多數(shù)時(shí)間:平均值小于中位數(shù)

偏度測(cè)量

查看兩組數(shù)據(jù)并確定一組數(shù)據(jù)是一件事對(duì)稱(chēng),而另一個(gè)是不對(duì)稱(chēng)的。這是另一組查看兩組不對(duì)稱(chēng)數(shù)據(jù),并說(shuō)一組比另一組更偏斜。通過(guò)簡(jiǎn)單地查看分布圖來(lái)確定哪個(gè)更偏斜可能是非常主觀的。這就是為什么有辦法數(shù)值計(jì)算偏度的度量。

一種稱(chēng)為Pearson第一偏度系數(shù)的偏度度量是從模式中減去平均值,然后將此差異除以數(shù)據(jù)的標(biāo)準(zhǔn)偏差。劃分差異的原因是我們有一個(gè)無(wú)量綱的數(shù)量。這解釋了為什么偏向右側(cè)的數(shù)據(jù)具有正偏斜。如果數(shù)據(jù)集向右傾斜,則平均值大于模式,因此從平均值中減去模式給出正數(shù)。類(lèi)似的論點(diǎn)解釋了為什么偏向左側(cè)的數(shù)據(jù)具有負(fù)偏斜。

皮爾遜的第二偏度系數(shù)也用于測(cè)量數(shù)據(jù)集的不對(duì)稱(chēng)性。對(duì)于這個(gè)數(shù)量,我們從中位數(shù)中減去模式,將這個(gè)數(shù)字乘以3,然后除以標(biāo)準(zhǔn)差。

偏斜數(shù)據(jù)的應(yīng)用

在各種情況下,偏斜的數(shù)據(jù)都會(huì)自然產(chǎn)生。收入偏向右側(cè),因?yàn)榧词怪挥猩贁?shù)幾個(gè)收入數(shù)百萬(wàn)美元的人也會(huì)極大地影響平均值,并且沒(méi)有負(fù)收入。同樣,涉及產(chǎn)品壽命的數(shù)據(jù)(如品牌燈泡)向右傾斜。在這里,壽命可以最小的是零,而持久的燈泡會(huì)給數(shù)據(jù)帶來(lái)正偏差。

教育_1