Chebyshev的不平等是什么?
Chebyshev不等式表示,樣本中至少有1-1/K2的數(shù)據(jù)必須落在與平均值的K標(biāo)準(zhǔn)偏差之內(nèi)(此處K是大于1的任何正實(shí)數(shù))。
任何正態(tài)分布或鐘形曲線形狀的數(shù)據(jù)集都有幾個特征。其中之一涉及數(shù)據(jù)相對于平均值的標(biāo)準(zhǔn)偏差數(shù)的擴(kuò)展。在正態(tài)分布中,我們知道68%的數(shù)據(jù)是均值的一個標(biāo)準(zhǔn)差,95%健康常識小知識是均值的兩個標(biāo)準(zhǔn)差,大約99%在均值的三個標(biāo)準(zhǔn)差之內(nèi)。
但是,如果數(shù)據(jù)集不是以鐘形曲線的形式分布的,那么不同的數(shù)量可能在一個標(biāo)準(zhǔn)偏差內(nèi)。Chebyshev的不等式提供了一種方法來知道哪些數(shù)據(jù)部分落在任何數(shù)據(jù)集的平均值的K標(biāo)準(zhǔn)偏差內(nèi)。
關(guān)于不等式的事實(shí)
我們還可以通過用概率分布替換短語“來自樣本的數(shù)據(jù)”來陳述上述不等式。這是因?yàn)镃hebyshev的不等式是概率的結(jié)果,然后可以應(yīng)用于統(tǒng)計(jì)。
值得注意的是,這種不等式是數(shù)學(xué)證明的結(jié)果。這不像平均值和模式之間的經(jīng)驗(yàn)關(guān)系,也不像連接范圍和標(biāo)準(zhǔn)偏差的經(jīng)驗(yàn)法則。
不等式的例證
為了說明不平等,我們將看看它的幾個值K:
- 對于K=2,我們有1-1/K2=1-1/4=3/4=75%。所以Chebyshev的不等式說,任何分布的數(shù)據(jù)值中至少有75%必須在平均值的兩個標(biāo)準(zhǔn)偏差之內(nèi)。
- 對于K=3,我們有1-1/K2=1-1/9=8/9=89%。所以Chebyshev的不平等說任何分布的數(shù)據(jù)值中至少有89%必須在平均值的三個標(biāo)準(zhǔn)偏差之內(nèi)。對于65 K 66 4,我們有1-1/67 K 68,69 2 70 1-1/16 15/16 93.75%。因此,Chebyshev的不等式表示,任何分布的至少93.75%的數(shù)據(jù)值必須在平均值的兩個標(biāo)準(zhǔn)偏差內(nèi)。
示例
假設(shè)我們在當(dāng)?shù)貏游镒∷恿斯返闹亓?,發(fā)現(xiàn)我們的樣本平均為20磅,標(biāo)準(zhǔn)差為3磅。通過使用Chebyshev的不平等,我們知道我們采樣的狗中至少有75%的重量與平均值有兩個標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差的兩倍給我們2 x 3=6。從20的平均值中減去并加上。這告訴我們,75%的狗的體重從14磅到26磅不等。
不等式的使用
如果我們更多地了解我們正在使用的分布,那么我們通??梢员WC更多的數(shù)據(jù)是遠(yuǎn)離平均值的一定數(shù)量的標(biāo)準(zhǔn)偏差。例如,如果我們知道我們有一個正態(tài)分布,那么95%的數(shù)據(jù)是平均值的兩個標(biāo)準(zhǔn)偏差。Chebyshev的不平等表示,在這種情況下,我們知道至少75%的數(shù)據(jù)是與平均值的兩個標(biāo)準(zhǔn)偏差。正如我們在這種情況下所看到的,它可能遠(yuǎn)遠(yuǎn)超過這個75%。
不平等的價值在于它給了我們一個“更糟的情況”,在這種情況下,我們對樣本數(shù)據(jù)(或概率分布)了解的**事情是均值和標(biāo)準(zhǔn)差。當(dāng)我們對數(shù)據(jù)一無所知時,Chebyshev的不等式提供了一些關(guān)于數(shù)據(jù)集如何擴(kuò)展的額外見解。
不等式的歷史
這種不等式以俄羅斯數(shù)學(xué)家Pafnuty Chebyshev的名字命名,他在1874年首次陳述了不等式而沒有證明。十年后馬爾可夫在他的博士論文中證明了不平等。由于如何用英語表示俄語字母表的差異,Chebyshev也拼寫為Tchebysheff。