統(tǒng)計(jì)的穩(wěn)健性

在統(tǒng)計(jì)學(xué)中,術(shù)語(yǔ)魯棒性或魯棒性是指根據(jù)研究希望實(shí)現(xiàn)的統(tǒng)計(jì)分析的特定條件,統(tǒng)計(jì)模型,測(cè)試和程序的強(qiáng)度。鑒于滿足這些研究條件,可以通過(guò)使用數(shù)學(xué)證明來(lái)驗(yàn)證模型是正確的。

許多模型基于處理真實(shí)世界數(shù)據(jù)時(shí)不存在的理想情況,因此,即使條件不完全滿足,模型也可以提供正確的結(jié)果。

因此,魯棒統(tǒng)計(jì)數(shù)據(jù)是從廣泛的概率分布中提取數(shù)據(jù)時(shí)產(chǎn)生良好性能的任何統(tǒng)計(jì)數(shù)據(jù),這些概率分布在很大程度上不受異常值或與給定數(shù)據(jù)集中模型假設(shè)的微小偏差的影響。換句話說(shuō),強(qiáng)大的統(tǒng)計(jì)數(shù)據(jù)可以抵抗結(jié)果中的錯(cuò)誤。

一種觀察常用穩(wěn)健統(tǒng)計(jì)程序的方法,只需要看看t程序,它使用假設(shè)檢驗(yàn)來(lái)確定最準(zhǔn)確的統(tǒng)計(jì)預(yù)測(cè)。

觀察T程序

對(duì)于魯棒性的一個(gè)例子,我們將考慮t-過(guò)程,其中包括具有未知群體標(biāo)準(zhǔn)偏差的群體平均值的置信區(qū)間以及關(guān)于群體平均值的假設(shè)檢驗(yàn)。

t-過(guò)程的使用假定如下:

  • 我們正在使用的數(shù)據(jù)集是人口的簡(jiǎn)單隨機(jī)樣本。
  • 我們從中抽樣的乳房健康小知識(shí)人口是正態(tài)分布的。

在現(xiàn)實(shí)生活中的例子中,統(tǒng)計(jì)學(xué)家很少有正態(tài)分布的人口,所以問(wèn)題變成了“我們的t-程序有多強(qiáng)大?”

一般來(lái)說(shuō),我們有一個(gè)簡(jiǎn)單的隨機(jī)樣本的條件比我們從nor采樣的條件更重要總體分布;其原因是中心極限定理確保了近似正態(tài)的抽樣分布-樣本量越大,樣本均值的抽樣分布越接近正態(tài)。

T過(guò)程如何充當(dāng)魯棒統(tǒng)計(jì)量

因此,t-程序的魯棒性取決于樣本量和樣本分布。對(duì)此的考慮包括:

  • 如果樣本量很大,這意味著我們有40個(gè)或更多的觀測(cè)值,那么即使分布偏斜,也可以使用t-程序。
  • 如果樣本量在15到40之間,那么我們可以對(duì)任何形狀分布使用t-程序,除非存在異常值或高度偏斜。
  • 如果樣本大小小于15,那么對(duì)于沒有異常值,單個(gè)峰值且?guī)缀鯇?duì)稱的數(shù)據(jù),我們可以使用t-過(guò)程。

在大多數(shù)情況下,通過(guò)數(shù)學(xué)統(tǒng)計(jì)學(xué)的技術(shù)工作已經(jīng)建立了穩(wěn)健性,幸運(yùn)的是,我們不一定需要做這些先進(jìn)的數(shù)學(xué)計(jì)算才能正確利用它們;我們只需要了解整體準(zhǔn)則對(duì)于穩(wěn)健性我們的具體統(tǒng)計(jì)方法。

T程序起到穩(wěn)健統(tǒng)計(jì)的作用,因?yàn)樗鼈兺ǔMㄟ^(guò)將樣本大小考慮為應(yīng)用程序的基礎(chǔ)來(lái)為這些模型產(chǎn)生良好的性能。

教育_1