人口方差置信區(qū)間的例子

總體方差給出了如何展開數(shù)據(jù)集的指示。不幸的是,通常不可能確切地知道這個(gè)總體參數(shù)是什么。為了彌補(bǔ)我們?nèi)狈χR,我們使用來自推理統(tǒng)計(jì)的主題,稱為置信區(qū)間。我們將看到一個(gè)如何計(jì)算總體方差置信區(qū)間的例子

置信區(qū)間公式

關(guān)于總體方差的(1-α)置信區(qū)間的公式。由以下一系列不平等給出:

[(n-1)s2]/B2n-1)s2]/A。

這里n是樣本大小,s2是樣本方差。數(shù)字A是具有n-1自由度的卡方分布點(diǎn),其中曲線下面積的α/2恰好位于左側(cè)>A。以類似的方式,數(shù)字B是相同卡方分布的點(diǎn),曲線下面積的α/2正好在B的右側(cè)。

預(yù)備

我們從具有10個(gè)值的數(shù)據(jù)集開始。這組數(shù)據(jù)值是通過簡單的隨機(jī)樣本獲得的:

97,7***4106120131,94,97,96102

需要一些探索性數(shù)據(jù)分析來表明沒有異常值。通過構(gòu)建莖葉圖,我們可以看到這些數(shù)據(jù)可能來自近似正態(tài)分布的分布。這意味著我們可以繼續(xù)尋找總體方差的95%置信區(qū)間。

樣本方差

我們需要用樣本方差來估計(jì)總體方差,用s2表示。所以我們首先計(jì)算這個(gè)統(tǒng)計(jì)量。本質(zhì)上,我們是平均偏離平均值的平方和。然而,相當(dāng)于將該總和除以n我們將其除以n-1。

我們發(fā)現(xiàn)樣本均值是104.2。使用這個(gè),我們得到的平均值的平方偏差之和由下式給出:

(97–104.2)2+(75–104.3)2+。+(96-104.2)96 2 97+(102-104.2)98 2 99 2495.6

我們將此總和除以10–1=9,以獲得277的樣本方差。生活常識百科寶典

卡方分布

我們現(xiàn)在轉(zhuǎn)向我們的卡方分布。由于我們有10個(gè)數(shù)據(jù)值,因此我們有9個(gè)自由度。由于我們需要中間95%的分布,因此兩個(gè)尾部中的每一個(gè)都需要2.5%。我們查閱卡方表或軟件,看到2.7004和19.023的表值包含了分布面積的95%。這些數(shù)字分別為AB

我們現(xiàn)在擁有我們需要的一切,我們準(zhǔn)備好組裝我們的置信區(qū)間。左端點(diǎn)的公式為[(n-1)s2]/B。這意味著我們的左端點(diǎn)是:

(9 x 277)/19.023=133

通過用A替換B可以找到正確的端點(diǎn):

(9 x 277)/2.7004=923

因此,我們有95%的信心人口差異在133到923之間。

人口標(biāo)準(zhǔn)差

當(dāng)然,由于標(biāo)準(zhǔn)偏差是方差的平方根,因此該方法可用于構(gòu)建總體標(biāo)準(zhǔn)偏差的置信區(qū)間。我們需要做的就是采取端點(diǎn)的平方根。結(jié)果將是標(biāo)準(zhǔn)偏差的95%置信區(qū)間。

科普_1