加上四個(gè)置信區(qū)間
在推論統(tǒng)計(jì)中,人口比例的置信區(qū)間依賴于標(biāo)準(zhǔn)正態(tài)分布來確定給定人口統(tǒng)計(jì)樣本的給定人口的未知參數(shù)。其中一個(gè)原因是,對(duì)于合適的樣本量,標(biāo)準(zhǔn)正態(tài)分布在估計(jì)二項(xiàng)分布方面做得很好。這是值得注意的,因?yàn)楸M管第一個(gè)分布是連續(xù)的,但第二個(gè)分布是離散的。
在構(gòu)建比例置信區(qū)間時(shí),必須解決許多問題。其中之一涉及所謂的“加四”置信區(qū)間,這會(huì)導(dǎo)致估計(jì)偏差。然而,這種未知人口比例的估計(jì)在某些情況下比無(wú)偏估計(jì)表現(xiàn)更好,特別是那些數(shù)據(jù)沒有成功或失敗的情況。
在大多數(shù)情況下,估計(jì)人口比例的**嘗試是使用相應(yīng)的樣本比例。我們假設(shè)有一個(gè)種群的個(gè)體含有某種性狀的比例p,然后我們從這個(gè)種群中形成一個(gè)大小n的蛋糕小知識(shí)簡(jiǎn)單隨機(jī)樣本。在這些n個(gè)體中,我們計(jì)算它們的數(shù)量Y具有我們好奇的特征?,F(xiàn)在我們使用我們的樣本來估計(jì)p。樣本比例Y/n是p的無(wú)偏估計(jì)量。
何時(shí)使用Plus-Four置信區(qū)間
當(dāng)我們使用加四個(gè)間隔時(shí),我們修改p的估計(jì)量。我們通過在觀察總數(shù)中加四個(gè)來做到這一點(diǎn),從而解釋短語(yǔ)“加四"然后我們將這四個(gè)觀察分為兩個(gè)假設(shè)成功和兩個(gè)失敗,這意味著我們?cè)诳倲?shù)中加兩個(gè)成功。最終結(jié)果是,我們將Y/n的每個(gè)實(shí)例替換為(Y+2)/(n+4),并替換為IME這個(gè)分?jǐn)?shù)用p表示,上面有平鋪。
樣本比例通常在估計(jì)人口比例方面非常有效。但是,在某些情況下,我們需要稍微修改估計(jì)量。統(tǒng)計(jì)實(shí)踐和數(shù)學(xué)理論表明,加四間隔的修改適合實(shí)現(xiàn)這一目標(biāo)。
應(yīng)該導(dǎo)致我們考慮加四個(gè)間隔的一種情況是偏斜樣本。很多時(shí)候,由于人口比例太小或太大,樣本比例也非常接近0或非常接近1。在這種情況下,我們應(yīng)該考慮一個(gè)加四間隔。
使用plus-four區(qū)間的另一個(gè)原因是如果我們的樣本量很小。在這種情況下,plus-four區(qū)間為人口比例提供了比使用典型置信區(qū)間進(jìn)行比例更好的估計(jì)。
使用Plus-Four置信區(qū)間的規(guī)則
plus-four置信區(qū)間是一種更準(zhǔn)確地計(jì)算推論統(tǒng)計(jì)數(shù)據(jù)的幾乎神奇的方法,只需向任何給定數(shù)據(jù)集添加四個(gè)假想觀察值,兩個(gè)成功和兩個(gè)失敗,它就能夠更準(zhǔn)確地預(yù)測(cè)數(shù)據(jù)集的比例這適合參數(shù)。
但是,四個(gè)置信區(qū)間并不適用于每個(gè)問題。它只能在數(shù)據(jù)集的置信區(qū)間大于90%且總體樣本量至少為10時(shí)使用。但是,數(shù)據(jù)集可以包含任意數(shù)量的成功和失敗,盡管在任何給定的人口和數(shù)據(jù)中沒有成功或沒有失敗時(shí),它確實(shí)效果更好。
請(qǐng)記住,與常規(guī)統(tǒng)計(jì)的計(jì)算不同,推論統(tǒng)計(jì)'計(jì)算依賴于數(shù)據(jù)抽樣來確定人口中最可能的結(jié)果n、 盡管加上四個(gè)置信區(qū)間可以校正更大的誤差范圍,但仍必須考慮該邊界才能提供最準(zhǔn)確的統(tǒng)計(jì)觀察結(jié)果。