什么是負二項分布?
負二項分布是與離散隨機變量一起使用的概率分布。這種類型的分布涉及為了獲得預定數量的成功而必須進行的試驗次數。正如我們將看到的,負二項分布與二項分布有關。此外,這種分布概括了幾何分布。
設置
我們將首先查看導致負二項分布的設置和條件。其中許多條件與二項設置非常相似。
- 我們有一個伯努利實驗。這意味著我們進行的每一次試驗都有一個明確的成功和失敗,這是**的結果。無論我們執(zhí)行多少次實驗,成功的概率都是恒定的。我們用17 p表示這個恒定的概率。18 19 20實驗重復21 X獨立試驗,意味著一項試驗的結果對后續(xù)試驗的結果沒有影響。
這三個條件與二項式分布中的條件相同。不同之處在于二項式隨機變量具有固定數量的試驗n。**X的值是0,1,2,…,n,所以這是一個有限分布。
負二項分布涉及直到我們成功r之前必須發(fā)生的試驗次數X。r是我們在之前選擇的整數我們開始進行試驗。隨機變量X仍然是離散的。但是,現(xiàn)在隨機變量可以取X=r,r+1,r+2。。。這個隨機變量是可數無限的,因為在我們獲得r成功之前可能需要任意長的時間。
示例
幫助理解負二項分布離子,值得考慮一個例子。假設我們翻轉一個公平的硬幣,我們問這個問題,"我們在第一個X硬幣翻轉中得到三個頭的概率是多少?"這種情況需要負二項式分布。
硬幣翻轉有兩種可能的結果巴西小知識,成功的概率是恒定的1/2,并且它們彼此獨立的試驗。我們要求在X硬幣翻轉后獲得前三個頭的概率。因此,我們必須至少翻轉硬幣三次。然后我們繼續(xù)翻轉,直到第三個頭出現(xiàn)。
為了計算與負二項分布相關的概率,我們需要更多信息。我們需要知道概率質量函數。
概率質量函數
負二項分布的概率質量函數可以稍微考慮一下來開發(fā)。每個試驗的成功概率由p給出。由于只有兩種可能的結果,這意味著概率失敗是恒定的(1-p)。
x和最終試驗必須發(fā)生第r次成功。之前的x-1試驗必須包含r-1成功。可能發(fā)生的方式數量由組合的數量給出:
C(x-1,r-1)=(x-1)!/[(r-1)?。?em>x-r)!]。
除此之外,我們還有獨立的事件,所以我們可以將概率乘以一起。將所有這些放在一起,我們得到概率質量函數
f(x)=C(x-1,r-1)pr(1-p)x-r。
發(fā)行名稱
我們現(xiàn)在能夠理解為什么這個隨機變量有一個否定的我們上面遇到的組合數量可以通過設置x-r=k:來編寫
(x-1)!/[(r-1)!(x-r)!]=(x+k-1)!/[(r-1)!k!]=(r+k-1)(x+k-2)。(r+1)(r)/k!=(-1)k(-r)(-r-1)。(-r-(k+1)/k!。
在這里,我們看到負二項式系數的出現(xiàn),當我們將二項式表達式(a+b)提升到負冪時使用該系數。
Mean
分布的均值很重要,因為它是表示分布中心的一種方式。這種類型的隨機變量的均值由其期望值給出,等于r/p。我們可以通過使用此分布的矩生成函數仔細證明這一點。
直覺也指導我們這個表達式。假設我們進行一系列試驗n直到我們獲得r成功。然后我們再次這樣做,只是這次需要n試驗。我們一直在繼續(xù),直到我們有大量的試驗組n=n+n+。+196 n 197
這些k試驗中的每一個都包含r成功,因此我們總共有k r成功。如果N很大,那么我們會期望看到大約Np成功。因此,我們將它們等同在一起并具有kr=Np。
我們做了一些代數,發(fā)現(xiàn)N/k=r/p。這個等式左側的分數是我們每個k試驗組。換句話說,這是進行實驗的預期次數,這樣我們總共有r成功。這正是我們希望找到的期望。我們看到這一點等于公式r/p.
方差
負二項分布的方差也可以通過使用矩生成函數來計算。當我們這樣做時,我們看到這個分布的方差由以下公式給出:
r(1-p)/p2
矩生成函數
這種類型的隨機變量的矩生成函數非常復雜?;叵胍幌?,矩生成函數被定義為期望值E[EtX]。通過將此定義與我們的概率質量函數一起使用,我們有:
M(t)=E[Et x]=∑(x-1)!/[(r-1)?。?em>x-r)!]etXpr(1-p)x-r
在一些代數之后,這變成M(t)=(pet)r[1-(1-p)et]-r
與其他分布的關系
我們已經在上面看到負二項分布在許多方面與二項分布是如何相似的。除了這種聯(lián)系之外,負二項分布是幾何分布的更一般版本。
幾何隨機變量X計算第一次成功發(fā)生之前所需的試驗次數。很容易看出這正是負二項分布,但r等于1。
存在負二項分布的其他公式。一些教科書將X定義為直到r失敗發(fā)生的試驗次數。
示例問題
我們將看一個示例性問題,看看如何使用負二項分布。假設籃球運動員是80%的自由投球運動員。此外,假設制作一個免費的throw獨立于制作下一個。對于這個玩家來說,第八個籃子是在第十次自由投擲時制作的概率是多少?
我們看到我們有一個負二項分布的設置。成功的恒定概率是0.8,所以失敗的概率是0.2。當r=8時,我們想要確定X=10的概率。
我們將這些值插入到概率質量函數中:
f(10)=C(10-1,8-1)(0.8)8(0.2)2=36(0.8)8(0.2)2,約為24%。
然后我們可以問這個玩家制作8個之前的平均投擲次數是多少。由于預期值是8/0.8=10,所以這是射擊次數。