什么是標準正態(tài)分布?
鐘形曲線出現(xiàn)在整個統(tǒng)計數(shù)據(jù)中。各種測量,例如種子的直徑,魚鰭的長度,SAT上的分數(shù)以及單個紙張的重量,在繪制它們時都形成鐘形曲線。所有這些曲線的一般形狀是相同的。但是所有這些曲線都是不同的,因為它們中的任何一個都不太可能具有相同的平均值或標準偏差。標準偏差較大的鐘形曲線較寬,標準偏差較小的鐘形曲線較細。具有較大平均值的鐘形曲線比具有較小平均值的鐘形曲線向右移動更多
一個例子
為了讓這更具體一些,讓我們假裝我們測量了500粒玉米的直徑。然后我們記錄,分析和繪制這些數(shù)據(jù)。發(fā)現(xiàn)數(shù)據(jù)集的形狀像鐘形曲線,平均值為1.2厘米,標準偏差為0.4厘米。現(xiàn)在假設我們用500個豆類做同樣的事情,我們發(fā)現(xiàn)它們的平均直徑為0.8厘米,標準偏差為0.04厘米。
上面繪制了這兩個數(shù)據(jù)集的鐘形曲線。紅色曲線對應于玉米數(shù)據(jù),綠色曲線對應于豆類數(shù)據(jù)。正如我們所看到的,這兩條曲線的中心和分布是不同的。
這些顯然是兩種不同的鐘形曲線。它們是不同的,因為它們的平均值和標準偏差不匹配。由于我們遇到的任何有趣的數(shù)據(jù)集都可以有任何正數(shù)作為標準偏差,任何數(shù)字都可以作為平均值,我們實際上只是在刮擦infinite個鐘形曲線的表面。這是很多曲線,太多了,無法處理。解決方案是什么?
一個非常特殊的鐘形曲線數(shù)學的一個目標是盡可能概括事物。有時幾個單獨的問題是單個問題的特殊情況。這種情況涉及貝爾curves就是一個很好的例證。我們可以將它們?nèi)筷P(guān)聯(lián)到一條曲線,而不是處理無限數(shù)量的鐘形曲線。這種特殊的鐘形曲線稱為標準鐘形曲線或標準正態(tài)分布。
標準鐘形曲線的平均值為零,標準偏差為1。任何其他鐘形曲線都可以通過直接計算與此標準進行比較。
標準正態(tài)分布的特征
任何鐘形曲線的所有屬性都適用于標準正態(tài)分布。
- 標準正態(tài)分布不僅具有零的平均值,而且具有零的中值和模式。這是曲線的中心。
- 標準正態(tài)分布在零處顯示鏡像對稱性。曲線的一半在零的左側(cè),一半的曲線在右側(cè)。如果曲線沿垂直線折疊為零,則兩半將完美匹配。
- 標準正態(tài)分布遵循68-95-99.7規(guī)則,這給我們一個簡單的方法來估計以下內(nèi)容:
- 大約68%的數(shù)據(jù)在-1和1之間。
- 大約95%的數(shù)據(jù)在-2和2之間。
- 大約99.7%的數(shù)據(jù)在-3和3之間。
為什么我們關(guān)心
在這一點上,我們可能會問,“為什么要打擾標準的鐘形曲線?“這似乎是一個不必要的復雜性,但隨著我們繼續(xù)統(tǒng)計,標準鐘形曲線將是有益的。
我們會發(fā)現(xiàn)統(tǒng)計中的一種問題需要我們在遇到的任何鐘形曲線的部分下方找到區(qū)域。鐘形曲線對于區(qū)域來說不是一個很好的形狀。它不像矩形或右三角形那樣具有簡單的面積公式。找到鐘形曲線的一部分區(qū)域可能很棘手,實際上很難,我們需要使用一些微積分。如果我們不標準化我們的鐘形曲線,我們每次我們想要找到一個區(qū)域時都需要做一些計算。如果我們對曲線進行標準化,所有計算面積的工作都是為我們完成的。
科普公眾號