前往主要內容
工商時報LOGO

機率概念為什麼對企業決策至關重要?

《平均數的誤解》書摘精選

如果兩項統計數據彼此完全獨立,意味著了解其中一項數據,對於解讀另一項數據毫無幫助。圖/freepik
如果兩項統計數據彼此完全獨立,意味著了解其中一項數據,對於解讀另一項數據毫無幫助。圖/freepik

已將目前網頁的網址複製到您的剪貼簿!

如果數學中的機率問題很難,那我們又何必在這個問題上耗費精力?原因在於,對了解企業數據而言,機率可謂極其重要。或更確切的說,機率論中的某些概念,對於企業而言至關重要。和第一章中的重要概念相同的是,這些有關機率的概念,也可以幫助我們避免錯誤解讀客戶數據。

不妨設想這樣一個案例。在你的客戶中,有20%的客戶住在英國西南地區,有20%的客戶年齡在65歲以上。請問你的客戶中,65歲以上且住在西南地區的客戶比例是多少?顯然,僅憑上述資訊無法推出答案。

有一種可能性,即所有65歲以上的客戶恰好都住在西南地區,畢竟那裡環境不錯,氣候也比較溫暖。在這種情況下,答案是20%,因為這兩項統計數字實際上描述的是相同的一群人。

但事實上,很可能的情況是,老年顧客是隨機分布在全國各地。在這種情況下,如果我們從居住在西南地區的這20%的客戶著手,由於條件並沒有指出西南地區客戶的年齡結構與其他地區有任何不同,因此我們可以合理假設,在這20%的西南地區客戶中,有20%的人超過65歲。也就是說,在我們的客戶中,65歲以上且住在西南地區的客戶比例只有20%的20%,即客戶總人數的4%。具體如圖表7-3所示。

當然,還存在更極端的情況。有可能所有65歲以上的客戶都住在別處。此時,65歲以上且住在西南地區的客戶比例為0%。

數據之間的獨立性

由此可見,由上述兩項統計數據,可以得到截然不同的答案。這主要取決於這兩項統計數據是否相互獨立(independent)。「獨立」這個詞,對於理解機率的工作原理太重要了。

它是用來衡量不同數據的重疊程度及相互影響程度的基本標準。如果兩項數據彼此完全獨立,意味著了解其中一項數據,對於了解另一項數據毫無幫助。由於數據彼此完全獨立,我們可以透過將兩項數據機率相乘的方式得出答案。我們剛剛得到的4%的結果,就是這樣算出來的。

在計算拋硬幣的機率時,我們也用到相同的計算方法。在知道了拋一次硬幣出現正面的機率為50%後,將50%與50%相乘,就得出了拋硬幣連續兩次出現正面的機率為25%。這種計算方法,就是建立在兩次拋硬幣的數據完全獨立的假設上。第一次拋出了硬幣的正面,對第二次拋硬幣的結果沒有任何影響。

如果改變這個假設條件,又會發生什麼?設想一下,你有一大袋特製硬幣,其中一半硬幣兩面均為正面,而另一半硬幣則兩面均為反面。此時,從袋子中隨機挑選一枚硬幣,拋出正面的機率為50%,和拋正常硬幣時相同。因為在這種情況下,你從袋子中挑選出兩面都是正面的硬幣其機率為50%。

1.場景一:從袋子中挑選一枚正常硬幣,連續拋出。如圖表7-4所示。

2.場景二:從裝有特製硬幣的袋子中挑選硬幣,一半的硬幣兩面均為正面,一半的硬幣兩面均為反面。如圖表7-5所示。

再次拋出硬幣時,由於這些特製硬幣的兩面是相同的,因此你會得到和第一次拋出後相同的答案。所以,如果你第一次拋出硬幣後出現了正面,那麼第二次拋也一定會出現正面。我們每次拋硬幣的結果不再是獨立的,連續拋出兩次正面的機率與拋出一次正面的機率相同,均為50%。

文章來源:伊恩.雪帕德著《平均數的誤解:正確的計算,卻帶來錯誤決策!商業人士如何解讀數據。》,任性出版提供

您可能感興趣的話題

返回頁首
LOADING

本網頁已閒置超過3分鐘。請點撃框外背景,或右側關閉按鈕(X),即可回到網頁。