蒙提霍爾問題(Monty Hall Problem)#
1990 年 Marilyn vos Savant 在《Parade》雜誌專欄回答了一道讀者問題:
你站在一個遊戲節目上,面前三扇門:一扇後是車,另兩扇後是山羊。你選了 1 號門,主持人(知道答案)打開 3 號門,是山羊。他問你要不要改選 2 號門。換門對你有利嗎?
直覺答案:剩兩扇門,50/50,換不換都一樣。但 vos Savant 的答案是:換門最好。她收到一萬多封讀者來信抗議,其中約一千封來自博士,許多人是數學家或科學家——他們全都錯了。
換門的勝率是 2/3,不換是 1/3。 這個結果由統計學家 Steve Selvin 在 1975 年就解出。連數學家 Paul Erdős 起初都不信,要看到電腦模擬才接受。
驗證表(假設車隨機放在 A、B、C 任一門後,玩家分別選 A、B、C):
| 選 A | 選 B | 選 C | |
|---|---|---|---|
| 車在 A | 不換贏 | 換門贏 | 換門贏 |
| 車在 B | 換門贏 | 不換贏 | 換門贏 |
| 車在 C | 換門贏 | 換門贏 | 不換贏 |
9 種情境中,換門贏的有 6 種。鴿子實驗中,鴿子能很快學會換門策略;人類卻常常即使被反覆訓練也學不會。
機率論的賭博起源#
機率論的誕生並非源自高深思辨:
- 17 世紀法國作家 Chevalier de Méré 1664 年向 Pascal 提出賭博問題
- Pascal 與 Fermat 共同發展出最早的機率框架
- Pascal 證明:擲一顆骰子四次至少出現一次 6 的機率(51.77%),略高於擲兩顆骰子 24 次至少出現一次雙 6(49.14%)
但人類大腦對隨機性極為遲鈍:
- 樂透中「1, 2, 3, 4, 5, 6」這組號碼與其他任何組合機率完全相同——但直覺覺得不可能
- 公平硬幣連續擲出 20 次正面,第 21 次反面「該」出現了——這就是「賭徒謬誤」(gambler’s fallacy)
- 真正的隨機事件沒有記憶——不會「補償」之前的結果
條件機率與貝氏定理(Bayes’ Theorem)#
考慮一個 99.99% 準確的 HIV 檢驗:陽性結果代表你有 99.99% 機率感染嗎?對絕大多數人不是。
情境一:低風險群體(baseline 感染率 1/10,000)
- 假設 10,000 人受檢
- 1 人真有病、會被驗出
- 9,999 人健康,但因 0.01% 偽陽性率,會有 1 人被誤判
- 共 2 個陽性結果,其中 1 個是真陽性
- 真陽性機率約 50%
情境二:高風險群體(如靜脈注射毒品使用者,感染率約 1.5%)
- 10,000 人中約 150 人感染並驗出
- 9,850 健康者中約 1 人偽陽性
- 真陽性機率 = 150/151 ≈ 99.34%
同一個檢驗,在不同基底感染率(base rate)下解讀完全不同。「先驗機率」(a priori probability,事前機率)是必須納入計算的脈絡——這就是貝氏定理(Bayes’ theorem)的核心。

HIV 檢驗結果在不同感染率族群中的可信度:(a) 低風險族群中陽性檢測 50% 為偽陽性;(b) 高風險族群中陽性檢測 99.34% 為真陽性。同一個檢驗,先驗機率不同,結論天差地別。
AIDS 危機初期,許多醫師被 HIV 檢驗的「99.99% 準確」迷惑,告訴低風險的偽陽性者「幾乎肯定」感染——導致憂鬱、自我放逐、極端行為。統計素養是性命攸關的事。
案例:Sally Clark 與 Meadow 的「73 萬分之一」災難#
英國律師 Sally Clark 1996 年痛失 11 週大的長子 Christopher,1998 年又痛失 8 週大的次子 Harry——兩起均疑似嬰兒猝死症候群(SIDS)。
知名兒科醫師 Sir Roy Meadow 出庭作證,提出他的「Meadow 法則」:「一起嬰兒猝死是悲劇,兩起是可疑,三起未經反證即為謀殺。」他用統計方法宣稱:
- 中產階級不吸菸家庭發生 SIDS 機率為 1/8,543
- 兩起獨立事件相乘:1/73,000,000(七千三百萬分之一)
- 比方說:連續四年壓中 80 賠 1 的賽馬冷門
媒體把此數字當成定罪鐵證。陪審團相信 Sally Clark 是冷血殺嬰犯,1999 年她被判刑入獄。
Meadow 犯了至少兩個嚴重統計錯誤:
錯誤一:把相關事件當作獨立事件
- 兩個事件機率相乘的前提是「彼此獨立」
- 但流行病學早已顯示 SIDS 在家族內有強相關——可能涉及基因或環境因子
- 直接相乘是統計學的低級錯誤
錯誤二:檢察官謬誤(Prosecutor’s Fallacy)
- 媒體與陪審團把「兩起 SIDS 的機率 1/73,000,000」誤讀為「Sally 無罪的機率為 1/73,000,000」
- 但要評估的是「兩起 SIDS」對比「母親連續殺嬰」這兩個假設的相對機率
- 多數情況下,SIDS 雙連發其實遠比連續殺嬰兩次更可能
英國皇家統計學會(Royal Statistical Society, RSS)發出嚴厲譴責,《英國醫學期刊》編輯撰寫社論呼籲「被告應享有與病患同樣的保護」,但首次上訴失敗。直到律師 Marilyn Stowe 義務協助,發現病理學家 Alan Williams 在 Harry 屍檢時驗出金黃色葡萄球菌——強烈暗示為敗血症致死,而此關鍵資訊從未告知辯方——Sally 才於 2003 年獲改判無罪。
Sally Clark 在獄中度過三年地獄。出獄後她「再也沒有康復」,2007 年因急性酒精中毒過世。Meadow 的證詞之後被重新檢視,多名因類似邏輯被冤獄的母親獲釋。
一般化的教訓:DNA 證據也不是無敵#
DNA 比對的可靠性同樣依賴貝氏邏輯:
- 假設某局部 DNA 特徵在族群中出現頻率為 1/1,000,000
- 若已鎖定一名嫌犯比對成功——這是強證據(hot hit)
- 若是把 DNA 拿去跟 1000 萬人的資料庫比對找配對——平均會找到 10 個「冷命中」(cold hits)
- 不分這兩種情境直接得出「機率 1/100 萬,所以幾乎肯定有罪」就是檢察官謬誤的另一種化身
這不是 DNA 技術的問題,而是人對統計的詮釋問題。同一份證據在不同的搜尋脈絡下,意義完全不同。
「三種謊言:謊言、該死的謊言、統計」#
統計常被當成欺騙工具,但統計學家 Frederick Mosteller 提醒我們:
「用統計說謊很容易,但不用統計說謊更容易。」沒有數據時,騙術更難驗證;數據存在卻被誤解時,至少有反駁的可能。
數字的價值不在於它的精確外表,而在於我們能否正確地把它放回脈絡——基底率、抽樣方式、是否獨立、選擇性偏差等。
教訓#
- 機率事件沒有記憶——「該輪到反面了」是徹頭徹尾的謬誤
- 看似乾淨的「99.99% 準確」需要結合先驗機率才能解讀
- 任何用統計指控他人時,請先確認:
- 涉及的事件是否真的彼此獨立?
- 對立假設的機率呢?比較兩者才是正確的提問
- 抽樣方式(單一比對 vs. 資料庫搜尋)改變了結論
- 媒體最愛單一的「驚悚數字」,但孤立的數字往往不是資訊,而是陷阱
- 對統計的誤解可以讓人坐冤獄、讓政策走偏方向、讓無辜者背負終生污名——這不是學術問題,是攸關生死的素養