蒙提霍爾、條件機率與檢察官謬誤 • 反智：不願說理的人是偏執

蒙提霍爾問題（Monty Hall Problem）#

1990 年 Marilyn vos Savant 在《Parade》雜誌專欄回答了一道讀者問題：

你站在一個遊戲節目上，面前三扇門：一扇後是車，另兩扇後是山羊。你選了 1 號門，主持人（知道答案）打開 3 號門，是山羊。他問你要不要改選 2 號門。換門對你有利嗎？

直覺答案：剩兩扇門，50/50，換不換都一樣。但 vos Savant 的答案是：換門最好。她收到一萬多封讀者來信抗議，其中約一千封來自博士，許多人是數學家或科學家——他們全都錯了。

換門的勝率是 2/3，不換是 1/3。 這個結果由統計學家 Steve Selvin 在 1975 年就解出。連數學家 Paul Erdős 起初都不信，要看到電腦模擬才接受。

驗證表（假設車隨機放在 A、B、C 任一門後，玩家分別選 A、B、C）：

	選 A	選 B	選 C
車在 A	不換贏	換門贏	換門贏
車在 B	換門贏	不換贏	換門贏
車在 C	換門贏	換門贏	不換贏

9 種情境中，換門贏的有 6 種。鴿子實驗中，鴿子能很快學會換門策略；人類卻常常即使被反覆訓練也學不會。

機率論的賭博起源#

機率論的誕生並非源自高深思辨：

17 世紀法國作家 Chevalier de Méré 1664 年向 Pascal 提出賭博問題
Pascal 與 Fermat 共同發展出最早的機率框架
Pascal 證明：擲一顆骰子四次至少出現一次 6 的機率（51.77%），略高於擲兩顆骰子 24 次至少出現一次雙 6（49.14%）

但人類大腦對隨機性極為遲鈍：

樂透中「1, 2, 3, 4, 5, 6」這組號碼與其他任何組合機率完全相同——但直覺覺得不可能
公平硬幣連續擲出 20 次正面，第 21 次反面「該」出現了——這就是「賭徒謬誤」（gambler’s fallacy）
真正的隨機事件沒有記憶——不會「補償」之前的結果

條件機率與貝氏定理（Bayes’ Theorem）#

考慮一個 99.99% 準確的 HIV 檢驗：陽性結果代表你有 99.99% 機率感染嗎？對絕大多數人不是。

情境一：低風險群體（baseline 感染率 1/10,000）

假設 10,000 人受檢
1 人真有病、會被驗出
9,999 人健康，但因 0.01% 偽陽性率，會有 1 人被誤判
共 2 個陽性結果，其中 1 個是真陽性
真陽性機率約 50%

情境二：高風險群體（如靜脈注射毒品使用者，感染率約 1.5%）

10,000 人中約 150 人感染並驗出
9,850 健康者中約 1 人偽陽性
真陽性機率 = 150/151 ≈ 99.34%

同一個檢驗，在不同基底感染率（base rate）下解讀完全不同。「先驗機率」（a priori probability，事前機率）是必須納入計算的脈絡——這就是貝氏定理（Bayes’ theorem）的核心。

HIV 檢驗結果在不同感染率族群中的可信度：(a) 低風險族群中陽性檢測 50% 為偽陽性；(b) 高風險族群中陽性檢測 99.34% 為真陽性。同一個檢驗，先驗機率不同，結論天差地別。

AIDS 危機初期，許多醫師被 HIV 檢驗的「99.99% 準確」迷惑，告訴低風險的偽陽性者「幾乎肯定」感染——導致憂鬱、自我放逐、極端行為。統計素養是性命攸關的事。

案例：Sally Clark 與 Meadow 的「73 萬分之一」災難#

英國律師 Sally Clark 1996 年痛失 11 週大的長子 Christopher，1998 年又痛失 8 週大的次子 Harry——兩起均疑似嬰兒猝死症候群（SIDS）。

知名兒科醫師 Sir Roy Meadow 出庭作證，提出他的「Meadow 法則」：「一起嬰兒猝死是悲劇，兩起是可疑，三起未經反證即為謀殺。」他用統計方法宣稱：

中產階級不吸菸家庭發生 SIDS 機率為 1/8,543
兩起獨立事件相乘：1/73,000,000（七千三百萬分之一）
比方說：連續四年壓中 80 賠 1 的賽馬冷門

媒體把此數字當成定罪鐵證。陪審團相信 Sally Clark 是冷血殺嬰犯，1999 年她被判刑入獄。

Meadow 犯了至少兩個嚴重統計錯誤：

錯誤一：把相關事件當作獨立事件

兩個事件機率相乘的前提是「彼此獨立」
但流行病學早已顯示 SIDS 在家族內有強相關——可能涉及基因或環境因子
直接相乘是統計學的低級錯誤

錯誤二：檢察官謬誤（Prosecutor’s Fallacy）

媒體與陪審團把「兩起 SIDS 的機率 1/73,000,000」誤讀為「Sally 無罪的機率為 1/73,000,000」
但要評估的是「兩起 SIDS」對比「母親連續殺嬰」這兩個假設的相對機率
多數情況下，SIDS 雙連發其實遠比連續殺嬰兩次更可能

英國皇家統計學會（Royal Statistical Society, RSS）發出嚴厲譴責，《英國醫學期刊》編輯撰寫社論呼籲「被告應享有與病患同樣的保護」，但首次上訴失敗。直到律師 Marilyn Stowe 義務協助，發現病理學家 Alan Williams 在 Harry 屍檢時驗出金黃色葡萄球菌——強烈暗示為敗血症致死，而此關鍵資訊從未告知辯方——Sally 才於 2003 年獲改判無罪。

Sally Clark 在獄中度過三年地獄。出獄後她「再也沒有康復」，2007 年因急性酒精中毒過世。Meadow 的證詞之後被重新檢視，多名因類似邏輯被冤獄的母親獲釋。

一般化的教訓：DNA 證據也不是無敵#

DNA 比對的可靠性同樣依賴貝氏邏輯：

假設某局部 DNA 特徵在族群中出現頻率為 1/1,000,000
若已鎖定一名嫌犯比對成功——這是強證據（hot hit）
若是把 DNA 拿去跟 1000 萬人的資料庫比對找配對——平均會找到 10 個「冷命中」（cold hits）
不分這兩種情境直接得出「機率 1/100 萬，所以幾乎肯定有罪」就是檢察官謬誤的另一種化身

這不是 DNA 技術的問題，而是人對統計的詮釋問題。同一份證據在不同的搜尋脈絡下，意義完全不同。

「三種謊言：謊言、該死的謊言、統計」#

統計常被當成欺騙工具，但統計學家 Frederick Mosteller 提醒我們：

「用統計說謊很容易，但不用統計說謊更容易。」沒有數據時，騙術更難驗證；數據存在卻被誤解時，至少有反駁的可能。

數字的價值不在於它的精確外表，而在於我們能否正確地把它放回脈絡——基底率、抽樣方式、是否獨立、選擇性偏差等。

教訓#

機率事件沒有記憶——「該輪到反面了」是徹頭徹尾的謬誤
看似乾淨的「99.99% 準確」需要結合先驗機率才能解讀
任何用統計指控他人時，請先確認：
- 涉及的事件是否真的彼此獨立？
- 對立假設的機率呢？比較兩者才是正確的提問
- 抽樣方式（單一比對 vs. 資料庫搜尋）改變了結論
媒體最愛單一的「驚悚數字」，但孤立的數字往往不是資訊，而是陷阱
對統計的誤解可以讓人坐冤獄、讓政策走偏方向、讓無辜者背負終生污名——這不是學術問題，是攸關生死的素養