從一場海上救援開始#
2013 年 7 月,美國海岸防衛隊接獲報案:一名漁夫在大西洋上 40 英里外的龍蝦船上失蹤。沒人知道確切時間與地點,搜救範圍超過 4,000 平方公里。
直升機飛行員 Mike Deal 中尉與同事知道機會渺茫——但能依靠一套神奇的演算法 Sarops(Search And Rescue Optimal Planning System):
- 輸入模糊的失蹤時間與地點推估
- 結合海流、風向等條件
- 輸出最有可能的搜救範圍
隨著新資訊進入,Sarops 不斷更新地圖。七小時後,副駕駛在海浪中發現拼命揮手的漁夫。
Sarops 的核心思想,源自 18 世紀英國長老會牧師、業餘數學家**貝葉斯(Thomas Bayes,1702–1761)**所留下的公式。
貝葉斯神父的神奇法則#
貝葉斯神奇法則: 新的信念水準 = 舊的信念水準 + 新證據的權重
這個敘述很奇怪——通篇沒有「機率」、「頻率」或「隨機」。它談的是信念與證據。
兩種機率#
- 偶然機率(aleatory probability):來自「dice-player」拉丁字根,描述擲骰子等隨機事件
- 認知機率(epistemic probability):源自希臘字「知識」,描述「我們的無知」——可隨證據減少
機率不只是「事件出現多頻繁」,也可量化「我們對某假設的相信程度」。 這是貝葉斯洞見的核心,也是科學的核心:把證據轉化為知識。
貝葉斯定理的基本形式#
最基本的貝葉斯定理處理「條件機率」:
$$ \Pr(B \mid A) = \frac{\Pr(A \mid B) \times \Pr(B)}{\Pr(A)} $$
範例:紅色卡片中的方塊#
從一副牌隨機抽出一張,告訴你「它是紅色」,那麼是方塊的機率?
- $\Pr(\text{red} \mid \text{diamond}) = 1$
- $\Pr(\text{diamond}) = 1/4$
- $\Pr(\text{red}) = 1/2$
- $\Pr(\text{diamond} \mid \text{red}) = 1 \times (1/4) / (1/2) = 1/2$
注意:$\Pr(B \mid A) \neq \Pr(A \mid B)$,除非 $\Pr(A) = \Pr(B)$。 這個小細節,正是現代科學界數十年大規模誤用統計的根源(後續章節會看到)。
用 LR 更新信念#
更新後的賠率 = 似然比(Likelihood Ratio, LR)× 先驗賠率
$$ \text{Odds}(\text{belief} \mid \text{evidence}) = LR \times \text{Odds}(\text{belief}) $$
LR 衡量證據的權重,定義為:
$$ LR = \frac{\Pr(\text{evidence} \mid \text{belief is true})}{\Pr(\text{evidence} \mid \text{belief is false})} $$
- 「證據在信念為真時很可能出現」+「在信念為假時不太可能出現」→ LR 高 → 證據強
- 反之 → LR 低 → 證據弱
範例:乳房 X 光#
- 先驗:60 多歲女性罹患乳癌賠率 0.05(5%)
- 真陽性 80%、偽陽性 20% → LR = 0.8 / 0.2 = 4
- 後驗賠率 = 4 × 0.05 = 0.2 → 機率 17%
- 與第 18 章用直覺算出的 17% 完全一致
在資訊明確、可量化的情境下,貝葉斯定理毫無爭議。 爭議來自下一個問題:「先驗從何而來?」
「先驗」之問#
貝葉斯與後續的數學家拉普拉斯(Pierre Simon de Laplace)都意識到:要更新信念,必須先有「先驗信念」。
海岸防衛隊有「模糊先驗」#
模糊地猜測失蹤位置 → 證據累積 → 隨次更新 → 漸漸鎖定真實位置。
完全沒有先驗時怎麼辦?#
拉普拉斯提出**「不充分理由原則(Principle of Insufficient Reason)」或稱「無差異原則(Principle of Indifference)」**:對未知設成「均勻分布」當作先驗。
這帶動了貝葉斯-拉普拉斯方法在人口統計、醫學、天文等領域的廣泛應用——但也招來新一代科學家的猛烈攻擊。
頻率學派的反撲#
20 世紀的反對者擔心:「先驗」會讓研究者主觀加料,破壞科學客觀性。他們發展出**頻率學派(frequentism)**工具,刻意避開「主觀先驗」問題:
- 先假設零假設為真(如「硬幣公平」)
- 計算觀察到當前數據的機率(即 p 值)
- 若 p 值很低 → 拒絕零假設
但這套邏輯藏著嚴重缺陷:它把 $\Pr(\text{evidence} \mid \text{coin is fair}) = \Pr(\text{coin is fair} \mid \text{evidence})$ 當成同一件事——這正是貝葉斯警告的條件機率亂翻轉錯誤。
數十年來大量「統計顯著」的發現,因此可能根本是錯的。
證據累積讓先驗變得不重要#
貝葉斯定理的關鍵特性:隨證據累積,初始猜測逐漸不重要——證據會自己說話。 這正是海岸防衛隊在大西洋上找到漁夫的方式。
貝葉斯方法的復興#
近年來貝葉斯方法逐漸被廣泛採用:
- 過去計算複雜,現代廉價算力解決了這個瓶頸
- 醫學、心理學、物理學、機器學習等領域開始重新接受
- 連有些學者仍刻意避開「Bayesian」一詞以避免爭議——但勢頭難擋
結語#
機率法則不只適用於擲硬幣這類瑣碎隨機事件,也能量化「信念與證據」這類模糊概念,並把它們結合產生新洞見。 貝葉斯定理長期爭議,但越來越被視為理解證據的最佳工具。