從一場海上救援開始#

2013 年 7 月,美國海岸防衛隊接獲報案:一名漁夫在大西洋上 40 英里外的龍蝦船上失蹤。沒人知道確切時間與地點,搜救範圍超過 4,000 平方公里。

直升機飛行員 Mike Deal 中尉與同事知道機會渺茫——但能依靠一套神奇的演算法 Sarops(Search And Rescue Optimal Planning System)

  • 輸入模糊的失蹤時間與地點推估
  • 結合海流、風向等條件
  • 輸出最有可能的搜救範圍

隨著新資訊進入,Sarops 不斷更新地圖。七小時後,副駕駛在海浪中發現拼命揮手的漁夫。

Sarops 的核心思想,源自 18 世紀英國長老會牧師、業餘數學家**貝葉斯(Thomas Bayes,1702–1761)**所留下的公式。

貝葉斯神父的神奇法則#

貝葉斯神奇法則: 新的信念水準 = 舊的信念水準 + 新證據的權重

這個敘述很奇怪——通篇沒有「機率」、「頻率」或「隨機」。它談的是信念與證據

兩種機率#

  • 偶然機率(aleatory probability):來自「dice-player」拉丁字根,描述擲骰子等隨機事件
  • 認知機率(epistemic probability):源自希臘字「知識」,描述「我們的無知」——可隨證據減少

機率不只是「事件出現多頻繁」,也可量化「我們對某假設的相信程度」。 這是貝葉斯洞見的核心,也是科學的核心:把證據轉化為知識

貝葉斯定理的基本形式#

最基本的貝葉斯定理處理「條件機率」:

$$ \Pr(B \mid A) = \frac{\Pr(A \mid B) \times \Pr(B)}{\Pr(A)} $$

範例:紅色卡片中的方塊#

從一副牌隨機抽出一張,告訴你「它是紅色」,那麼是方塊的機率?

  • $\Pr(\text{red} \mid \text{diamond}) = 1$
  • $\Pr(\text{diamond}) = 1/4$
  • $\Pr(\text{red}) = 1/2$
  • $\Pr(\text{diamond} \mid \text{red}) = 1 \times (1/4) / (1/2) = 1/2$

注意:$\Pr(B \mid A) \neq \Pr(A \mid B)$,除非 $\Pr(A) = \Pr(B)$。 這個小細節,正是現代科學界數十年大規模誤用統計的根源(後續章節會看到)。

用 LR 更新信念#

更新後的賠率 = 似然比(Likelihood Ratio, LR)× 先驗賠率

$$ \text{Odds}(\text{belief} \mid \text{evidence}) = LR \times \text{Odds}(\text{belief}) $$

LR 衡量證據的權重,定義為:

$$ LR = \frac{\Pr(\text{evidence} \mid \text{belief is true})}{\Pr(\text{evidence} \mid \text{belief is false})} $$

  • 「證據在信念為真時很可能出現」+「在信念為假時不太可能出現」→ LR 高 → 證據強
  • 反之 → LR 低 → 證據弱

範例:乳房 X 光#

  • 先驗:60 多歲女性罹患乳癌賠率 0.05(5%)
  • 真陽性 80%、偽陽性 20% → LR = 0.8 / 0.2 = 4
  • 後驗賠率 = 4 × 0.05 = 0.2 → 機率 17%
  • 與第 18 章用直覺算出的 17% 完全一致

在資訊明確、可量化的情境下,貝葉斯定理毫無爭議。 爭議來自下一個問題:「先驗從何而來?」

「先驗」之問#

貝葉斯與後續的數學家拉普拉斯(Pierre Simon de Laplace)都意識到:要更新信念,必須先有「先驗信念」。

海岸防衛隊有「模糊先驗」#

模糊地猜測失蹤位置 → 證據累積 → 隨次更新 → 漸漸鎖定真實位置。

完全沒有先驗時怎麼辦?#

拉普拉斯提出**「不充分理由原則(Principle of Insufficient Reason)」或稱「無差異原則(Principle of Indifference)」**:對未知設成「均勻分布」當作先驗。

這帶動了貝葉斯-拉普拉斯方法在人口統計、醫學、天文等領域的廣泛應用——但也招來新一代科學家的猛烈攻擊。

頻率學派的反撲#

20 世紀的反對者擔心:「先驗」會讓研究者主觀加料,破壞科學客觀性。他們發展出**頻率學派(frequentism)**工具,刻意避開「主觀先驗」問題:

  • 先假設零假設為真(如「硬幣公平」)
  • 計算觀察到當前數據的機率(即 p 值)
  • 若 p 值很低 → 拒絕零假設

但這套邏輯藏著嚴重缺陷:它把 $\Pr(\text{evidence} \mid \text{coin is fair}) = \Pr(\text{coin is fair} \mid \text{evidence})$ 當成同一件事——這正是貝葉斯警告的條件機率亂翻轉錯誤。

數十年來大量「統計顯著」的發現,因此可能根本是錯的。

證據累積讓先驗變得不重要#

貝葉斯定理的關鍵特性:隨證據累積,初始猜測逐漸不重要——證據會自己說話。 這正是海岸防衛隊在大西洋上找到漁夫的方式。

貝葉斯方法的復興#

近年來貝葉斯方法逐漸被廣泛採用:

  • 過去計算複雜,現代廉價算力解決了這個瓶頸
  • 醫學、心理學、物理學、機器學習等領域開始重新接受
  • 連有些學者仍刻意避開「Bayesian」一詞以避免爭議——但勢頭難擋

結語#

機率法則不只適用於擲硬幣這類瑣碎隨機事件,也能量化「信念與證據」這類模糊概念,並把它們結合產生新洞見。 貝葉斯定理長期爭議,但越來越被視為理解證據的最佳工具