二戰最高機密:貝葉斯破解 Enigma#
2012 年 4 月,英國政府通訊總部(GCHQ)解密了一份 44 頁的二戰技術文件——《機率在密碼學上的應用》(《The Applications of Probability to Cryptography》)。作者:艾倫・圖靈(Alan Turing)。
GCHQ 內部人員形容:「我們花了七十多年才把這份文件的果汁榨乾。」
這份文件確認了學界自 1970 年代以來的猜想—— 圖靈與布萊切利園的同事曾大量使用貝葉斯定理破解 Enigma 與 Lorenz 密碼機。
數十億億種可能設定#
德軍 Enigma 機可產生 **15 × 10¹⁸(150 億億)**種訊息加密設定。布萊切利園的負責人原本斷言此密碼「不可能破解」,但他低估了貝葉斯:
- 從攔截到的密文(觀察資料)反向推算最可能的設定
- 結合一點點線索,反覆迭代更新信念
- 最終加上世界第一台電子電腦 Colossus,連希特勒親自使用的 Lorenz 密碼機都被攻破
戰後同樣的方法可能用於 VENONA 計畫——這項持續至 1980 年的反情報行動揭穿了 Klaus Fuchs、Alger Hiss、Kim Philby 等知名冷戰間諜。
1951 年美國兩位數學家因被允許發表含貝葉斯思想的論文,立刻被蘇聯破譯員注意到——這也說明戰後貝葉斯方法為何在學界仍長期保密。 圖靈在布萊切利的同事 I. J. ‘Jack’ Good 戰後重返學界,常被迫聽人嘲弄貝葉斯,卻因保密規定無法用親身經驗反駁。
圖靈版貝葉斯定理#
圖靈與同事不喜歡複雜運算(加法比乘法簡單),於是把貝葉斯定理重塑成更直觀的形式:
新信念水準 = 舊信念水準 + 證據的權重(Weight of Evidence)
證據權重 = $\log(\text{LR})$ 其中 $LR$ 為「假設信念正確時觀察到該證據的機率」÷「信念錯誤時觀察到該證據的機率」
對數賠率的好處#
把機率(0 到 1)轉換為對數賠率(−∞ 到 +∞):
- −∞ = 絕對懷疑
- 0 = 沒有立場
- +∞ = 絕對確信
- 對稱、自然且優雅
- 也提醒我們:極端信念無法被任何證據改變——是不理性的
圖靈處理「先驗難題」的態度#
圖靈面對學界戰得頭破血流的「先驗難題」非常務實:
- 用硬事實 + 受過訓練的猜測組合
- 只要先驗不太離譜,證據累積後便逐漸無關
- 結果:戰勝軸心國,拯救無數生命
如何看懂證據?#
設「假設信念正確時看到證據的機率」= R,「假設信念錯誤時看到證據的機率」= W:
- R > W:證據加分,加強信念
- R < W:證據減分,削弱信念
- R = W:證據對信念完全無影響
- 無法估計 R 或 W:別輕下任何判斷
經典案例:「毛茛測試」#
孩子們把毛茛(buttercup)放在朋友下巴下,看是否反射黃光來判斷他「喜不喜歡奶油」。
- 「喜歡奶油的人下巴會發黃」是真陽性 → R 高
- 但幾乎所有人下巴都會發黃,無論喜不喜歡奶油 → W 也高
- 規則 3 警告:R ≈ W → 證據權重為 0
- 必須對「不喜歡奶油的人」做對照測試,才能判斷此測試的價值
應用:診斷檢測#
報導某新「神奇診斷」?必須問:
- 對患病者的真陽性率(R)有多少?
- 對未患病者的偽陽性率(W)有多少?
只給一邊,套規則 4,不該下任何判斷。
貝葉斯的當代應用#
科學#
- 臨床試驗:結合既有知識 + 新數據,更快、更可靠、用更少病患得出結論
- 古人類學:比較人類演化的不同假說
- 宇宙學:以前所未有的精度限制宇宙參數
日常工具#
- 線上搜尋
- 拼字校正
- 垃圾郵件過濾(vIA*g_rA D#Als 之類的變形拼法)
對抗網路犯罪#
英國公司 Darktrace(許多員工出身 GCHQ)用貝葉斯方法分析企業網路的「正常行為基線」,藉此偵測異常:
網路罪犯不論偽裝多久,最終仍會洩露行為特徵(窺探敏感檔案、下載資料)。 用貝葉斯持續更新「正常 vs 異常」的信念,正是當代網路安全的核心方法。 歷史正以驚人的方式重演:圖靈年代用貝葉斯打贏二戰,今天則用同套思維對抗網路犯罪。
結語#
即使沒有具體數字,貝葉斯定理仍能幫我們釐清「應該問什麼問題」。 它也提醒我們:當別人只給我們一半資訊時——甚至更少時——必須提高警覺。