莫斯科空襲與大象的故事#

二戰期間德軍空襲莫斯科時,一位平日從不躲防空洞的蘇聯統計學教授,某晚突然出現了。朋友驚訝地問他為何改變主意,他說:

「莫斯科有 700 萬人,昨晚他們命中了那頭大象。

這個故事是 Port-Royal Logic 雷雨恐懼者的當代版本——但結局正好相反。教授對被炸機率瞭如指掌,但他依然改變了行為。本章要追問的是:

當對未來——甚至過去——的完整認識不可能時,手上的資訊有多代表性?我們該如何用新資訊更新舊信念?機率論究竟是數學玩具,還是嚴肅的預測工具?

Jacob Bernoulli:把機率拉進真實世界#

第一個認真思考「機率與資訊品質」連結的人,是 Daniel 的伯父 雅各布・伯努利(Jacob Bernoulli, 1654–1705)。

  • 與牛頓同代,且自視為對手
  • 思考這道難題二十年才完成著作
  • 死前一年(1705)才接近完成;姪子 Nicolaus 直到 1713 年才出版《Ars Conjectandi》(《推測之術》)

1703 年的關鍵提問#

Jacob 給萊布尼茲的信寫道:

我們知道兩顆骰子擲出 7 比擲出 8 的賠率,卻不知 20 歲的男人能比 60 歲的男人活得更久的機率。難道不能透過觀察大量這樣的兩個年紀的男人,找出答案嗎?

萊布尼茲的回應潑了冷水——並用希臘文強調了關鍵字:「自然界確立模式來自事件的重複,但只在大部分情況下(CO; ETI ‘CO Tot))。」新的疾病不斷湧現,無論做多少屍體實驗,都不能限定未來的變化。

萊布尼茲這句「但只在大部分情況下」(but only for the most part)將迴盪整本書——它預告了統計推論的根本侷限。

真實世界 vs. 抽象世界#

Jacob 的洞察極其重要:

  • 抽象賭局(如 Paccioli 的 balla):賠率可預先計算,無需資訊
  • 真實世界:要預測誰會贏,需要關於球員「智力或身體靈巧度」的資訊——而這些資訊我們永遠不夠

真實是一連串相互關聯的事件,與機運遊戲根本不同:機運遊戲中每次擲骰彼此獨立,而真實世界中我們常常使用「一點」「許多」「不要太多」這種語言,而非精確的量化單位。

從先驗到後驗#

Jacob 把問題分為:

  • 先驗(a priori):事件發生前就知道機率(如骰子有六面)
  • 後驗(a posteriori):必須從事件後的資料中估計機率

真實世界幾乎總是後驗的。後驗本身就意味著實驗與信念程度的更新

大數法則:被誤解的定理#

Jacob 的最終答案是 大數法則(Law of Large Numbers)。但這個定理常被誤解:

大數法則不是

  • 不是說「投越多次硬幣,正反各半的比例會變成 50%」
  • 不是承諾下一次投擲會「拉回來」
  • 不能在連敗中救你

它真正說的是:

**隨著投擲次數增加,觀測到的比例與真實比例的誤差超過某個閾值的機率將下降。**換言之:投得越多,誤差小於 2%(或任何指定值)的可能性就越大——但永遠不能完全消除誤差。

Jacob 的黑白石頭實驗#

Jacob 假想一個罐子,內含 3000 顆白石、2000 顆黑石(比例 3:2,但你不知道)。每次抽一顆記下顏色再放回去:

  • 要達到「道德確定性」(moral certainty)——也就是大於 1000/1001 的機率,使結果落在真實比例 ±2% 內——需要 25,550 次抽樣
  • Jacob 自己的故鄉巴塞爾當時人口還不到 25,550

Jacob 對「道德確定性」的措辭極其慎重:「機率是確定性的程度,與絕對確定性的差別,如同部分與整體之差。」他甚至建議:「為求實用,地方法官應為『道德確定性』設立固定界限。

de Moivre:常態分配的誕生#

下一位接力者是 棣莫弗(Abraham de Moivre, 1667–1754)——

流亡的胡格諾派#

  • 1667 年生於法國新教家庭
  • 1685 年路易十四撤銷《南特敕令》,新教被禁
  • 18 歲的 de Moivre 因信仰被監禁兩年餘
  • 1688 年逃至倫敦,從此再未回法國
  • 在倫敦終生未獲學術職位
  • 靠教數學、為賭客與保險中介擔任機率顧問為生
  • 在 Slaughter’s Coffee House 設立非正式辦公室

雖窮困潦倒,但他與牛頓是好友,30 歲入選皇家學會。牛頓有時會告訴學生:「去找 de Moivre 先生;這些事他比我懂。

風險的第一個明確定義#

1711 年 de Moivre 在《Philosophical Transactions》發表《De Mensura Sortis》。1718 年擴充為英文版《Doctrine of Chances》(獻給牛頓),這可能是史上第一本明確把風險定義為虧損機率的著作:

虧損的風險是期望的反面;其真確衡量是『冒險的金額 × 虧損的機率』。」

把 Jacob 的問題變得實用#

de Moivre 接手 Jacob/Nicolaus 的問題。他發現 Jacob 的方法過於繁重——25,550 次抽樣對誰都不可行。

1733 年(後加入《Doctrine of Chances》第二、三版),de Moivre 結合微積分與帕斯卡三角形(即二項定理)的結構,展示了一個革命性結果:

隨機抽樣的結果會繞著平均值分佈,呈現一種對稱的鐘形——這就是現代所謂的常態分配(normal distribution)或鐘形曲線(bell curve)。

標準差:分散的度量#

de Moivre 從鐘形曲線推導出標準差(standard deviation):

  • 68% 的觀察落在平均值 ± 一個標準差
  • 95% 落在平均值 ± 兩個標準差

這是現代風險管理的核心。標準差能告訴你:

  • 一組資料是否具代表性
  • Jacob 25,550 次抽樣為何能高度精確估計石頭比例
  • 那位「腳泡烤箱、頭埋冰箱」的人,平均體感為什麼毫無意義

de Moivre 在文中以斜體強調:「雖然機運製造不規則,但隨時間流逝,這些不規則必將與『原始設計』所自然產生的秩序之復現相比,微不足道。」對他而言,秩序的浮現是上帝的計畫。

Thomas Bayes:從證據反推假設#

下一位接力者更出乎意料。托馬斯・貝氏(Thomas Bayes, 1701–1761)是一位英國肯特郡的不從國教派牧師:

  • 拒絕英格蘭國教保留自天主教的儀式
  • 生前未發表任何數學著作
  • 入選皇家學會但被一本統計教科書形容為「enigmatic」(令人費解)
  • 兩篇遺作直到死後才發表
  • 其中之一——〈論機運論中之問題之解〉——讓他在統計史上不朽

Richard Price:把 Bayes 推上歷史#

Bayes 1761 年遺囑將論文草稿與 100 鎊留給「現在我猜在 Newington Green 講道的 Richard Price」。

Price 不只是牧師,他是:

  • 道德高潔的自由主義者,相信宗教自由源於神聖
  • 美國革命的支持者,曾照顧被遣回英國的美國戰俘
  • Benjamin Franklin 的好友、Adam Smith 的舊識——曾與 Franklin 閱讀並評論《國富論》草稿
  • 皇家學會的數學家——其機率工作令他入會
  • 他的《Observations on Reversionary Payments》(1771)成為精算學之父級的經典
  • 但他的研究因資料缺失導致死亡率高估、人壽保費過高——保險公司因此繁榮、英國政府因此年金支出巨虧

Bayes 的核心問題#

Bayes 把問題反過來:

在某個未知事件已發生若干次、未發生若干次的情況下,該事件單次發生機率落在任意兩個可指定機率之間的機率為何

這是 Jacob Bernoulli 命題的逆向版本:Jacob 問「需多少次觀察才能達到某種確定性」,Bayes 問「給定這些觀察,真實機率落在某區間的機率為何」。

撞球桌的妙喻#

Bayes 用一個對牧師而言很奇特的比喻——撞球桌

  1. 第一個球任意停在桌上某處
  2. 第二個球反覆滾出,記錄它停在第一個球右邊(成功)或左邊(失敗)的次數
  3. 從第二個球的成敗紀錄,推測第一個球的位置

這就是 貝氏定理(Bayes’ theorem)的精髓——用新資訊持續修正對舊資訊的估計。第一個球代表先驗(priors);第二個球的反覆滾動代表後驗(posteriors)的持續更新。

動態世界的本質#

數學家 A.F.M. Smith 概括得好:「任何試圖在複雜不確定下給出單一答案的科學推論方法,對我而言都是理性學習過程的極權諷刺。」貝氏的哲學是:在動態世界中,不確定下沒有單一答案——只有不斷修正的信念。

啟蒙時代的應用#

從 Jacob Bernoulli、de Moivre 到 Bayes,這條接力把「測量不確定性」這個原本不可思議的想法落地:

  • 從鐘形曲線可知一組觀察是否獨立
  • 從標準差可知偏差是否顯著
  • 從貝氏更新可知信念該如何隨資料調整

用戶質檢的應用:別針工廠的經理希望瑕疵率不超過 0.01%。檢驗 100,000 支發現 12 支瑕疵——這偏差是顯著還是隨機?常態分配與標準差能直接給出答案。

不確定性的可量化#

本章三位主角的成就在於——他們證明了 「不確定性可被測量」:用 Hacking 對「確定性」的定義反過來說,當「我們的資訊正確而事件未發生」或「我們的資訊錯誤而事件發生」時,狀態就是「不確定」。

這是個大膽的對未知的攻擊。de Moivre 在著作中以大寫驚嘆:「若不被形上學的塵埃遮蔽眼目,我們將被引向那一條短而明顯的道路,去承認那位偉大的造物者與管理者。

啟蒙運動的繼續#

我們已進入十八世紀。啟蒙運動把「追求知識」確立為人類最高的活動形式,再無禁忌阻止科學家擦去眼上的形上學塵埃。

1800 年之前所有馴服風險的進展,將在新世紀加速;維多利亞時代會給予再一次推力——而下一章的主角,正是那個把鐘形曲線變成「平均人」科學的時代。