莫斯科空襲與大象的故事#
二戰期間德軍空襲莫斯科時,一位平日從不躲防空洞的蘇聯統計學教授,某晚突然出現了。朋友驚訝地問他為何改變主意,他說:
「莫斯科有 700 萬人,昨晚他們命中了那頭大象。」
這個故事是 Port-Royal Logic 雷雨恐懼者的當代版本——但結局正好相反。教授對被炸機率瞭如指掌,但他依然改變了行為。本章要追問的是:
當對未來——甚至過去——的完整認識不可能時,手上的資訊有多代表性?我們該如何用新資訊更新舊信念?機率論究竟是數學玩具,還是嚴肅的預測工具?
Jacob Bernoulli:把機率拉進真實世界#
第一個認真思考「機率與資訊品質」連結的人,是 Daniel 的伯父 雅各布・伯努利(Jacob Bernoulli, 1654–1705)。
- 與牛頓同代,且自視為對手
- 思考這道難題二十年才完成著作
- 死前一年(1705)才接近完成;姪子 Nicolaus 直到 1713 年才出版《Ars Conjectandi》(《推測之術》)
1703 年的關鍵提問#
Jacob 給萊布尼茲的信寫道:
我們知道兩顆骰子擲出 7 比擲出 8 的賠率,卻不知 20 歲的男人能比 60 歲的男人活得更久的機率。難道不能透過觀察大量這樣的兩個年紀的男人,找出答案嗎?
萊布尼茲的回應潑了冷水——並用希臘文強調了關鍵字:「自然界確立模式來自事件的重複,但只在大部分情況下(CO; ETI ‘CO Tot))。」新的疾病不斷湧現,無論做多少屍體實驗,都不能限定未來的變化。
萊布尼茲這句「但只在大部分情況下」(but only for the most part)將迴盪整本書——它預告了統計推論的根本侷限。
真實世界 vs. 抽象世界#
Jacob 的洞察極其重要:
- 抽象賭局(如 Paccioli 的 balla):賠率可預先計算,無需資訊
- 真實世界:要預測誰會贏,需要關於球員「智力或身體靈巧度」的資訊——而這些資訊我們永遠不夠
真實是一連串相互關聯的事件,與機運遊戲根本不同:機運遊戲中每次擲骰彼此獨立,而真實世界中我們常常使用「一點」「許多」「不要太多」這種語言,而非精確的量化單位。
從先驗到後驗#
Jacob 把問題分為:
- 先驗(a priori):事件發生前就知道機率(如骰子有六面)
- 後驗(a posteriori):必須從事件後的資料中估計機率
真實世界幾乎總是後驗的。後驗本身就意味著實驗與信念程度的更新。
大數法則:被誤解的定理#
Jacob 的最終答案是 大數法則(Law of Large Numbers)。但這個定理常被誤解:
大數法則不是:
- 不是說「投越多次硬幣,正反各半的比例會變成 50%」
- 不是承諾下一次投擲會「拉回來」
- 不能在連敗中救你
它真正說的是:
**隨著投擲次數增加,觀測到的比例與真實比例的誤差超過某個閾值的機率將下降。**換言之:投得越多,誤差小於 2%(或任何指定值)的可能性就越大——但永遠不能完全消除誤差。
Jacob 的黑白石頭實驗#
Jacob 假想一個罐子,內含 3000 顆白石、2000 顆黑石(比例 3:2,但你不知道)。每次抽一顆記下顏色再放回去:
- 要達到「道德確定性」(moral certainty)——也就是大於 1000/1001 的機率,使結果落在真實比例 ±2% 內——需要 25,550 次抽樣
- Jacob 自己的故鄉巴塞爾當時人口還不到 25,550
Jacob 對「道德確定性」的措辭極其慎重:「機率是確定性的程度,與絕對確定性的差別,如同部分與整體之差。」他甚至建議:「為求實用,地方法官應為『道德確定性』設立固定界限。」
de Moivre:常態分配的誕生#
下一位接力者是 棣莫弗(Abraham de Moivre, 1667–1754)——
流亡的胡格諾派#
- 1667 年生於法國新教家庭
- 1685 年路易十四撤銷《南特敕令》,新教被禁
- 18 歲的 de Moivre 因信仰被監禁兩年餘
- 1688 年逃至倫敦,從此再未回法國
- 在倫敦終生未獲學術職位
- 靠教數學、為賭客與保險中介擔任機率顧問為生
- 在 Slaughter’s Coffee House 設立非正式辦公室
雖窮困潦倒,但他與牛頓是好友,30 歲入選皇家學會。牛頓有時會告訴學生:「去找 de Moivre 先生;這些事他比我懂。」
風險的第一個明確定義#
1711 年 de Moivre 在《Philosophical Transactions》發表《De Mensura Sortis》。1718 年擴充為英文版《Doctrine of Chances》(獻給牛頓),這可能是史上第一本明確把風險定義為虧損機率的著作:
「虧損的風險是期望的反面;其真確衡量是『冒險的金額 × 虧損的機率』。」
把 Jacob 的問題變得實用#
de Moivre 接手 Jacob/Nicolaus 的問題。他發現 Jacob 的方法過於繁重——25,550 次抽樣對誰都不可行。
1733 年(後加入《Doctrine of Chances》第二、三版),de Moivre 結合微積分與帕斯卡三角形(即二項定理)的結構,展示了一個革命性結果:
隨機抽樣的結果會繞著平均值分佈,呈現一種對稱的鐘形——這就是現代所謂的常態分配(normal distribution)或鐘形曲線(bell curve)。
標準差:分散的度量#
de Moivre 從鐘形曲線推導出標準差(standard deviation):
- 約 68% 的觀察落在平均值 ± 一個標準差
- 約 95% 落在平均值 ± 兩個標準差
這是現代風險管理的核心。標準差能告訴你:
- 一組資料是否具代表性
- Jacob 25,550 次抽樣為何能高度精確估計石頭比例
- 那位「腳泡烤箱、頭埋冰箱」的人,平均體感為什麼毫無意義
de Moivre 在文中以斜體強調:「雖然機運製造不規則,但隨時間流逝,這些不規則必將與『原始設計』所自然產生的秩序之復現相比,微不足道。」對他而言,秩序的浮現是上帝的計畫。
Thomas Bayes:從證據反推假設#
下一位接力者更出乎意料。托馬斯・貝氏(Thomas Bayes, 1701–1761)是一位英國肯特郡的不從國教派牧師:
- 拒絕英格蘭國教保留自天主教的儀式
- 生前未發表任何數學著作
- 入選皇家學會但被一本統計教科書形容為「enigmatic」(令人費解)
- 兩篇遺作直到死後才發表
- 其中之一——〈論機運論中之問題之解〉——讓他在統計史上不朽
Richard Price:把 Bayes 推上歷史#
Bayes 1761 年遺囑將論文草稿與 100 鎊留給「現在我猜在 Newington Green 講道的 Richard Price」。
Price 不只是牧師,他是:
- 道德高潔的自由主義者,相信宗教自由源於神聖
- 美國革命的支持者,曾照顧被遣回英國的美國戰俘
- Benjamin Franklin 的好友、Adam Smith 的舊識——曾與 Franklin 閱讀並評論《國富論》草稿
- 皇家學會的數學家——其機率工作令他入會
- 他的《Observations on Reversionary Payments》(1771)成為精算學之父級的經典
- 但他的研究因資料缺失導致死亡率高估、人壽保費過高——保險公司因此繁榮、英國政府因此年金支出巨虧
Bayes 的核心問題#
Bayes 把問題反過來:
在某個未知事件已發生若干次、未發生若干次的情況下,該事件單次發生機率落在任意兩個可指定機率之間的機率為何?
這是 Jacob Bernoulli 命題的逆向版本:Jacob 問「需多少次觀察才能達到某種確定性」,Bayes 問「給定這些觀察,真實機率落在某區間的機率為何」。
撞球桌的妙喻#
Bayes 用一個對牧師而言很奇特的比喻——撞球桌:
- 第一個球任意停在桌上某處
- 第二個球反覆滾出,記錄它停在第一個球右邊(成功)或左邊(失敗)的次數
- 從第二個球的成敗紀錄,推測第一個球的位置
這就是 貝氏定理(Bayes’ theorem)的精髓——用新資訊持續修正對舊資訊的估計。第一個球代表先驗(priors);第二個球的反覆滾動代表後驗(posteriors)的持續更新。
動態世界的本質#
數學家 A.F.M. Smith 概括得好:「任何試圖在複雜不確定下給出單一答案的科學推論方法,對我而言都是理性學習過程的極權諷刺。」貝氏的哲學是:在動態世界中,不確定下沒有單一答案——只有不斷修正的信念。
啟蒙時代的應用#
從 Jacob Bernoulli、de Moivre 到 Bayes,這條接力把「測量不確定性」這個原本不可思議的想法落地:
- 從鐘形曲線可知一組觀察是否獨立
- 從標準差可知偏差是否顯著
- 從貝氏更新可知信念該如何隨資料調整
用戶質檢的應用:別針工廠的經理希望瑕疵率不超過 0.01%。檢驗 100,000 支發現 12 支瑕疵——這偏差是顯著還是隨機?常態分配與標準差能直接給出答案。
不確定性的可量化#
本章三位主角的成就在於——他們證明了 「不確定性可被測量」:用 Hacking 對「確定性」的定義反過來說,當「我們的資訊正確而事件未發生」或「我們的資訊錯誤而事件發生」時,狀態就是「不確定」。
這是個大膽的對未知的攻擊。de Moivre 在著作中以大寫驚嘆:「若不被形上學的塵埃遮蔽眼目,我們將被引向那一條短而明顯的道路,去承認那位偉大的造物者與管理者。」
啟蒙運動的繼續#
我們已進入十八世紀。啟蒙運動把「追求知識」確立為人類最高的活動形式,再無禁忌阻止科學家擦去眼上的形上學塵埃。
1800 年之前所有馴服風險的進展,將在新世紀加速;維多利亞時代會給予再一次推力——而下一章的主角,正是那個把鐘形曲線變成「平均人」科學的時代。