高斯:足不出戶的數學王者#

德國數學家 卡爾・弗里德里希・高斯(Carl Friedrich Gauss, 1777–1855)——後 27 年只離開哥廷根(Göttingen)家中過夜一次。他拒絕了歐洲最頂級大學的教授席位與榮譽,只因不愛旅行。

神童的童年#

  • 父親是粗魯的勞工,鄙視兒子的早慧、處處刁難
  • 母親奮力保護他、鼓勵他向學
  • 18 歲發現關於 17 邊形幾何性質——兩千年來首見的突破
  • 博士論文證明了代數基本定理

拿破崙的禮物與羞辱#

  • 1807 年法軍逼近哥廷根,拿破崙下令保留該城,因為「世上最偉大的數學家住在這裡
  • 但同時要求高斯支付 2,000 法郎罰金(約合今 5,000 美元)
  • 法國數學家 拉普拉斯(Marquis Pierre Simon de Laplace)——尊高斯為「世上最偉大的數學家」——代為支付
  • 之後一位匿名德國仰慕者送來 1,000 法郎部分還給拉普拉斯

拉普拉斯是政治嗅覺敏銳的數學家:法王時代任皇家砲兵考官;共和時期高呼「對皇室不可熄滅的仇恨」;拿破崙上台後立刻表態支持——但拿破崙僅讓他做六週內政部長就將其撤換,評語:「他是一位低於平庸的行政官,凡事尋找微妙之處,把無限小的精神帶入政府事務。」拿破崙倒台後,拉普拉斯刪除了著作中對「拿破崙大帝」的獻辭——並寫下:「追求普世統治的帝國之衰落,精通機運微積分者可以高機率預見。」路易十八順勢封他為侯爵。

高斯的隱密與孤傲#

高斯與拉普拉斯不同,他極端隱密:

  • 大量重要研究從未發表,迫使後人重新發現
  • 已發表者重結果輕方法,常令後輩痛苦地反向推算
  • 傳記者 Eric Temple Bell 認為:「若高斯願意分享,數學或許可以早 50 年抵達現代
  • 他輕蔑費馬最後定理:「我可以輕易列出無數類似命題,無法證明也無法反駁

從天文到大地測量#

Ceres 的軌道#

1800 年義大利天文學家發現小行星 Ceres。1801 年高斯計算其軌道——憑藉極稀的資料與 Ceres 的快速公轉,他完成了精準預測。從此他能在一兩個小時內算出彗星軌道——其他科學家通常需三至四天。

測量學與最早期的常態分配#

1816 年高斯接受巴伐利亞大地測量(geodesic survey)任務——他必須在崎嶇地形與「智力上低於他」的公務員打交道。這份痛苦差事一直延續到 1848 年,最終出版十六冊。

大地測量是用樣本距離估計地表,無法量遍每一寸。高斯發現:當測量數量增加,誤差繞著平均值對稱分佈——清楚地呈現出 83 年前 de Moivre 的鐘形曲線。

鐘形曲線:誤差的法則#

高斯的核心觀念:鐘形曲線不是表示準確,而是表示誤差

  • 若每次測量都絕對精確,就無需這套理論
  • 但生命是「相似而非等同的集合」——沒有任何單一觀察是完美樣本
  • 鐘形曲線把這團混亂變成秩序

高爾頓對這條曲線寫下動人的禮讚:

錯誤頻率法則……以從容與徹底的自我消融,統治於最瘋狂的混亂之中。群眾越大,它的支配越完美。這是非理性的至高法則——當大量混沌元素被掌握時,一種出乎意料、無比美麗的規律性就會顯露出來。」

課堂裡的鐘形曲線#

我們最早接觸鐘形曲線多半在學校:「按曲線」打分數。即使全班都優秀,最好的得 A、最差的得 D。許多自然現象——身高、中指長度——都呈鐘形分佈。

兩個必要條件#

  • 觀察數量足夠多
  • 觀察彼此獨立——像擲骰子那樣

1936 年《Literary Digest》預測羅斯福對藍登的總統大選,從電話簿與汽車登記名單寄出 1000 萬張投票卡。回收結果:藍登 59%、羅斯福 41%。實際選舉:羅斯福 61%、藍登 39%。1930 年代有電話有汽車的人並非美國選民的隨機樣本——他們的政治偏好被經濟條件嚴重塑形。

Quetelet:把鐘形曲線帶進社會#

比利時的 凱特勒(Adolphe Quetelet, 1796–1874)是高斯之外另一個鐘形曲線的傳道者:

  • 23 歲取得根特大學首位科學博士學位
  • 已研讀藝術、寫過詩、合著歌劇
  • 創辦倫敦皇家統計學會與國際統計大會
  • 在巴黎師事拉普拉斯等法國大師、習得機率與天文學

比利時人口統計與「平均人」#

Quetelet 的不朽創造是 l’homme moyen(平均人)。1835 年出版的《關於人的論述及其能力的發展》(A Treatise on Man and the Development of His Faculties)一書中,他描繪:

  • 各群體(罪犯、酒徒、士兵、死者)都有其「平均人」
  • 若一個人擁有平均人的所有特質,他將代表一切偉大、善良、美麗的事物

蘇格蘭士兵的胸圍#

最著名的實驗:5,738 名蘇格蘭士兵的胸圍量測幾乎完美呈鐘形分佈。他由此推論:差異是隨機而非系統性的——蘇格蘭士兵在這個維度上是同質的。

法國徵兵的舞弊#

但他在 100,000 名法國徵兵的身高分布中,發現「最矮一級的人數過多」——因為矮個子可以免役。Quetelet 推論:這個分佈被舞弊扭曲。鐘形曲線變成了識別異常的工具

Cournot 的批判:警告 Quetelismus#

法國數學家兼經濟學家 Antoine-Augustin Cournot 是 Quetelet 最尖銳的批評者:

  • 所有直角三角形邊長的平均,不會是直角三角形——一個完全平均的人,將不是人,而是某種怪物」
  • 統計上:人類測量背後可能藏著大量分類維度——年齡、地點、季節、出生時間、體重、血統、瞳孔顏色——「哪一個樣本算是平均嬰兒?

今日統計學家稱 Quetelet 式的過度推論為「資料挖掘」(data mining):「若你折磨資料夠久,數字會證明你想要的任何結論。」F.Y. Edgeworth 後來鑄造了「Quetelismus」一詞,諷刺到處發現假鐘形分佈的風氣。

鐘形曲線的限制:獨立性是必要條件#

一個關鍵的反向推理:若獨立性是常態分配的必要條件,那麼把資料是否符合鐘形曲線,當作觀察是否獨立的指標——便能推出許多有趣的結論。

股價是隨機漫步嗎?#

  • 1950 年代芝加哥大學的 Harry Roberts 用電腦生成隨機數字(與股價相同的均值與標準差),畫出的曲線與真實股價走勢無法區分
  • 1926–1995 年的 S&P 500:840 個月觀察、280 個季觀察、70 個年觀察
  • 月線變動的均值 +0.6%,標準差 5.8%;扣除上漲偏差後,正負月份幾乎一樣多——分佈接近完美對稱

S&P 500 月度變動分佈(1926 年 1 月至 1995 年 12 月,共 840 個月)—接近常態分佈但兩端有「不該有的凸起」

S&P 500 季度變動分佈(1926:1 至 1995:4,共 280 個季)

S&P 500 年度變動分佈(1926 至 1995,共 70 年)—一年以上的累積表現不再像鐘形曲線

但要注意:

  • 月觀察與季觀察的圖形邊緣有「不該有的凸起」
  • 1930 年代有兩個季度跌超過 1/3、兩個季度漲近 90%
  • 870 個月中應有 16-17 個極端事件,實際 21 個——而且其中過半在下行

結論:在極端處,市場不是隨機漫步。在極端處,市場更可能毀掉財富,而不是創造財富。股市是個有風險的地方。

對「常態」的提問#

到此我們的故事還主要關於數字。但接下來局面要變了:

  • 真實人生不像 Paccioli 的 balla——不是一連串獨立事件
  • 股市像隨機漫步,但不完全像
  • 平均有時是有用指引,常常會誤導
  • 有時數字毫無幫助,我們只能憑直覺與猜測前行

接下來這些章節要回答的問題:

  • 「正常」到底是什麼意思?
  • 任何特定的平均值能多代表「正常」?
  • 平均值作為行為指標有多穩定、多有力?
  • 當觀察偏離過去的平均,多大可能會回歸?回歸到哪裡?會停在平均處還是衝過頭?
  • 連漲五月後,是否「上去的必下來」?
  • 公司陷入麻煩時,會自我調整重回正軌嗎?
  • 躁鬱會不會自動擺向相反的一極?

許多風險決策的關鍵,正在於分辨正常 vs. 不正常

接力者:Galton#

沒有人「發明」過「正常」這個概念,正如沒有人「發明」過「平均」。但下一章的主角——維多利亞英格蘭的業餘科學家 法蘭西斯・高爾頓(Francis Galton)——將在高斯與其前人鋪好的基礎上,建造出一套協助人類辨別可測量風險與不確定性的工具。