The Law of Small Numbers • 快思慢想

從腎臟癌的地圖說起#

美國各郡的腎臟癌發生率分布，呈現出一個引人注目的規律：發生率最低的郡，幾乎清一色是人口稀疏的農村地區，位於中西部、南部和西部。

你的 System 1 很可能立刻開始建構因果故事：「農村空氣清新、飲食純樸、生活壓力低……」然而同樣的資料還有另一面：發生率最高的郡，也幾乎全是人口稀疏的農村地區。

因果故事瞬間失靈。真正的解釋不是農村生活方式，而是樣本數太小。

重點： 小樣本的統計結果變異性極大，極端數值（無論高低）更容易出現在小樣本中，而非大樣本。這是純粹的數學性質，與當地任何特質無關。

大數法則（Law of Large Numbers） 說的是：樣本夠大時，樣本統計量會收斂到母體真實值。統計學的根基。

小數法則（Law of Small Numbers） 是 Kahneman 與 Amos Tversky 用來諷刺的說法：人們直覺上相信，即使是小樣本也應該高度代表母體——彷彿大數法則對小樣本也成立。

Kahneman 在密西根大學主持研討會時，詢問一群研究者：你們在設計實驗時，樣本數是怎麼決定的？答案令人震驚——幾乎所有人都憑直覺選擇，而非透過統計計算。結果是他們普遍使用了過小的樣本，讓自己暴露在 50% 機率無法複製真實效應的風險之下。

補充： Kahneman 與 Tversky 發表的論文〈Belief in the Law of Small Numbers〉指出，即使是訓練有素的統計學家，也對小樣本抱有過度的直覺信心。這個問題普遍存在於心理學研究社群中。

在一項電話民調中，300 名長者有 60% 支持某位候選人。這個結果的「故事」是什麼？你的腦袋很可能直接跳到結論：「長者普遍支持他。」

但 System 1 跳過了一個關鍵問題：樣本數 300 夠可靠嗎？對 150 人或 3,000 人你可能反應不同，但對 300 人和 3,000 人你的直覺幾乎沒有差別——這就是問題所在。人們對樣本大小不夠敏感。

System 1 建構的是連貫的故事，而不是統計的精確性。它的輸出是信心，而非疑問。這種傾向會在許多情境中被放大：

注意： 「樣本數少，但結果很顯著」不代表發現了真實效應，反而應該更加謹慎。顯著性在小樣本中往往是統計噪音的產物。

我們是尋找模式的物種。大腦天生傾向把隨機事件解讀成有規律、有原因的。

Kahneman 提到在 Yom Kippur 戰爭期間，以色列空軍在分析「哪個中隊表現最差」時，幾乎每次都落在架次少的中隊。這不是因為那些飛行員技術差——正是小數法則在運作：少數幾次任務的隨機結果變異性更大。

同樣的邏輯也適用於著名的小學規模研究：Gates 基金會發現頂尖學校多是小規模學校，於是大力投資拆分大型學校、創辦小型學校。但如果他們同時查看「最差學校」，也會發現同樣多的小型學校。小學校只是更容易出現極端結果，不論是好是壞。

統計思維要求我們問：「這個差異多大程度可能只是抽樣的隨機波動？」因果思維則跳過這個問題，直接說：「一定有什麼原因造成了這個差異。」

「這家公司自從新 CEO 上任後連續三部電影賣座，但現在宣布他很有天分還太早——這只是三個樣本。」

「我不會因為這位交易員連續獲利就認定他是天才，在能估計這個連勝紀錄只是偶然的可能性之前，我不會下這個結論。」

「這個實驗的樣本量太小，沒辦法做出可靠推論。讓我們不要犯小數法則的錯誤。」

「我打算等到樣本夠大再公布結果，否則我們會面對過早下結論的壓力。」