從腎臟癌的地圖說起#
美國各郡的腎臟癌發生率分布,呈現出一個引人注目的規律:發生率最低的郡,幾乎清一色是人口稀疏的農村地區,位於中西部、南部和西部。
你的 System 1 很可能立刻開始建構因果故事:「農村空氣清新、飲食純樸、生活壓力低……」然而同樣的資料還有另一面:發生率最高的郡,也幾乎全是人口稀疏的農村地區。
因果故事瞬間失靈。真正的解釋不是農村生活方式,而是樣本數太小。
重點: 小樣本的統計結果變異性極大,極端數值(無論高低)更容易出現在小樣本中,而非大樣本。這是純粹的數學性質,與當地任何特質無關。
小數法則 vs. 大數法則#
大數法則(Law of Large Numbers) 說的是:樣本夠大時,樣本統計量會收斂到母體真實值。統計學的根基。
小數法則(Law of Small Numbers) 是 Kahneman 與 Amos Tversky 用來諷刺的說法:人們直覺上相信,即使是小樣本也應該高度代表母體——彷彿大數法則對小樣本也成立。
Kahneman 在密西根大學主持研討會時,詢問一群研究者:你們在設計實驗時,樣本數是怎麼決定的?答案令人震驚——幾乎所有人都憑直覺選擇,而非透過統計計算。結果是他們普遍使用了過小的樣本,讓自己暴露在 50% 機率無法複製真實效應的風險之下。
補充: Kahneman 與 Tversky 發表的論文〈Belief in the Law of Small Numbers〉指出,即使是訓練有素的統計學家,也對小樣本抱有過度的直覺信心。這個問題普遍存在於心理學研究社群中。
信心偏誤:懷疑不足,確信過度#
在一項電話民調中,300 名長者有 60% 支持某位候選人。這個結果的「故事」是什麼?你的腦袋很可能直接跳到結論:「長者普遍支持他。」
但 System 1 跳過了一個關鍵問題:樣本數 300 夠可靠嗎?對 150 人或 3,000 人你可能反應不同,但對 300 人和 3,000 人你的直覺幾乎沒有差別——這就是問題所在。人們對樣本大小不夠敏感。
System 1 建構的是連貫的故事,而不是統計的精確性。它的輸出是信心,而非疑問。這種傾向會在許多情境中被放大:
- 研究者對小樣本實驗的結果過度自信
- 投資人根據少數幾次成功就斷定某人是天才
- 管理者根據短期業績就做出人事決定
注意: 「樣本數少,但結果很顯著」不代表發現了真實效應,反而應該更加謹慎。顯著性在小樣本中往往是統計噪音的產物。
因果思維 vs. 統計思維#
我們是尋找模式的物種。大腦天生傾向把隨機事件解讀成有規律、有原因的。
Kahneman 提到在 Yom Kippur 戰爭期間,以色列空軍在分析「哪個中隊表現最差」時,幾乎每次都落在架次少的中隊。這不是因為那些飛行員技術差——正是小數法則在運作:少數幾次任務的隨機結果變異性更大。
同樣的邏輯也適用於著名的小學規模研究:Gates 基金會發現頂尖學校多是小規模學校,於是大力投資拆分大型學校、創辦小型學校。但如果他們同時查看「最差學校」,也會發現同樣多的小型學校。小學校只是更容易出現極端結果,不論是好是壞。
統計思維要求我們問:「這個差異多大程度可能只是抽樣的隨機波動?」因果思維則跳過這個問題,直接說:「一定有什麼原因造成了這個差異。」
日常對話中的應用#
「這家公司自從新 CEO 上任後連續三部電影賣座,但現在宣布他很有天分還太早——這只是三個樣本。」
「我不會因為這位交易員連續獲利就認定他是天才,在能估計這個連勝紀錄只是偶然的可能性之前,我不會下這個結論。」
「這個實驗的樣本量太小,沒辦法做出可靠推論。讓我們不要犯小數法則的錯誤。」
「我打算等到樣本夠大再公布結果,否則我們會面對過早下結論的壓力。」