Julie:四歲時就能流利閱讀#
Kahneman 用一個簡單問題開始這章:
Julie 目前是一所州立大學的大三學生。她四歲時就能流利閱讀。她現在的 GPA(大學成績平均分)是多少?
知道一點美國學術環境的人,很快就會給出一個數字,通常是 3.7 或 3.8。
但這個直覺判斷是怎麼產生的?Kahneman 分析了 System 1 在背後運作的幾個步驟:
| 步驟 | 名稱 | 說明 |
|---|---|---|
| 1 | 建立因果連結 | 閱讀能力與學術能力都是智識天賦的表現,兩者有因果關聯 |
| 2 | 強度匹配(intensity matching) | 四歲就能流利閱讀是非常出色的成就,所以 GPA 也應該很高 |
| 3 | 百分位轉換 | 把「四歲閱讀能力的出色程度」轉化為「GPA 的出色程度」,給出相應的數字 |
問題在於:這個預測是非常極端的,而且幾乎肯定是有偏誤的。
直覺預測的系統性偏誤#
Kahneman 在以色列國防軍的軍官候選人篩選工作中,親身體驗了直覺預測的問題。
他的任務是評估候選人,並預測他們在軍官學校的最終成績。他和同事收集了數百份預測,然後與實際成績比較。
結果令人沮喪:預測和實際成績幾乎沒有相關性。然而,即使在得知這個令人難堪的統計結果之後,他們仍然繼續充滿自信地做出預測——這就是 WYSIATI(What You See Is All There Is) 在作祟。
直覺預測的根本問題: 直覺預測是「非回歸的(nonregressive)」——它們直接把評估的強度轉化為預測的強度,完全沒有考慮:
- 預測的不確定性
- 證據的可靠性
- 均值回歸的必然存在
為什麼直覺預測系統性地過於極端#
要理解問題,先看一個數學框架。
假設我們試圖預測 GPA,影響 GPA 的因素可以分為兩類:
- 共享因素:同時影響四歲閱讀能力和 GPA 的因素(例如智識天賦、父母教育程度、家庭環境)
- 特異因素:只影響其中一個的因素(影響閱讀能力但不影響 GPA 的,或反之)
如果兩者之間的相關係數是 0.3(一個合理的估計),這意味著它們只有 30% 的決定因素是共享的,另外 70% 各自不同。
直覺預測的錯誤在於:我們做預測時,用了 100% 的證據強度,但正確的做法是只用 30%(即相關係數的比例)來調整預測。
強度匹配的偏誤: System 1 做的是強度匹配:「四歲閱讀能力在前 5%,所以 GPA 也應該在前 5%。」但正確的推理是:「因為相關性只有 0.3,所以我只應該把預測值從平均 GPA 往高處調整 30%,而不是 100%。」
修正直覺預測的四個步驟#
Kahneman 提出了一個具體可操作的流程,用來產生「無偏誤的預測(unbiased prediction)」:
第一步:確定基準預測(baseline prediction)
- 如果你對這個人完全沒有額外資訊,你的最佳猜測是什麼?
- 對 GPA 來說,基準就是全體學生的平均 GPA
- 對業務預測來說,基準就是同類企業的平均業績
第二步:確定你的直覺預測
- 根據手中的資訊,你的直覺給出的數字是多少?
- 這是你的「強度匹配」結果
第三步:估計相關性
- 你手中的證據,與你要預測的目標之間,相關性有多強?
- 相關性很高(例如 0.8):可以大幅依賴直覺預測
- 相關性很低(例如 0.2):必須大幅回歸基準
第四步:按比例調整
- 最終預測 = 基準 + (直覺預測 - 基準) × 相關係數
- 如果基準 GPA 是 3.2,直覺預測是 3.8,相關係數是 0.3:
- 調整後預測 = 3.2 + (3.8 - 3.2) × 0.3 = 3.2 + 0.18 = 3.38
這個流程的精髓: 從基準出發,讓直覺判斷調整預測的方向和幅度,但調整的幅度受相關係數約束。相關性越弱,越要回歸基準;相關性越強,越可以信任直覺。
Kim vs Jane:一個部門主管的選擇#
Kahneman 用一個生動的例子說明這個流程的實際應用:
一個部門需要聘用一位「科學生產力可能很高的人」。搜尋委員會縮小到兩位候選人:
- Kim:剛完成博士學位,推薦信出色,面試表現亮眼,但幾乎沒有研究記錄
- Jane:擔任博士後研究員三年,研究記錄優秀,但面試表現不如 Kim 亮眼
直覺會選 Kim——她留下了更強烈的印象。
但 Kahneman 的分析指出:Kim 只有少量的數據點(面試和推薦信),而小樣本的運氣成分更大,需要更強烈的均值回歸。Jane 有三年的研究記錄,樣本量更大,運氣的成分更小,預測更可靠。
在不確定性高的情況下,對小樣本的直覺印象,應該比對大樣本的統計記錄,進行更大幅度的回歸調整。
「故事性」的誘惑: 面試和推薦信能構成一個生動、令人信服的故事。但它們在預測長期表現上的有效性(相關性),往往遠低於我們的直覺感受。越是令人印象深刻的面試,越要警惕自己是否被「故事的連貫性」而非「證據的可靠性」所說服。
無偏誤預測的代價#
Kahneman 坦承,遵循無偏誤預測的流程,在心理上是令人不舒服的。
這個流程的特性是:
- 你永遠不會預測極端的成果(特別好或特別差)
- 你永遠不會有機會說「我早就知道他會成功」
- 你的預測看起來缺乏自信,總是偏向平均值
但這正是它的優點所在:無偏誤的預測在整體上的準確性更高,即使它讓每個個案看起來更「無聊」。
相比之下,非回歸的直覺預測會系統性地過度估計優秀者,過度低估平均者,在兩端都犯更大的錯誤。
中庸的價值: 一個無偏誤的預測者預測的是「可能發生的結果的分佈」,而不是「最令人信服的故事」。如果相關性為 0.3,他永遠不會預測任何人進入前 5%——即使手中有極端亮眼的證據,因為這樣做在統計上幾乎必然是高估。
從 Tom W 到直覺預測:一個統一視角#
回顧這一部分(Part 2)的主題,Kahneman 在這章提供了一個統一的框架:
無論是 Tom W 的科系預測,Linda 的職業判斷,還是 Julie 的 GPA 預測,它們都有相同的結構:
| 預測要素 | 問題 | 對應概念 |
|---|---|---|
| 基準預測 | 如果沒有額外資訊,最佳猜測是什麼? | 基本比率 |
| 直覺預測 | 手中的資訊把你的判斷推往哪個方向,推了多遠? | 代表性 |
| 修正幅度 | 證據的診斷性有多高,相關性有多強? | 約束代表性的影響 |
在離散類別的情況(Tom W 屬於哪個科系),正確的工具是 Bayesian 統計。在連續變數的情況(Julie 的 GPA),正確的工具是回歸分析。但兩者的精神是相同的:先錨定基準,再讓證據按比例調整,而不是讓直覺全面接管。
日常對話中的應用#
「那家新創公司有出色的概念驗證,但我們不應該說它一定會成功。讓我們別說真的相信它是下一個 Google,而是把預測回歸到平均值。」
「我們的直覺預測很樂觀,但可能太高了。讓我們考慮證據的強度,把預測往平均值方向調整。」
「這筆投資可能是個好主意,即使最佳猜測是它會失敗。讓我們別說真的相信它是個絕對失敗的案例。」
「我讀了那個品牌的一則評論,它非常出色。但那可能只是運氣。讓我們考慮有大量評論的品牌,選擇整體看起來最好的那個。」