Taming Intuitive Predictions • 快思慢想

Julie：四歲時就能流利閱讀#

Kahneman 用一個簡單問題開始這章：

Julie 目前是一所州立大學的大三學生。她四歲時就能流利閱讀。她現在的 GPA（大學成績平均分）是多少？

知道一點美國學術環境的人，很快就會給出一個數字，通常是 3.7 或 3.8。

但這個直覺判斷是怎麼產生的？Kahneman 分析了 System 1 在背後運作的幾個步驟：

步驟	名稱	說明
1	建立因果連結	閱讀能力與學術能力都是智識天賦的表現，兩者有因果關聯
2	強度匹配（intensity matching）	四歲就能流利閱讀是非常出色的成就，所以 GPA 也應該很高
3	百分位轉換	把「四歲閱讀能力的出色程度」轉化為「GPA 的出色程度」，給出相應的數字

問題在於：這個預測是非常極端的，而且幾乎肯定是有偏誤的。

直覺預測的系統性偏誤#

Kahneman 在以色列國防軍的軍官候選人篩選工作中，親身體驗了直覺預測的問題。

他的任務是評估候選人，並預測他們在軍官學校的最終成績。他和同事收集了數百份預測，然後與實際成績比較。

結果令人沮喪：預測和實際成績幾乎沒有相關性。然而，即使在得知這個令人難堪的統計結果之後，他們仍然繼續充滿自信地做出預測——這就是 WYSIATI（What You See Is All There Is） 在作祟。

直覺預測的根本問題： 直覺預測是「非回歸的（nonregressive）」——它們直接把評估的強度轉化為預測的強度，完全沒有考慮：
預測的不確定性
證據的可靠性
均值回歸的必然存在

為什麼直覺預測系統性地過於極端#

要理解問題，先看一個數學框架。

假設我們試圖預測 GPA，影響 GPA 的因素可以分為兩類：

共享因素：同時影響四歲閱讀能力和 GPA 的因素（例如智識天賦、父母教育程度、家庭環境）
特異因素：只影響其中一個的因素（影響閱讀能力但不影響 GPA 的，或反之）

如果兩者之間的相關係數是 0.3（一個合理的估計），這意味著它們只有 30% 的決定因素是共享的，另外 70% 各自不同。

直覺預測的錯誤在於：我們做預測時，用了 100% 的證據強度，但正確的做法是只用 30%（即相關係數的比例）來調整預測。

強度匹配的偏誤： System 1 做的是強度匹配：「四歲閱讀能力在前 5%，所以 GPA 也應該在前 5%。」但正確的推理是：「因為相關性只有 0.3，所以我只應該把預測值從平均 GPA 往高處調整 30%，而不是 100%。」

修正直覺預測的四個步驟#

Kahneman 提出了一個具體可操作的流程，用來產生「無偏誤的預測（unbiased prediction）」：

第一步：確定基準預測（baseline prediction）

如果你對這個人完全沒有額外資訊，你的最佳猜測是什麼？
對 GPA 來說，基準就是全體學生的平均 GPA
對業務預測來說，基準就是同類企業的平均業績

第二步：確定你的直覺預測

根據手中的資訊，你的直覺給出的數字是多少？
這是你的「強度匹配」結果

第三步：估計相關性

你手中的證據，與你要預測的目標之間，相關性有多強？
相關性很高（例如 0.8）：可以大幅依賴直覺預測
相關性很低（例如 0.2）：必須大幅回歸基準

第四步：按比例調整

最終預測 = 基準 + (直覺預測 - 基準) × 相關係數
如果基準 GPA 是 3.2，直覺預測是 3.8，相關係數是 0.3：
- 調整後預測 = 3.2 + (3.8 - 3.2) × 0.3 = 3.2 + 0.18 = 3.38

這個流程的精髓： 從基準出發，讓直覺判斷調整預測的方向和幅度，但調整的幅度受相關係數約束。相關性越弱，越要回歸基準；相關性越強，越可以信任直覺。

Kim vs Jane：一個部門主管的選擇#

Kahneman 用一個生動的例子說明這個流程的實際應用：

一個部門需要聘用一位「科學生產力可能很高的人」。搜尋委員會縮小到兩位候選人：

Kim：剛完成博士學位，推薦信出色，面試表現亮眼，但幾乎沒有研究記錄
Jane：擔任博士後研究員三年，研究記錄優秀，但面試表現不如 Kim 亮眼

直覺會選 Kim——她留下了更強烈的印象。

但 Kahneman 的分析指出：Kim 只有少量的數據點（面試和推薦信），而小樣本的運氣成分更大，需要更強烈的均值回歸。Jane 有三年的研究記錄，樣本量更大，運氣的成分更小，預測更可靠。

在不確定性高的情況下，對小樣本的直覺印象，應該比對大樣本的統計記錄，進行更大幅度的回歸調整。

「故事性」的誘惑： 面試和推薦信能構成一個生動、令人信服的故事。但它們在預測長期表現上的有效性（相關性），往往遠低於我們的直覺感受。越是令人印象深刻的面試，越要警惕自己是否被「故事的連貫性」而非「證據的可靠性」所說服。

無偏誤預測的代價#

Kahneman 坦承，遵循無偏誤預測的流程，在心理上是令人不舒服的。

這個流程的特性是：

你永遠不會預測極端的成果（特別好或特別差）
你永遠不會有機會說「我早就知道他會成功」
你的預測看起來缺乏自信，總是偏向平均值

但這正是它的優點所在：無偏誤的預測在整體上的準確性更高，即使它讓每個個案看起來更「無聊」。

相比之下，非回歸的直覺預測會系統性地過度估計優秀者，過度低估平均者，在兩端都犯更大的錯誤。

中庸的價值： 一個無偏誤的預測者預測的是「可能發生的結果的分佈」，而不是「最令人信服的故事」。如果相關性為 0.3，他永遠不會預測任何人進入前 5%——即使手中有極端亮眼的證據，因為這樣做在統計上幾乎必然是高估。

從 Tom W 到直覺預測：一個統一視角#

回顧這一部分（Part 2）的主題，Kahneman 在這章提供了一個統一的框架：

無論是 Tom W 的科系預測，Linda 的職業判斷，還是 Julie 的 GPA 預測，它們都有相同的結構：

預測要素	問題	對應概念
基準預測	如果沒有額外資訊，最佳猜測是什麼？	基本比率
直覺預測	手中的資訊把你的判斷推往哪個方向，推了多遠？	代表性
修正幅度	證據的診斷性有多高，相關性有多強？	約束代表性的影響

在離散類別的情況（Tom W 屬於哪個科系），正確的工具是 Bayesian 統計。在連續變數的情況（Julie 的 GPA），正確的工具是回歸分析。但兩者的精神是相同的：先錨定基準，再讓證據按比例調整，而不是讓直覺全面接管。

日常對話中的應用#

「那家新創公司有出色的概念驗證，但我們不應該說它一定會成功。讓我們別說真的相信它是下一個 Google，而是把預測回歸到平均值。」

「我們的直覺預測很樂觀，但可能太高了。讓我們考慮證據的強度，把預測往平均值方向調整。」

「這筆投資可能是個好主意，即使最佳猜測是它會失敗。讓我們別說真的相信它是個絕對失敗的案例。」

「我讀了那個品牌的一則評論，它非常出色。但那可能只是運氣。讓我們考慮有大量評論的品牌，選擇整體看起來最好的那個。」