在一公尺深的水裡溺斃

席佛把經濟預測寫成「過度自信、低估不確定性」的範例：政治民調至少會附上誤差範圍，但 GDP、就業、油價的預測通常以單一數字呈現，假裝精準。本章用 1997 年大福克斯洪災、2008 年金融危機、預測者社群的長期紀錄，逐一拆解經濟預測為何屢屢失準，並提出兩條改善路徑——供給面的預測市場、需求面的更挑剔閱聽人。

為什麼一英寸的偏差會上頭條？#

一則《丹佛郵報》2011 年 7 月 9 日的標題：
「失業率意外跳升至 9.2%，市場受挫」。
真正的「意外」是經濟學家原本預期 9.1%——一個 0.1 個百分點的差距能上頭條，給人一種感覺：經濟預測平常一定非常準。

事實正好相反：

經濟預測極少能在轉折點前數月做出有意義的判斷。
1990、2001、2007 三次衰退被官方認定後，多數經濟學家當下仍不認為當時已陷入衰退。
但預測者把不確定性當敵人：刻意降低模型「看起來」的不確定性，並不會改善真實預測力，只會讓社會在風暴來臨時更不設防。

大福克斯：把不確定性藏起來的代價#

1997 年 4 月，北達科他州大福克斯（Grand Forks）的紅河暴漲，淹進市區 2 英里以上：

全市 5 萬居民撤離，七成五房屋受損，整治成本以數十億美元計。
比起颶風或地震，這是一場可預防的災難——只要預先補強堤防、改道分洪，就能減輕損失。

NWS 預測紅河水位將升至 49 英尺；當地堤防為 51 英尺。
但 NWS 沒有同步說明歷史誤差約 ±9 英尺——意即堤防被淹沒的機率高達 35%。
預測員後來向研究者承認，他們怕公開不確定性會折損權威。
結果河水實際升至 54 英尺，39 英尺的差距遠遠超過設計上限。
對居民而言，「49 英尺」彷彿是「最大可能值」，幾乎沒人買洪水險。

經典笑話：一位統計學家走過一條平均深 1 公尺的河，溺死了。
平均值無法描述風險的全貌——只要實際稍稍偏高，整個小鎮就被沖毀。NWS 此後改變政策，把不確定性納入溝通，但這份覺悟在經濟預測界仍極為罕見。

經濟學家是理性的嗎？#

費城聯邦準備銀行的「Survey of Professional Forecasters（SPF）」是少數要求經濟學家明確列出機率分布的調查。

投擲兩顆骰子的「正確預測」並非一個數字，而是一張機率分布表（圖 6-2）。
經濟學家要對 GDP 給出一系列區間機率，例如 GDP 落在 2–3% 的機率、3–4% 的機率等。

2007 年 11 月，金融危機的官方起點僅一個月後，SPF 仍預期 2008 年 GDP 微幅成長 2.4%。
他們給「2008 年 GDP 任何萎縮」僅 3% 機率。
給「萎縮 ≥2%」僅 1/500 機率。
實際 GDP 萎縮 3.3%——遠遠超出他們的尾端尺度。

席佛把 1993–2010 年 SPF 的「90% 預測區間」與實際 GDP 對比：

18 年裡，實際值落在區間外的次數有 6 次——本應僅約 2 次。
把樣本拉回 1968 年起，落在區間外的次數接近一半。
經濟學家號稱的 90% 區間，真實覆蓋率可能不到 50%。
真正合理的 90% 區間寬度約為 ±3.2 個百分點（總跨度 6.4 個百分點）。

換句話說，當電視說「明年 GDP 將成長 2.5%」時，事實合理區間是 -0.7%（衰退）到 +5.7%（榮景）之間。
1990 年代各國 60 次衰退中，經濟學家只在事前一年成功預測了 2 次。

過度自信並非經濟學家獨有，但他們有更多理由可以避免——預測歷史可上溯到 1946 年的 Livingston Survey，回饋訊號充足，卻仍未矯正。原因或許就在於：「他們做出有偏差的預測，正反映了他們的誘因結構。」

「沒有人懂」：與哈茨烏斯的對話#

哈茨烏斯（Jan Hatzius）是高盛首席經濟學家，紀錄優於同業：

2007 年 11 月發表〈Leveraged Losses: Why Mortgage Defaults Matter〉，預測屋主違約將引發信貸與金融體系的骨牌效應。
2009 年 2 月白宮宣稱失業率將降至 7.8% 之際，他預測會升到 9.5%（實際為 9.9%）。

席佛問他什麼是預測經濟最大的挑戰，哈茨烏斯坦言：「沒人真的懂。要預測景氣循環非常困難，理解像經濟這樣複雜的有機體很不容易。」他歸納出三大根本障礙：

因果難辨：光靠經濟統計很難分辨因果。
目標移動：經濟持續演化，這個循環的關係未必適用下個循環。
資料雜訊極高：經濟學家所擁有的原始資料品質本就不佳。

因果與相關：超級盃、過度配適、偽訊號#

政府每年產出 4.5 萬個經濟指標，私部門資料商追蹤多達 400 萬個。

二戰後僅 11 次衰退；用 400 萬個輸入去解釋 11 個輸出，必然出現大量偽相關。
經典案例：1967–1997 年「超級盃指標」，原 NFL 球隊勝出當年股市平均漲 14%，原 AFL 球隊勝出則跌 10%。31 年命中 28 年，標準統計顯著性檢定會說它是 470 萬分之一的巧合。
1998 年丹佛野馬（原 AFL）拿冠軍，股市卻在網路熱中漲 28%。
自 1998 年後，AFL 勝出反而對應股市相對好 10%。
同樣道理，威力球頭獎機率 1/1.95 億，但每幾週仍有人中——數量夠多就會有偽訊號。

經濟學家會把「具經濟意涵」的變數視為先行指標，但很多 1990、2001 年衰退的先行指標，到 2007 年衰退時已淪為落後指標。
Conference Board 的 Leading Economic Index 也曾在 1984 年連續三個月下滑警示衰退，但當年經濟以 6% 速度成長。
不分青紅皂白把可量化的指標都丟進模型，很容易就把雜訊當訊號——典型的過度配適。

「相關性不等於因果性」是老調，實際運用卻不容易：

失業率有時是落後指標（企業確認復甦才招人）、有時是先行指標（失業者沒錢消費）。
消費者信心可以提早警示衰退、也可能在復甦後仍長期低落，難以一概而論。

經濟版的「測不準原理」#

更棘手的迴圈：預測本身會改變經濟。

若預測即將衰退，政府與聯準會必然介入；預測者必須同時預測政策。
諾貝爾獎得主盧卡斯（Robert Lucas）1976 年指出：模型用的歷史資料，本身就是當時政策的產物。
LSE 的古德哈特法則（Goodhart’s law）：當政策開始鎖定一個變數，這個變數作為指標的價值就會喪失。
房價就是現成的例子——若政府人為拉抬，數字會變漂亮，卻不再代表經濟健康。

在物理上這常被誤稱為「海森堡測不準原理」，但其實更接近「觀察者效應（observer effect）」：當你開始量測一個系統，它的行為就開始改變。
多數統計模型假設自變數與應變數可被分離；但對經濟而言，所有東西都揉在同一鍋。

不斷變化的經濟結構#

歐肯法則（Okun’s law）指出，戰後 1947–1999 年，工作成長率約為 GDP 成長率的一半（GDP 4% → 工作 2%）。

該關係在 21 世紀變弱：2009 年刺激方案後，依歐肯法則本應創造約 200 萬個工作，實際反而又流失 350 萬個。
哥倫比亞大學薩克斯（Jeffrey Sachs）認為，這反映美國的結構性問題：來自他國的競爭、製造／服務失衡、人口老化、中產萎縮、國債累積。

「Long Boom（1947–1999）」期間，美國僅 15% 時間處於衰退。
1900–1945 為 36%；2000 年代以來的高波動，可能才更接近長期常態。Long Boom 中又有 1983–2006 的「大穩定期（Great Moderation）」，衰退時間僅 3%——但增長仰賴政府與消費者債務及資產泡沫。
把模型校準在 Great Moderation 上，等於假設未來繼續風平浪靜——這是 2007 年聯準會與市場大幅低估金融危機深度的重要原因。

不要丟掉資料#

聯準會公開市場委員會 2007 年 10 月會議紀錄裡，連「recession」這個字都沒出現過。

他們依賴的是一份僅涵蓋 1986–2006 年（兩次溫和衰退）的研究。
該研究自己警告：「這是隱含『大穩定期會持續』的假設。」
席佛把 1968–1985 與 1986–2006 兩段時期 SPF 的預測 vs. 實際攤開比對：
- 前段（高波動）的預測與實際有合理相關性。
- 後段（平穩）的點集中在 2–5% 之間，平均誤差小，但預測與實際間幾乎沒有相關。

平均誤差小，是因為波動本來就小，並非預測者進步——好比比較檀香山與水牛城的氣象預測。
預測者幾乎不該丟掉資料，尤其在像衰退、總統大選這種樣本本就稀少的問題。丟掉資料常常是過度自信或過度配適的徵兆。

經濟資料本身就充滿雜訊#

哈茨烏斯：「為什麼大家不給區間？因為他們覺得難堪。」

GDP 等變數都會被多次修正，有時長達數年。
2008 第四季 GDP 初估萎縮 3.8%，後修正為近 9%——若白宮 2009 年 1 月就知道實情，刺激方案可能更大、或設計成更長期解方。
1965–2009 年間，季度 GDP 平均修正幅度 1.7 個百分點，初估的真實誤差為 ±4.3%。
1977 第四季 GDP 初估 4.2% 成長，最終修正為 -0.1%。

不僅難以預測經濟去哪裡，連「現在在哪裡」都不好說。對經濟預測者要有合理的同情。

巴西的蝴蝶與德州的失業#

經濟和大氣一樣是動態系統，初始條件也充滿不確定：

一場日本海嘯或長灘罷工，能改變德州某人是否找到工作。
不過氣象學有「硬科學」（流體力學、化學）撐底；經濟學在泡沫與恐慌期，因人類行為的回饋迴圈，因果尤其模糊。

哈茨烏斯 2007 年 11 月 15 日的故事是「對的，且因為對的理由」：
「2,000 億美元的信貸損失，會迫使高槓桿投資人縮減 2 兆美元的放款，足以引發嚴重衰退。」這不僅是資料的故事，更是「經濟的故事」——把因果脈絡描繪清楚。

對比預測公司 ECRI 在 2011 年 9 月的「雙重衰退」警示：

他們強調「不基於一兩個指標，而是幾十個專屬指標」。
缺乏經濟實質的解釋，僅是「數據叫我這樣說」。
ECRI 公司在 2004 年的書中還寫道：「就像你開車不必懂引擎原理，要解讀經濟也不必理解所有細節。」
結果 ECRI 預警後 5 個月，S&P 500 漲了 21%，2011 第四季 GDP 健康成長 3.0%；ECRI 隨後將預警延伸到 2012。

大數據時代越來越多人聲稱「資料夠多就不需要理論」——對經濟這種雜訊極高的領域，這是錯誤態度。
統計推論若無理論或對根因的深度思考做後盾，就只是把雜訊當訊號。

偏差為何「理性」？#

跨領域的研究顯示：群體預測通常比個人預測準。

SPF 的群體 GDP 預測比個別經濟學家準約 20%；對失業率約 10%、對通膨約 30%。
但這不是讓個人推諉「我反正不重要」的藉口——群體預測仍由個體組成，整體仍有大幅進步空間。
純統計模型也不是萬靈丹：BSF 前副總裁 McNees 的研究顯示，加入判斷修正可讓預測再準 15%。

「理性偏差（rational bias）」：當你的預測冠上你的名字，誘因就變了。
名氣低的小公司，做極端預測有上頭條的機會，即使常錯也划算。
高盛這類大公司則傾向往共識靠攏，風險過大會被放大檢視。
SPF（匿名）參與者在預測 GDP 與失業率上，長期略勝於 Blue Chip（具名）的同業——名譽顧慮讓預測變糟。

克服偏差：供給面與需求面#

改善預測的兩條路：
供給面：建立預測市場（prediction market），讓人為自己的預測下注。
喬治梅森大學的漢森（Robin Hanson）主張此路，並寫部落格《Overcoming Bias》。
為 GDP、失業率等總體變數建市場，可提供即時資訊、懲罰過度自信，並讓股票市場上的宏觀風險可被避險。
需求面：讀者要更挑剔。
把焦點從「黑盒子」式的隨機指標模型轉向具經濟實質的論述（如哈茨烏斯）。
把不確定性納入正式呈現——例如初估 GDP 也應像政治民調一樣附上誤差範圍。

信心不等於準確；兩者甚至常呈反相關。
當我們不允許預測者完整、誠實地交代風險時，無論是經濟還是其他領域，危險都會悄悄逼近。

為什麼一英寸的偏差會上頭條？#

大福克斯：把不確定性藏起來的代價#

Figure 6-1: 含誤差範圍的洪水預測

經濟學家是理性的嗎？#

Figure 6-4: GDP 預測 90% 區間 vs. 實際結果

「沒有人懂」：與哈茨烏斯的對話#

因果與相關：超級盃、過度配適、偽訊號#

經濟版的「測不準原理」#

不斷變化的經濟結構#

不要丟掉資料#

經濟資料本身就充滿雜訊#

巴西的蝴蝶與德州的失業#

偏差為何「理性」？#

克服偏差：供給面與需求面#