席佛把政治預測拆成兩種對比:媒體名嘴與多數政治學者擅長「大膽論斷」,命中率卻接近擲銅板;而表現較好的預測者則具備「狐狸式」思維——多元、機率化、願意修正。本章把這套思維濃縮為三條可操作原則。

麥克勞林秀:擲硬幣式的政治預測#

PBS 的政論節目《麥克勞林秀》(The McLaughlin Group)自 1982 年起每週播出,主持人麥克勞林(John McLaughlin)以連環追問來賓著稱。每集尾聲固定有「Predictions」單元。

  • 2008 年總統大選前一個週末,麥克勞林問來賓:歐巴馬還是麥肯會贏?
  • 此時歐巴馬已在 9/15 雷曼破產後幾乎所有全國民調與搖擺州民調領先,FiveThirtyEight 模型預估勝率超過 95%,博彩市場為 7:1。
  • 但布坎南(Pat Buchanan)說「未定者本週末才會決定」,《芝加哥論壇報》的佩吉(Clarence Page)說「太接近難判」,福斯的克勞利(Monica Crowley)甚至預測麥肯贏「半個百分點」。
  • 結果:歐巴馬以 365 對 173 張選舉人票勝出,且全國得票領先近 1,000 萬。
  • 下一週節目錄影中,這群名嘴卻把結果講得「本來就無懸念」,毫不檢討前一週的失準。

席佛統計《麥克勞林秀》近 1,000 條預測:

  • 約 1/4 過於模糊或太遠期、無法評分。
  • 其餘預測中,338 條「大致或完全錯誤」,338 條「大致或完全正確」——與擲銅板無異。
  • 包含克利夫特(Eleanor Clift)在內的四位主要來賓,正確率介於 49%–52%,看不出任何個人差異。

名嘴節目其實是一種娛樂,內建商業誘因鼓勵尖銳對立。

從 CNN《Crossfire》的「叫罵時代」進化到今日的「同溫層時代」,差別只是自由派與保守派分散到不同頻道。收視率提高,卻不必然代表分析品質提升。

政治學者比名嘴強嗎?#

蘇聯解體(1989–1991)幾乎沒有主流政治學家事先預料到,但泰特洛克(Philip Tetlock)剛好正在進行一項長達十多年的大規模實驗。

  • 1987 年起,他向政治學界與政府智庫的專家蒐集對國內政治、經濟與國際關係的預測。
  • 2005 年集結成書《Expert Political Judgment》。

蘇聯解體之所以難測,是因為要正確預測它,必須同時掌握兩條原本分屬不同陣營的論點:

  • 左派觀點:戈巴契夫的改革意圖是真誠的,他的個人選擇對局勢至關重要。
  • 右派觀點:蘇聯經濟早已破敗,CIA 在 1990 年仍誤估其 GDP 為美國的一半,實際差距更大、年衰退率達 5%、通膨進入兩位數。
  • 兩者結合,蘇聯解體的圖像就清晰了——但很少有專家能跨越意識形態整合這兩塊拼圖。

泰特洛克的整體結論相當尖銳:

  • 不論專業領域、職涯資歷,「專家」整體預測幾乎不比隨機強,甚至輸給最簡單的統計模型。
  • 他們嚴重高估自身把握度:被宣稱「絕無可能」的事件中,約 15% 真的發生;被宣稱「板上釘釘」的事件,約 25% 並未發生。
  • 經濟、內政、國際——表現一樣糟。

預測的正確心態:當一隻狐狸#

泰特洛克發現:預測能力差異最大的,不是專業領域,而是認知風格。他借用以撒・柏林(Isaiah Berlin)筆下的隱喻,把專家分為兩類:

  • 刺蝟(hedgehog):信奉一個或少數「大理論」,把它當作物理定律般套用到所有問題。例如把馬克思的階級鬥爭、佛洛伊德的潛意識、葛拉威爾的「引爆點(tipping point)」當作通解。
  • 狐狸(fox):握有大量小想法,並接受多元、不確定、複雜與異議。獵人 vs 採集者。

預測表現的對比:

  • 對蘇聯,狐狸看到一個「日益失能、瀕臨瓦解」的國家;刺蝟則執著於「邪惡帝國」或「成功的馬克思經濟體」標籤。
  • 整體上,刺蝟的預測幾乎與隨機相當,狐狸則明顯較好。
狐狸的思維刺蝟的思維
跨領域整合,無視政治光譜專注於一兩個大問題,對「外人」存疑
願意嘗試新方法或多管齊下死守單一模型,新資料只用來微調
願意承認錯誤並改正把錯誤歸咎運氣或特殊情境
接受複雜,承認部分問題本質難測期待世界遵守簡單法則
用機率語言謹慎表達自信而少修正
仰賴觀察仰賴理論

為什麼刺蝟更上電視#

席佛在柏克萊與泰特洛克共進午餐,主人本人正是典型的狐狸:說話謹慎、回答前常停頓二、三十秒。他直言:

「公共知識份子的誘因,是大膽、戲劇化、把劇變的機率講得很高——這樣才會有人關注。」

電視常客莫里斯(Dick Morris)的紀錄:

  • 2005 年宣稱卡崔娜風災會讓小布希支持率反彈(實際是布希支持度的轉折點下行)。
  • 2008 年宣稱歐巴馬會拿下田納西、阿肯色(兩州都是當年歐巴馬倒退最嚴重的地方)。
  • 2010 年宣稱共和黨眾議院淨增 100 席(實際 63 席)。
  • 2011 年押川普會出馬競選並「機會極佳」,川普兩週後宣布不選。

預測屢屢失準,仍能因為節目效果好繼續活躍。狐狸則因為強調機率、坦承不確定,常被誤讀為缺乏自信、缺乏立場(杜魯門名言「給我一隻獨手的經濟學家」就是這種挫折感)。但若要選一位醫生預測病情、或選一位投資顧問為退休金服務,狐狸說的話往往實際得多。

政治預測為何特別容易失敗#

越多資訊,刺蝟越危險。

泰特洛克的另一個發現:狐狸隨著經驗變得更準,刺蝟卻反而隨著資歷變得更差——更多事實只是給他更多素材去拼出符合偏見的故事。

把疑病症患者鎖進連網的暗房,他越查越覺得自己得了鼠疫。

刺蝟另一個失敗來源是「黨派意識形態」:

  • 莫里斯雖曾任柯林頓顧問,卻已是共和黨募款人,與福斯立場一致。
  • 但《麥克勞林秀》最自由派的克利夫特,也幾乎從不做出對共和黨更有利的預測。
  • 狐狸不是沒有立場,而是能把信念與分析分開。刺蝟則創造泰特洛克所謂「事實與價值的模糊融合」。

《National Journal》民意內線調查的例子很傳神:

  • 2010 年期中選舉前,被問到共和黨整體會贏多少席時,民主黨組與共和黨組的答案幾乎一致(47 席 vs 53 席)。
  • 但被問到 11 場個別選舉時,差距驟然擴大:共和黨組預測民主黨僅贏 1 場,民主黨組則預測贏 6 場。
  • 結果民主黨贏 3 場,剛好落在中間。
  • 抽象問題沒有偏見發揮空間;個別問題提供了民調、八卦、廣告、私交等大量素材,刺蝟便用它們編織帶有偏好結局的故事。

狐狸式預測:FiveThirtyEight 的三條原則#

席佛在 2008 年初創辦 FiveThirtyEight,動機是「政治評論裡到處都是雜訊」:候選人「贏得這一天」、無名議員背書等 99% 選民根本不在乎的事被反覆放大。模型一開始僅是「依過去準確度加權的民調平均」,逐漸擴張,但始終遵守三條原則。

原則 1:用機率思考#

席佛公布的預測多半以「分布」呈現,而非單一數字。

  • 2010 年期中選舉前夕,他預估共和黨眾議院淨增席次最可能落在 45–65 席之間(實際 63 席);同時保留 70–80 席甚至民主黨保住眾院的尾端機率。
  • 大量選區得票差距極小:當年有 77 場眾議員選舉以個位數百分點分勝負,「精確到一個數字」並無誠意。

民調隨時間越接近選舉日越穩定。

  • 國會初選的民調誤差比大選大得多;2008 年民主黨初選平均偏離 8 個百分點。
  • 大選最後一天領先 5 個百分點的候選人,過去約 95% 勝出;但選舉前一年領先 5 個百分點,勝率僅 59%。

實務上,預測更精細的不是「誰會贏」,而是「贏的把握有多大」。

  • 一位 2010 年安全民主黨選區的眾議員打電話來,緊張地問:「你們的 100% 是真的 100%、99%、99.99% 還是 99.9999%?」他願意把競選經費捐給其他選區,但不能承擔 1% 的失敗風險。
  • 黨派人士常誤把「不確定性」當成預測者的「免責條款」,但 90% 勝率本身就同時意味著「10% 機率會輸」;好的預測要求這個 10% 在長期裡確實會兌現。

原則 2:今天的預測,是你下半輩子第一個預測#

凱因斯(John Maynard Keynes)名言:「事實改變,我就改變看法。先生,你呢?」

好的預測者不會因為昨天說過什麼而拒絕更新——但也不該對日復一日的劇烈震盪視而不見,那通常意味著模型有問題或事件本來就難測。

  • 2012 年共和黨初選一州一州做預測時,民調在搖擺,預測就跟著搖擺。
  • 大選後期則應趨於穩定:每天可能釋出 30–40 份民調,部分必落在誤差以外,但 FiveThirtyEight 模型顯示這些離群值通常無關大局。
  • 政治評論之所以排斥「修改預測」,常因把選舉當成物理定律——選戰應像彗星沿軌道運行。實際上更像撲克:對手的牌看不到,能做的就是不斷依新訊號更新自己的押注。

原則 3:尋找共識#

刺蝟最大的幻想是發布一個「離經叛道、最終驚天命中」的預測。實際上:

  • 集體預測通常比個人預測準 15–20%(依領域而定)。
  • 即便預測者自認獨立,當預測與同行明顯偏離時,狐狸應感到警覺,先驗證自己是不是漏了什麼。

泰特洛克:「狐狸常常能在自己腦中完成一群刺蝟的工作。」

狐狸自我詰問、混合多種資訊,自己模擬出一場辯論。FiveThirtyEight 的選舉模型同樣結合民調、經濟、人口結構等多維資料,而非死押單一變數。

警惕「萬靈丹」式的預測模型#

希布斯(Douglas Hibbs)2000 年發表的模型,用「人均實質可支配所得」與「軍事死傷數」兩個變數預測總統選舉。他甚至宣稱:總統支持度、通膨率、失業率、候選人本身——通通可以忽略。

  • 該模型預測高爾以 9 個百分點大勝。
  • 結果小布希在佛州重新計票後勝出;高爾雖贏全國普選票,但模型對如此接近的結果只給了 1/80 機率。
  • 另一個類似的「萬靈丹」模型甚至預測高爾贏 19 個百分點,對實際結果開出十億分之一的勝率。
  • 自 1992 年以來,純「基本面」模型平均誤差近 7 個百分點;結合民調與經濟資料的狐狸式做法表現好得多。

質性資訊也很重要#

信評機構也是「量化卻錯得離譜」的代表。

量化並不等於客觀。刺蝟拿到任何資料,都能用來強化偏見;而有經驗的狐狸能適度結合量化與質性訊息。

Cook Political Report 是長年最準的政治預測團隊之一:

  • 1998–2010 年間,他們判定為 Solid Republican 的 1,207 席中,共和黨贏了 1,205 席,命中率超過 99%;Solid Democrat 同樣 1,226/1,229。
  • 即使在較難判定的「lean」級別,雙方仍維持 92–95% 命中率。

Cook 的核心工具之一是「候選人面談」。席佛實地觀察分析師華瑟曼(David Wasserman)訪問共和黨候選人卡帕克(Dan Kapanke):

  • 華瑟曼像撲克玩家,先以家鄉細節閒聊建立信任,再丟出尖銳問題(例如:請說一個你與黨領導意見不同的議題)。
  • 卡帕克在被問及是否用遊說獻金為自家小聯盟球場添購球場照明的爭議時支吾以對。
  • 這些細節不大,但足以讓 Cook 維持原評等 Likely Democrat。卡帕克最終以約 9,500 票落敗,即便當年中西部多數類似選區共和黨大勝。
  • 多數面談並不會改評等;面談的價值在於發現心理學家米爾(Paul Meehl)所稱「斷腿案例(broken leg case)」——明顯到不能忽視的單一事實。

客觀並不容易#

「客觀」≠「量化」。

客觀指的是穿透個人偏見、看見問題的真相;任何方法都依賴預測者選擇的假設與決策,只要有人為判斷,就有偏誤的空間。

變得更客觀,意味著辨認自身假設、不斷自我詰問——尤其在政治這種容易把雜訊編成漂亮敘事的領域。

席佛總結:要超越電視名嘴,你需要——

  • 學會以機率語言表達不確定性。
  • 隨事實變化更新預測。
  • 接受不同觀點的智慧。
  • 以多種資訊交叉檢驗,但不被任何單一證據綁架。

換句話說,學著像一隻狐狸思考——承認人類判斷的侷限,並把這份自覺轉成幾次更準的預測。