席佛把氣象預測寫成本書中少數的「成功故事」:人腦與超級電腦合作,預測精度於 25 年內提升三倍,颶風 72 小時前的位置誤差從 350 英里縮短到 100 英里。但章節同樣展示出它的代價:混沌理論限定了可預測的時程,而商業誘因會讓資訊離開政府後一路偏向「濕偏(wet bias)」。
卡崔娜:預測命中、人為失靈#
2005 年 8 月 23 日,美國空軍偵察機在巴哈馬上空發現多個小渦旋。
- 國家颶風中心(National Hurricane Center)將其判定為熱帶低壓,編號第 12 號。大西洋盆地約半數熱帶低壓最終會增強為颶風。
- 不到 24 小時,電腦模型開始預測雙重登陸——先佛羅里達南部,後紐奧良。低壓被命名為卡崔娜(Katrina)。
- 卡崔娜在墨西哥灣暖海中迅速增強為 3 級、再朝 5 級邁進,路徑從佛羅里達州西移至密西西比與路易斯安那。
- 颶風中心在堤防潰決前 5 天就點名紐奧良,48 小時前已認為「最壞情境」高機率成真。
紐奧良是氣象學家「最害怕的目標」。
- 大部分人口住在海平面以下,依賴老舊堤防與正在流失的天然屏障。
- 城市文化「不快、也不信任權威」——而面對颶風時最需要的,恰恰就是這兩件事。
颶風中心的預測準確且及時,無疑救了很多命;但仍約 8 萬人未撤離,1,600 人死亡。三分之二倖存者事後表示「沒料到颶風會這麼嚴重」,市長納金(Ray Nagin)拖延 24 小時才下強制撤離令。
預測是人類的智慧,但若無人聆聽就無濟於事。卡崔娜同時是「人類巧思」與「人類失誤」的故事。
從 Stonehenge 到超級電腦#
NCAR(National Center for Atmospheric Research)位在博爾德的超級電腦 Bluefire 每秒可運算 77 兆次,要靠高壓風扇才能散熱,現場員工需配戴護耳。氣象學家被外界戲稱「會射飛鏢預測天氣」,但 Bluefire 實質帶動了預測科學的長足進步。
預測天氣這件事其實是個哲學議題。
- 巴比倫人有 6,000 年的氣象石板,但最終仍將天氣交給雨神 Ningirsu。
- 中世紀的奧古斯丁與喀爾文主義主張命定論:人能預測,但無從更動。
- 啟蒙運動後,牛頓力學帶來「科學決定論」。
- 拉普拉斯(Pierre-Simon Laplace)1814 年提出著名的「拉普拉斯惡魔」:若知道宇宙所有粒子的位置與所有作用力,再加上足夠的運算能力,未來與過去就如同擺在眼前。
量子力學給了拉普拉斯惡魔致命一擊。
海森堡測不準原理(Heisenberg’s uncertainty principle)使粒子的位置不可被精確測定,「完美預測」從根本不可能成立。
不過天氣發生在分子尺度,量子效應可忽略,所以氣象學家可以追問一個降階版的問題:如果我們知道大氣中每個分子的位置,能否做出完美的天氣預測?
矩陣:把大氣切成格子#
純統計型預測(如「倫敦三月平均下雨機率 35%」)並不夠精細。氣象學家想做的是模擬大氣本身的物理過程。理論上的方程式我們知道,但不可能對每個分子都解。
1916 年的英國物理學家理查森(Lewis Fry Richardson)首次嘗試把大氣切成格子。
- 他在法國北部當救護志願兵,工作間隙把德國分割為一系列 3 度緯度 × 3 度經度(約 210 英里 × 210 英里)的二維方塊。
- 嘗試重建 1910 年 5 月 20 日下午 1 點的德國天氣。
- 結果失敗:模型預測氣壓劇升,但歷史上並未發生。
- 但這個「以方程式從基本原理求解」的範式被後人沿用至今。

Figure 4-1: 理查森的格網——現代天氣預測的雛形
電腦適合這種大量重複算術的任務:
- 1950 年,馮紐曼(John von Neumann)做了第一次電腦氣象預測,每秒 5,000 次運算,結果不比隨機好。
- 1960 年代電腦開始顯露技巧。
- Bluefire 比第一台快約 150 億倍——但預測準度不是同步飆升。
電腦力提升要花掉的成本不是線性。
- 把網格邊長減半 → 二維格數變 4 倍。
- 加上垂直維度 → 8 倍。
- 加上時間維度(風暴每小時走 40 英里,網格越小取樣越頻繁)→ 16 倍。
摩爾定律下每兩年運算力翻倍,要把網格倍精細需等約 8 年——這也大致等於 NCAR 升級超級電腦的節奏。
混沌理論:一場巴西的蝴蝶振翅#
可是即使你解出流體力學方程式,混沌理論還在等著你。「巴西一隻蝴蝶振翅,可能在德州引發龍捲風」——這句話來自 MIT 的勞倫茲(Edward Lorenz)1972 年的論文標題。
系統一旦同時具備兩個特徵,就會變得高度難以預測:
- 動態(dynamic):當下狀態會影響未來狀態。
- 非線性(nonlinear):關係是指數而非加法。
勞倫茲是在偶然中發現這件事:
- 他用 Royal McBee LGP-30 跑模擬,發現同一份輸入跑兩次結果迥異——一次堪薩斯晴朗,一次雷暴。
- 排查數週後才發現,技術員把氣壓資料 29.5168 截短為 29.517。
- 這就是「初始條件的微小差異被放大」——氣象學家從此不得不承認小數點後的精度也會主宰一週後的天氣。
線性與非線性運算的差別舉例:
5 + 5寫成5 + 6,誤差只有 10%。5^5寫成5^6,從 3,215 變成 15,625,誤差 500%。- 若把這個錯誤再次平方、再次代入,誤差會在動態系統中迅速擴張為 3,000 倍以上。
現代天氣預測因此走向「機率化」。
一張歐洲模型對 1999 年聖誕夜法德兩國的 50 次模擬,初始條件僅微幅不同——巴黎卻可能晴朗或暴風雨。當你看到「明天降雨機率 40%」,意義就是:在 40% 的模擬中下了雨,60% 的模擬中沒有。

Figure 4-2: 初始條件微小差異造成的預測發散
「眼力」這件事——電腦輸給人腦#
NOAA 旗下的國家氣象局(NWS)總部位在馬里蘭州 Camp Springs 的 World Weather Building。NWS 起源於 1870 年,原屬戰爭部;1888 年「校舍暴風雪」造成大量學生喪命後,社會對氣象預測的需求湧現,NWS 改隸農業部、走向民用。
即便 Bluefire 的運算量驚人,人類氣象員仍能對電腦結果加值。
NWS 的內部紀錄顯示:
- 人類修正可使降雨預測精度提升約 25%。
- 對溫度預測提升約 10%。
- 隨電腦能力進步,這個比例多年來幾乎不變。
人類擅長什麼?「視覺」。
- CAPTCHA 對人類輕而易舉,對電腦極難。

Figure 4-3: CAPTCHA 範例
- 預測員會用光筆把電腦輸出的等溫線往西移 15 英里、往北推 30 英里——他們知道某些模型在普吉特灣低壓下會低估西雅圖夜雨、知道阿卡迪亞國家公園的霧氣會因不同風向有不同消散時間。
- 老一輩預測員以前在透光桌上用粉筆畫圖,「一次預測 15 英里」。今日方法雖換成大螢幕,但精神延續。
雷擊死亡率持續下降#
25 年內氣象預測精度的躍升:
- 1970 年代中期,NWS 三天高溫預測平均誤差約 6 度,與長期平均查表差不多。
- 今日誤差約 3.5 度,幾乎砍半。
- 美國人每年被雷擊死亡的機率,從 1940 年的 1/400,000 降至 1/11,000,000,幾乎少了 30 倍——其中一部分歸功於更好的天氣資訊。
- 颶風登陸 3 天前的位置誤差,從 1985 年的 350 英里縮短到 100 英里;現在 72 小時前可掌握的精度,過去要等到登陸前 24 小時——多出 48 小時的撤離時間。

Figure 4-4: NWS 高溫預測平均誤差
NWS 一年只花約 9 億美元(每位美國人約 3 美元),便支撐占全國 GDP 約 20% 的天氣相關活動,可惜其貢獻常被低估。
公私競爭:自由市場帶來改善了嗎?#
NWS 的政策是把模型資料無償釋出,包括 AccuWeather、Weather Channel(TWC)等私人業者得以加值再販售。
- TWC 的網站 Weather.com 流量比 Weather.gov 高約 10 倍。
- TWC 副總裁羅斯(Bruce Rose)告訴席佛:私人業者的關注點與政府不同——關注「對消費者真的重要的」差異。
- 例如紐約若是下 1 英寸雨還是 10 英寸雪,對通勤者意義天差地別,但研究模型不在意;TWC 必須處理「微寒、零星陣雨、多雲偏陰」這些口語的演算法定義。
2001 年 TWC 把雷達圖上代表降雨的「綠色」改為「藍色」,立刻爆量抗議:「你們講了這麼多年雨是綠色的,現在又變藍?」
這就是本章書名的來源——羅斯口中的「核熔毀」。
學者墨菲(Allan Murphy)1993 年的論文提出三種預測品質的定義,可套用到任何預測領域:
- 準確性(accuracy):預測與實際是否相符。
- 誠實性(honesty / consistency):是否反映預測者當下能做出的最佳判斷?是否在送出前被改動過?
- 經濟價值(economic value):是否幫助公眾與決策者做出更好決定?
在沒有正確誘因時,準確性與誠實性會分歧。
麥克勞林秀的政治名嘴在意「上電視顯得聰明」,可能理性地選擇做出不準的預測——他們通過了「市場考驗」,卻沒通過誠實性測試。
競爭把預測變糟:濕偏與假精度#
任何天氣預測都要超越兩個基準:
- 持續性(persistence):明天和今天一樣。
- 氣候平均(climatology):該地該日的長期平均。
過去 70 年的天氣紀錄相對齊全,但「歷史上的預測」資料很稀缺。直到 2002 年俄亥俄州工程師佛洛爾(Eric Floehr)開始系統性蒐集 NWS、TWC、AccuWeather 的預測,並發展為 ForecastWatch.com 商業服務。
- 整體上沒有絕對贏家:AccuWeather 在降雨預測略勝、TWC 在溫度略好、NWS 全面平均水準。
- 隨預測時程拉長,準度急速下滑:8 天後幾乎沒有技巧;9 天以上甚至比氣候平均更差——意即模型在放大雜訊。
- 大氣超過 1 週左右,混沌就會抹去其動態記憶。把它想成 NASCAR 賽道:第一圈順序大致可預測,等快車開始套圈,整列車隊就被打散。

Figure 4-6: 各機構高溫預測比較
為什麼 TWC 仍提供 10 天預測、AccuWeather 甚至 15 天?
因為「準確的感知」比「準確本身」更具消費者價值。商業預測員幾乎不會直接說「降雨機率 50%」——觀眾覺得這像在打太極,所以多半會自動進位到 60% 或下調到 40%,準度與誠實一起下降。
更普遍的偏差是「濕偏(wet bias)」——商業預測會故意預報比實況更多的降雨。離政府原始資料越遠、越貼近消費者,偏差越大。
校準(calibration):好預測最關鍵的指標。
你說「下雨機率 40%」的所有預測,最終真的下雨的比例,是否接近 40%?
- NWS:校準幾乎完美,說 20% 就真的下 20% 的雨。
- TWC:當他們說 20% 時,實際大概只有 5% 真的下雨——他們承認這是商業誘因下的故意:未預警的雨會被罵,多餘晴天則被當紅利。其他機率區間表現仍佳。
- 地方電視台(堪薩斯城研究):當預測「100% 下雨」時,竟有約 1/3 沒下雨。比政府版更差,且名氣勝於準度。一位主播直言:「招聘氣象主播時不評估準度,台風重於準度。」

Figure 4-7: 國家氣象局校準度

Figure 4-8: Weather Channel 校準度

Figure 4-9: 地方電視主播校準度
地方電視預測不準,民眾不信;民眾不信,預測員更不努力——形成循環。
但當卡崔娜這類緊急事件來臨,多數人靠當地新聞獲取資訊,這種雙向不信任就會奪命。
混沌之錐:把不確定性畫出來#
颶風中心主任梅菲爾德(Max Mayfield)在奧克拉荷馬州龍捲風帶長大,職涯起步於空軍。他學到一件事:把預測「傳達」清楚與「做」清楚同樣困難。
- 1989 年休戈颶風後,一位佛州行為科學家告訴他「人們不會對颶風警報做出反應」,他起初被冒犯,後來明白對方完全正確。
- 民眾不是聽「hurricane warning」就行動,他們聽地方官員的聲音。
颶風中心特別重視「不確定性的呈現」。
Mayfield:「不確定性是天氣預測的根本。沒有不確定性說明的預測就是不完整的。」
他們不只畫出單一路徑,而是「不確定性之錐(cone of uncertainty)」——也被戲稱「混沌之錐(cone of chaos)」。
但他擔心仍不夠:2011 年艾琳颶風在紐約沒人死亡,卻有 3 人死於佛蒙特州的洪水——當電視鏡頭已經轉開時。
颶風中心通常不直接下達政策建議(如何時撤離),交由 NWS 122 個地方辦公室處理;理由是地方更熟悉文化與人群,也讓颶風中心保持任務專一。但卡崔娜逼得 Mayfield 親自打電話:
- 8/27(颶風來臨前 2 天)他打給密西西比州長,立即下令強制撤離;路州州長已宣布緊急狀態,要他打給市長納金。
- 納金錯過,回撥後拖延,僅發出「自願撤離」——在紐奧良文化裡這形同「不必急」。
- 8/28 上午 11 點才下達強制撤離。一項研究發現未撤離者中:約 1/3「沒聽到撤離令」,另 1/3「聽到了但說指令不清」。
- 老居民說:「我活過 1965 年的貝特西颶風,這個我也一樣可以扛過去。」研究顯示經歷過颶風會讓人下次反而更不撤離。
卡崔娜的最大教訓:對預測者而言,準確就是最佳策略。
把政治、個人光環或經濟利益置於真相之前——即使是好意——也會讓預測變糟。颶風中心 25 年來預測精度提升 350%,並非偶然。
Mayfield:「預測者的職責是做出最好的預測。」道理簡單,卻在許多領域被反覆違背。