你說了多年的雨是綠的

席佛把氣象預測寫成本書中少數的「成功故事」：人腦與超級電腦合作，預測精度於 25 年內提升三倍，颶風 72 小時前的位置誤差從 350 英里縮短到 100 英里。但章節同樣展示出它的代價：混沌理論限定了可預測的時程，而商業誘因會讓資訊離開政府後一路偏向「濕偏（wet bias）」。

卡崔娜：預測命中、人為失靈#

2005 年 8 月 23 日，美國空軍偵察機在巴哈馬上空發現多個小渦旋。

國家颶風中心（National Hurricane Center）將其判定為熱帶低壓，編號第 12 號。大西洋盆地約半數熱帶低壓最終會增強為颶風。
不到 24 小時，電腦模型開始預測雙重登陸——先佛羅里達南部，後紐奧良。低壓被命名為卡崔娜（Katrina）。
卡崔娜在墨西哥灣暖海中迅速增強為 3 級、再朝 5 級邁進，路徑從佛羅里達州西移至密西西比與路易斯安那。
颶風中心在堤防潰決前 5 天就點名紐奧良，48 小時前已認為「最壞情境」高機率成真。

紐奧良是氣象學家「最害怕的目標」。
大部分人口住在海平面以下，依賴老舊堤防與正在流失的天然屏障。
城市文化「不快、也不信任權威」——而面對颶風時最需要的，恰恰就是這兩件事。
颶風中心的預測準確且及時，無疑救了很多命；但仍約 8 萬人未撤離，1,600 人死亡。三分之二倖存者事後表示「沒料到颶風會這麼嚴重」，市長納金（Ray Nagin）拖延 24 小時才下強制撤離令。

預測是人類的智慧，但若無人聆聽就無濟於事。卡崔娜同時是「人類巧思」與「人類失誤」的故事。

從 Stonehenge 到超級電腦#

NCAR（National Center for Atmospheric Research）位在博爾德的超級電腦 Bluefire 每秒可運算 77 兆次，要靠高壓風扇才能散熱，現場員工需配戴護耳。氣象學家被外界戲稱「會射飛鏢預測天氣」，但 Bluefire 實質帶動了預測科學的長足進步。

預測天氣這件事其實是個哲學議題。
巴比倫人有 6,000 年的氣象石板，但最終仍將天氣交給雨神 Ningirsu。
中世紀的奧古斯丁與喀爾文主義主張命定論：人能預測，但無從更動。
啟蒙運動後，牛頓力學帶來「科學決定論」。
拉普拉斯（Pierre-Simon Laplace）1814 年提出著名的「拉普拉斯惡魔」：若知道宇宙所有粒子的位置與所有作用力，再加上足夠的運算能力，未來與過去就如同擺在眼前。

量子力學給了拉普拉斯惡魔致命一擊。
海森堡測不準原理（Heisenberg’s uncertainty principle）使粒子的位置不可被精確測定，「完美預測」從根本不可能成立。
不過天氣發生在分子尺度，量子效應可忽略，所以氣象學家可以追問一個降階版的問題：如果我們知道大氣中每個分子的位置，能否做出完美的天氣預測？

矩陣：把大氣切成格子#

純統計型預測（如「倫敦三月平均下雨機率 35%」）並不夠精細。氣象學家想做的是模擬大氣本身的物理過程。理論上的方程式我們知道，但不可能對每個分子都解。

1916 年的英國物理學家理查森（Lewis Fry Richardson）首次嘗試把大氣切成格子。
他在法國北部當救護志願兵，工作間隙把德國分割為一系列 3 度緯度 × 3 度經度（約 210 英里 × 210 英里）的二維方塊。
嘗試重建 1910 年 5 月 20 日下午 1 點的德國天氣。
結果失敗：模型預測氣壓劇升，但歷史上並未發生。
但這個「以方程式從基本原理求解」的範式被後人沿用至今。

電腦適合這種大量重複算術的任務：

1950 年，馮紐曼（John von Neumann）做了第一次電腦氣象預測，每秒 5,000 次運算，結果不比隨機好。
1960 年代電腦開始顯露技巧。
Bluefire 比第一台快約 150 億倍——但預測準度不是同步飆升。

電腦力提升要花掉的成本不是線性。
把網格邊長減半 → 二維格數變 4 倍。
加上垂直維度 → 8 倍。
加上時間維度（風暴每小時走 40 英里，網格越小取樣越頻繁）→ 16 倍。
摩爾定律下每兩年運算力翻倍，要把網格倍精細需等約 8 年——這也大致等於 NCAR 升級超級電腦的節奏。

混沌理論：一場巴西的蝴蝶振翅#

可是即使你解出流體力學方程式，混沌理論還在等著你。「巴西一隻蝴蝶振翅，可能在德州引發龍捲風」——這句話來自 MIT 的勞倫茲（Edward Lorenz）1972 年的論文標題。

系統一旦同時具備兩個特徵，就會變得高度難以預測：
動態（dynamic）：當下狀態會影響未來狀態。
非線性（nonlinear）：關係是指數而非加法。

勞倫茲是在偶然中發現這件事：

他用 Royal McBee LGP-30 跑模擬，發現同一份輸入跑兩次結果迥異——一次堪薩斯晴朗，一次雷暴。
排查數週後才發現，技術員把氣壓資料 29.5168 截短為 29.517。
這就是「初始條件的微小差異被放大」——氣象學家從此不得不承認小數點後的精度也會主宰一週後的天氣。

線性與非線性運算的差別舉例：

5 + 5 寫成 5 + 6，誤差只有 10%。
5^5 寫成 5^6，從 3,215 變成 15,625，誤差 500%。
若把這個錯誤再次平方、再次代入，誤差會在動態系統中迅速擴張為 3,000 倍以上。

現代天氣預測因此走向「機率化」。
一張歐洲模型對 1999 年聖誕夜法德兩國的 50 次模擬，初始條件僅微幅不同——巴黎卻可能晴朗或暴風雨。當你看到「明天降雨機率 40%」，意義就是：在 40% 的模擬中下了雨，60% 的模擬中沒有。

「眼力」這件事——電腦輸給人腦#

NOAA 旗下的國家氣象局（NWS）總部位在馬里蘭州 Camp Springs 的 World Weather Building。NWS 起源於 1870 年，原屬戰爭部；1888 年「校舍暴風雪」造成大量學生喪命後，社會對氣象預測的需求湧現，NWS 改隸農業部、走向民用。

即便 Bluefire 的運算量驚人，人類氣象員仍能對電腦結果加值。
NWS 的內部紀錄顯示：
人類修正可使降雨預測精度提升約 25%。
對溫度預測提升約 10%。
隨電腦能力進步，這個比例多年來幾乎不變。

人類擅長什麼？「視覺」。

CAPTCHA 對人類輕而易舉，對電腦極難。

預測員會用光筆把電腦輸出的等溫線往西移 15 英里、往北推 30 英里——他們知道某些模型在普吉特灣低壓下會低估西雅圖夜雨、知道阿卡迪亞國家公園的霧氣會因不同風向有不同消散時間。
老一輩預測員以前在透光桌上用粉筆畫圖，「一次預測 15 英里」。今日方法雖換成大螢幕，但精神延續。

雷擊死亡率持續下降#

25 年內氣象預測精度的躍升：
1970 年代中期，NWS 三天高溫預測平均誤差約 6 度，與長期平均查表差不多。
今日誤差約 3.5 度，幾乎砍半。
美國人每年被雷擊死亡的機率，從 1940 年的 1/400,000 降至 1/11,000,000，幾乎少了 30 倍——其中一部分歸功於更好的天氣資訊。
颶風登陸 3 天前的位置誤差，從 1985 年的 350 英里縮短到 100 英里；現在 72 小時前可掌握的精度，過去要等到登陸前 24 小時——多出 48 小時的撤離時間。

NWS 一年只花約 9 億美元（每位美國人約 3 美元），便支撐占全國 GDP 約 20% 的天氣相關活動，可惜其貢獻常被低估。

公私競爭：自由市場帶來改善了嗎？#

NWS 的政策是把模型資料無償釋出，包括 AccuWeather、Weather Channel（TWC）等私人業者得以加值再販售。

TWC 的網站 Weather.com 流量比 Weather.gov 高約 10 倍。
TWC 副總裁羅斯（Bruce Rose）告訴席佛：私人業者的關注點與政府不同——關注「對消費者真的重要的」差異。
例如紐約若是下 1 英寸雨還是 10 英寸雪，對通勤者意義天差地別，但研究模型不在意；TWC 必須處理「微寒、零星陣雨、多雲偏陰」這些口語的演算法定義。

2001 年 TWC 把雷達圖上代表降雨的「綠色」改為「藍色」，立刻爆量抗議：「你們講了這麼多年雨是綠色的，現在又變藍？」
這就是本章書名的來源——羅斯口中的「核熔毀」。

學者墨菲（Allan Murphy）1993 年的論文提出三種預測品質的定義，可套用到任何預測領域：

準確性（accuracy）：預測與實際是否相符。
誠實性（honesty / consistency）：是否反映預測者當下能做出的最佳判斷？是否在送出前被改動過？
經濟價值（economic value）：是否幫助公眾與決策者做出更好決定？

在沒有正確誘因時，準確性與誠實性會分歧。
麥克勞林秀的政治名嘴在意「上電視顯得聰明」，可能理性地選擇做出不準的預測——他們通過了「市場考驗」，卻沒通過誠實性測試。

競爭把預測變糟：濕偏與假精度#

任何天氣預測都要超越兩個基準：

持續性（persistence）：明天和今天一樣。
氣候平均（climatology）：該地該日的長期平均。

過去 70 年的天氣紀錄相對齊全，但「歷史上的預測」資料很稀缺。直到 2002 年俄亥俄州工程師佛洛爾（Eric Floehr）開始系統性蒐集 NWS、TWC、AccuWeather 的預測，並發展為 ForecastWatch.com 商業服務。

整體上沒有絕對贏家：AccuWeather 在降雨預測略勝、TWC 在溫度略好、NWS 全面平均水準。
隨預測時程拉長，準度急速下滑：8 天後幾乎沒有技巧；9 天以上甚至比氣候平均更差——意即模型在放大雜訊。
大氣超過 1 週左右，混沌就會抹去其動態記憶。把它想成 NASCAR 賽道：第一圈順序大致可預測，等快車開始套圈，整列車隊就被打散。

為什麼 TWC 仍提供 10 天預測、AccuWeather 甚至 15 天？
因為「準確的感知」比「準確本身」更具消費者價值。商業預測員幾乎不會直接說「降雨機率 50%」——觀眾覺得這像在打太極，所以多半會自動進位到 60% 或下調到 40%，準度與誠實一起下降。

更普遍的偏差是「濕偏（wet bias）」——商業預測會故意預報比實況更多的降雨。離政府原始資料越遠、越貼近消費者，偏差越大。

校準（calibration）：好預測最關鍵的指標。
你說「下雨機率 40%」的所有預測，最終真的下雨的比例，是否接近 40%？
NWS：校準幾乎完美，說 20% 就真的下 20% 的雨。
TWC：當他們說 20% 時，實際大概只有 5% 真的下雨——他們承認這是商業誘因下的故意：未預警的雨會被罵，多餘晴天則被當紅利。其他機率區間表現仍佳。
地方電視台（堪薩斯城研究）：當預測「100% 下雨」時，竟有約 1/3 沒下雨。比政府版更差，且名氣勝於準度。一位主播直言：「招聘氣象主播時不評估準度，台風重於準度。」

地方電視預測不準，民眾不信；民眾不信，預測員更不努力——形成循環。
但當卡崔娜這類緊急事件來臨，多數人靠當地新聞獲取資訊，這種雙向不信任就會奪命。

混沌之錐：把不確定性畫出來#

颶風中心主任梅菲爾德（Max Mayfield）在奧克拉荷馬州龍捲風帶長大，職涯起步於空軍。他學到一件事：把預測「傳達」清楚與「做」清楚同樣困難。

1989 年休戈颶風後，一位佛州行為科學家告訴他「人們不會對颶風警報做出反應」，他起初被冒犯，後來明白對方完全正確。
民眾不是聽「hurricane warning」就行動，他們聽地方官員的聲音。

颶風中心特別重視「不確定性的呈現」。
Mayfield：「不確定性是天氣預測的根本。沒有不確定性說明的預測就是不完整的。」
他們不只畫出單一路徑，而是「不確定性之錐（cone of uncertainty）」——也被戲稱「混沌之錐（cone of chaos）」。
但他擔心仍不夠：2011 年艾琳颶風在紐約沒人死亡，卻有 3 人死於佛蒙特州的洪水——當電視鏡頭已經轉開時。

颶風中心通常不直接下達政策建議（如何時撤離），交由 NWS 122 個地方辦公室處理；理由是地方更熟悉文化與人群，也讓颶風中心保持任務專一。但卡崔娜逼得 Mayfield 親自打電話：

8/27（颶風來臨前 2 天）他打給密西西比州長，立即下令強制撤離；路州州長已宣布緊急狀態，要他打給市長納金。
納金錯過，回撥後拖延，僅發出「自願撤離」——在紐奧良文化裡這形同「不必急」。
8/28 上午 11 點才下達強制撤離。一項研究發現未撤離者中：約 1/3「沒聽到撤離令」，另 1/3「聽到了但說指令不清」。
老居民說：「我活過 1965 年的貝特西颶風，這個我也一樣可以扛過去。」研究顯示經歷過颶風會讓人下次反而更不撤離。

卡崔娜的最大教訓：對預測者而言，準確就是最佳策略。
把政治、個人光環或經濟利益置於真相之前——即使是好意——也會讓預測變糟。颶風中心 25 年來預測精度提升 350%，並非偶然。
Mayfield：「預測者的職責是做出最好的預測。」道理簡單，卻在許多領域被反覆違背。

卡崔娜：預測命中、人為失靈#

從 Stonehenge 到超級電腦#

矩陣：把大氣切成格子#

Figure 4-1: 理查森的格網——現代天氣預測的雛形

混沌理論：一場巴西的蝴蝶振翅#

Figure 4-2: 初始條件微小差異造成的預測發散

「眼力」這件事——電腦輸給人腦#

Figure 4-3: CAPTCHA 範例

雷擊死亡率持續下降#

Figure 4-4: NWS 高溫預測平均誤差

公私競爭：自由市場帶來改善了嗎？#

競爭把預測變糟：濕偏與假精度#

Figure 4-6: 各機構高溫預測比較

Figure 4-7: 國家氣象局校準度

Figure 4-8: Weather Channel 校準度

Figure 4-9: 地方電視主播校準度

混沌之錐：把不確定性畫出來#