尋找訊號

席佛以 2009 年義大利拉奎拉（L’Aquila）地震為起點，把地震預測與氣象預測作對比：兩者都涉及混沌系統，但地震學家對地殼的理論理解遠不如大氣，導致他們在缺乏理論的前提下，被「資料中的看似訊號」一再誘騙。本章核心是「過度配適（overfitting）」——資料一旦稀疏、雜訊一多，研究者最容易把雜訊當訊號。

拉奎拉：被誤讀的前震群#

2009 年 4 月 5 日週日晚間，義大利拉奎拉先後傳出兩起小規模地震（規模 3.9、3.5）。

過去一週，當地已發生至少 8 起規模 3 以上地震，而平時每兩三個月才一次。
鄰鎮蘇爾莫納的核物理研究院技術員朱利亞尼（Giampaolo Giuliani）聲稱以氡氣濃度為依據，預言 3 月 29 日下午會有地震；當地市長甚至派廣播車警告居民——但那天什麼也沒發生。朱利亞尼遭警方以「散播警報」罪名通報，被迫從網路撤下他的預言。
義大利民防部副主席德貝納迪尼斯（Bernardo De Bernardinis）對拉奎拉居民表示，這群小地震只是斷層在「釋放能量」，並建議大家配上一杯本地紅酒蒙特普恰諾。

隔日凌晨 3:32，規模 6.3 的主震襲擊拉奎拉。
300 多人死亡、6.5 萬人無家可歸、損失逾 160 億美元。
拉奎拉自 1315 年起反覆遭遇地震，1786 年的一次曾奪走逾 5,000 命；近兩個世紀則因 1958 年僅 5.0 規模而麻痺。
2009 年的 6.3 比 1958 年的 5.0 強約 75 倍——規模刻度是對數，每升一級能量乘以 32。

朱利亞尼真的預測對了嗎？#

災後義大利小報把朱利亞尼塑造成被體制忽視的英雄，但他並未預言拉奎拉。
他預言的是蘇爾莫納，不是拉奎拉。
預言發生時間是 3 月，不是 4 月。
主震前他甚至公開聲稱：「地球—月球系統因金星合朔而靠近近地點……我可以向同胞保證，這波震群將隨 3 月底結束而減弱。」

當災難來臨，人們急著在雜訊中尋找訊號——任何能夠重建秩序的解釋都成為慰藉。朱利亞尼荒誕的解釋恰好符合這個心理需求。

為什麼地震如此抗拒預測？#

席佛走訪美國地質調查局（USGS）的地震學家霍夫（Susan Hough）。她對朱利亞尼的成名極為不滿，並在《紐約時報》撰文指出：「公眾聽到的，是看似命中的預言；其他幾百個失敗的預言則被遺忘。」

加州地震預測委員會每年收到上百份非主流預測——有的根據寵物異常、有的依姑媽的足底病或月相。
2010 年甚至有篇刊登在《Journal of Zoology》的論文宣稱拉奎拉地震前 5 天，50 英里外池塘中的蟾蜍停止產卵——也算「成功預測」。
霍夫總結：「自 1970 年代以來，每隔十年就會出現一個樂觀的方法，再過十年就被推翻。多數頂尖學者已認為，那聖杯大概不存在。」

USGS 官方立場：地震無法被「預測（predict）」，但可以被「預報（forecast）」。
預測：對特定時間與地點的明確陳述（「6 月 28 日京都將發生大地震」）。
預報：機率性陳述（「南加州未來 30 年地震機率 60%」）。

古騰堡—芮氏定律：能說的與不能說的#

USGS 網站確實提供大量「預報」工具，背後依據的是 1944 年由芮氏（Charles Richter）與古騰堡（Beno Gutenberg）提出的古騰堡—芮氏定律（Gutenberg–Richter law）。

把地震規模與發生頻率畫在對數尺度上，幾乎是一條直線。
規模每增加 1，頻率約降為 1/10：規模 6 比規模 7 多約 10 倍，比規模 8 多約 100 倍。
這個定律不僅在全球成立，在地區層級也大致成立。

美國各大城市規模 ≥ 6.75 地震的長期頻率（USGS 預報）：
安克拉治：每 30 年一次
舊金山：每 35 年一次
洛杉磯：每 40 年一次
西雅圖：每 150 年一次
查爾斯頓（南卡）：每 600 年一次
紐約：每 12,000 年一次
丹佛：每 40,000 年一次
邁阿密：每 14 萬年一次

德黑蘭是霍夫真正擔心的城市：

1960–2009 年間規模 5.0–5.9 的地震約 15 次（每 3 年 1 次）。
依古騰堡—芮氏定律推估，規模 6.0–6.9 約每 30 年 1 次、規模 ≥7 約每 300 年 1 次。
結合人口密度（13M）、貧困、建築標準鬆散，USGS 估計大型地震將造成 15–30% 死亡，意即 200–400 萬人。

古騰堡—芮氏定律告訴你「總平均」，卻不告訴你何時。
也不意味某地「快輪到」要地震。倫敦三月下雨機率 35% 並不告訴你今天該不該帶傘——地質尺度以世紀為單位，人類壽命以年為單位。

訊號的誘惑#

地震學家追求的「聖杯」，其實是**時間相依（time-dependent）**的預報——機率隨時間改變。

大地震幾乎必然伴隨餘震，且越接近主震時間越多——但餘震定義上比主震弱，所以對救命幫助有限。
1811 年密蘇里—田納西邊界的新馬德里斷層先後發生規模 8.2、6 小時後 8.x、再次 8.1、最後 8.3——你根本分不清哪個是前震、哪個是餘震。

把地震分布畫成時間—規模散點圖，會讓人誤以為見到模式：
拉奎拉（圖 5-4a）：主震前確實有顯著前震群。
2011 日本（圖 5-4b）：規模 9.1 主震前約 50 小時，發生規模 7.5 前震。
海地（圖 5-4c）：規模 7.0 主震前 5 年內，連規模 4 都沒出現過——零預警。
2008 年雷諾、內華達：與拉奎拉前震群很像的震群，最終最大也只到規模 5.0，無大地震發生。
只有約一半的大地震有可辨識的前震，且許多看似「前震群」的事件並未引發大震。

失敗預測的長隊#

霍夫的著作《Predicting the Unpredictable》是地震預測史的「失敗博物館」：

秘魯利馬（1981）：地球物理學家布雷迪（Brian Brady）預測規模 9.2 大地震將在當年襲擊利馬，後來甚至升級為 9.9。預言外洩後秘魯紅十字會訂購 10 萬具屍袋，房價與觀光暴跌；當年沒有發生任何地震。
加州派克菲爾德：1857–1966 間每約 22 年一次地震，1985 年 USGS 撐腰的論文以 95% 信心預測 1983–1993 年將再發生（最可能 1988 年）。實際下次大震是 2004 年——遠遠超出預測窗口；同時也強化了「地震週期到了」這個錯誤直覺。
加州莫哈韋沙漠：UCLA 凱里斯—博羅克（Vladimir Keilis-Borok）2004 年宣稱破解地震預測，預測 9 個月內規模 6.4 將襲擊莫哈韋。USGS 一度同意此為「合理研究方向」，但預測落空；事後綜整他的明示預言，命中 3 次、失準 23 次。
印尼蘇門答臘：博曼（David Bowman）的 accelerated moment release 模型，2005 年成功命中蘇門答臘的規模 8.6 餘震，2006 年的論文卻將另一段斷層定為「低風險」；2007 年該段就發生規模 8.5。
博曼的反應與眾不同：他承認模型錯誤、放棄方法。「我做了大膽又愚蠢的事——做出可被檢證的預測。這就是我們應該做的，但答錯時會反咬你一口。」

困住地震學的兩難#

氣象學家可以「馴服」混沌，是因為他們對大氣有強的理論理解；地震學家沒有這個優勢。
博曼：「氣候系統很容易，他們抬頭看就行。我們看的是岩石，多數事件發生在地下 15 公里——除了科幻電影，根本沒辦法直接量測壓力。」
沒有理論的支撐，地震學家只能用純統計方法；但資料極度雜訊化，很難得到統計上有意義的結論。

當理論不足、資料雜訊高，常見的失敗連鎖是：

第一步：研究者把雜訊當訊號。
第二步：這些假訊號污染期刊、部落格與新聞，破壞良好科學，讓真正的理解倒退。

過度配適：你從沒聽過卻最重要的科學問題#

「過度配適（overfitting）」就是把雜訊誤當訊號的統計學名稱。

想像你被指派研究怎麼撬中學的密碼鎖。
你交回一張清單：紅色鎖是 27-12-31、黑色鎖是 44-14-19、藍色鎖是 10-3-32。
這對「特定三個鎖」毫無問題，卻完全沒有推進「鎖具一般理論」。把這份清單運到別處就完全沒用——這就是過度配適。

席佛用一張拋物線示意：

真實的關係是一條光滑拋物線。
用 100 個資料點足以辨認出這條曲線（圖 5-5）。
只剩 25 個資料點時，正確的做法是用簡單的二次方程擬合（圖 5-6b）。
「貪心」的做法是搬出複雜函數，讓曲線蜿蜒地穿過每一個離群點（圖 5-6c）——這個過度配適的模型可以解釋 85% 變異，比正確模型的 56% 漂亮，但對未來預測卻更糟。

數學家馮紐曼（John von Neumann）：「給我四個參數，我能配適出一隻大象；給我五個，我還能讓牠擺動鼻子。」
過度配適是一場雙重打擊：紙上數字漂亮、實際預測卻變差。但因為數字漂亮，論文易刊、模型易賣，反而排擠了誠實的模型，傷害科學。

凱里斯—博羅克的模型正是典型的過度配適——以極為複雜的方程組去硬擬合雜訊極高的資料，最終命中率慘淡。博曼承認模型同樣的毛病後，主動拔掉自己的插頭。

過度配適的日本：3.11 為何沒被預期#

2011 年的日本地震與其後的福島核災，部分起因於對地震上限的錯誤假設。

福島核電廠依規模 8.6 設計，實際來臨的是 9.1。
考古證據早暗示歷史上曾有規模可比的海嘯（130 英尺），但被遺忘或忽略。

席佛把震央周邊的歷史地震（不含 3.11）畫成古騰堡—芮氏圖：

大致沿直線下降，但在規模約 7.5 處出現「拗折（kink）」——1964 年以來該區再無規模 ≥8 的地震。
兩種擬合方式給出截然不同的結論：

古騰堡—芮氏直線：規模 9 約每 300 年一次——稀有，但屬於富國應準備的等級。
特徵擬合（characteristic fit）：強行通過拗折，得出「規模 9 約每 1.3 萬年一次」——幾乎不可能。
結果證明特徵擬合是過度配適：用一個 45 年的窗口判定 30 年事件不存在，等於因為三週沒人中威力球頭獎就斷言賓州人不可能中——資料根本不夠多。

地震學家為此編出說法：當地海床古老且密集、不會生成超大地震；2004 年蘇門答臘 9.2 的災難正是同一類錯誤——當地原本只有規模 7 級紀錄，於是有人推論不可能有更大者。古騰堡—芮氏定律雖無法說出時間，但會提醒你「可能性」存在。

地震與我們認知的極限#

最近數十年的大震讓地震學家重新思考地震規模的上限：

1964 年以來的地震資料，在對數圖上幾乎是一條完美直線。
規模 9 級事件因稀少，可能要數百年才能確認其真實頻率。
霍夫推測，若全球最長連續斷層帶（南美 Tierra del Fuego 至阿拉斯加 Aleutians）一次破裂，理論上限約規模 10。
物理學家貝克（Per Bak）的「複雜系統理論」與混沌不同：簡單元素彼此互動會展現驚人複雜性。

貝克最愛的比喻是沙堆。
一粒沙落上沙堆，可能停在原地、可能滾到底，也可能引發整堆崩塌。複雜系統就是長期穩定 + 突發災難。地震也許就是這種「不可化約的複雜」，無法被預測到某個臨界點以下。

雜訊的美#

電機工程裡，「白雜訊（white noise）」聽起來尖銳，「布朗雜訊（Brownian noise）」則接近水流聲——複雜系統往往展現後者的美感。

地震帶下的構造力，同時雕出斷層與壯麗山脈、肥沃谷地、迷人海岸。
因此，即便地震風險高，人類仍會繼續住在這些地方。

科學受審#

拉奎拉地震的最後一個諷刺：2011 年，7 名科學家與官員因「過失致死」遭起訴。
檢方指控他們在前震群之後未充分警告民眾。判決雖荒謬，但仍有可改進之處：證據顯示前震群之後大震風險可能暫時上升至基線的 100–500 倍，並非「一切正常」。

席佛的立場：

預測者的首要責任是忠於真相。
利馬與派克菲爾德的失敗、加上朱利亞尼這類「預言家」的競爭，扭曲了學界的誘因。
霍夫大概是對的——「短時間內準確命中」的聖杯不可得；但科學整體有它自己的長期訊號。
真正可改進的方向：
- 短時餘震預報：餘震分布可能沿斷層延伸；2011 年紐西蘭基督城規模 5.8 餘震致 185 人死亡，是 2010 年規模 7.0 主震在偏遠地區的延伸。
- 新感測科技：NASA 與 UC Davis 蘭德爾（John Rundle）以 GPS 衛星遠距量測斷層應力，雖然粗糙但增加了資料維度。

進步可能會來，但失敗預測也會繼續發生。
「當我們對舊錯誤的記憶淡去，那道訊號又會在地平線閃爍——口渴於預測的我們仍會追逐它，即使它只是海市蜃樓。」

拉奎拉：被誤讀的前震群#

朱利亞尼真的預測對了嗎？#

為什麼地震如此抗拒預測？#

Figure 5-1: 1900 年以來最致命的地震

古騰堡—芮氏定律：能說的與不能說的#

Figure 5-2: 美國主要城市規模 ≥6.75 地震頻率

訊號的誘惑#

Figure 5-4D: 雷諾、內華達 2006–2011 年地震散點圖

失敗預測的長隊#

困住地震學的兩難#

過度配適：你從沒聽過卻最重要的科學問題#

過度配適的日本：3.11 為何沒被預期#

地震與我們認知的極限#

雜訊的美#

科學受審#