席佛以 2009 年義大利拉奎拉(L’Aquila)地震為起點,把地震預測與氣象預測作對比:兩者都涉及混沌系統,但地震學家對地殼的理論理解遠不如大氣,導致他們在缺乏理論的前提下,被「資料中的看似訊號」一再誘騙。本章核心是「過度配適(overfitting)」——資料一旦稀疏、雜訊一多,研究者最容易把雜訊當訊號。
拉奎拉:被誤讀的前震群#
2009 年 4 月 5 日週日晚間,義大利拉奎拉先後傳出兩起小規模地震(規模 3.9、3.5)。
- 過去一週,當地已發生至少 8 起規模 3 以上地震,而平時每兩三個月才一次。
- 鄰鎮蘇爾莫納的核物理研究院技術員朱利亞尼(Giampaolo Giuliani)聲稱以氡氣濃度為依據,預言 3 月 29 日下午會有地震;當地市長甚至派廣播車警告居民——但那天什麼也沒發生。朱利亞尼遭警方以「散播警報」罪名通報,被迫從網路撤下他的預言。
- 義大利民防部副主席德貝納迪尼斯(Bernardo De Bernardinis)對拉奎拉居民表示,這群小地震只是斷層在「釋放能量」,並建議大家配上一杯本地紅酒蒙特普恰諾。
隔日凌晨 3:32,規模 6.3 的主震襲擊拉奎拉。
- 300 多人死亡、6.5 萬人無家可歸、損失逾 160 億美元。
- 拉奎拉自 1315 年起反覆遭遇地震,1786 年的一次曾奪走逾 5,000 命;近兩個世紀則因 1958 年僅 5.0 規模而麻痺。
- 2009 年的 6.3 比 1958 年的 5.0 強約 75 倍——規模刻度是對數,每升一級能量乘以 32。
朱利亞尼真的預測對了嗎?#
災後義大利小報把朱利亞尼塑造成被體制忽視的英雄,但他並未預言拉奎拉。
- 他預言的是蘇爾莫納,不是拉奎拉。
- 預言發生時間是 3 月,不是 4 月。
- 主震前他甚至公開聲稱:「地球—月球系統因金星合朔而靠近近地點……我可以向同胞保證,這波震群將隨 3 月底結束而減弱。」
當災難來臨,人們急著在雜訊中尋找訊號——任何能夠重建秩序的解釋都成為慰藉。朱利亞尼荒誕的解釋恰好符合這個心理需求。
為什麼地震如此抗拒預測?#
席佛走訪美國地質調查局(USGS)的地震學家霍夫(Susan Hough)。她對朱利亞尼的成名極為不滿,並在《紐約時報》撰文指出:「公眾聽到的,是看似命中的預言;其他幾百個失敗的預言則被遺忘。」
- 加州地震預測委員會每年收到上百份非主流預測——有的根據寵物異常、有的依姑媽的足底病或月相。
- 2010 年甚至有篇刊登在《Journal of Zoology》的論文宣稱拉奎拉地震前 5 天,50 英里外池塘中的蟾蜍停止產卵——也算「成功預測」。
- 霍夫總結:「自 1970 年代以來,每隔十年就會出現一個樂觀的方法,再過十年就被推翻。多數頂尖學者已認為,那聖杯大概不存在。」

Figure 5-1: 1900 年以來最致命的地震
USGS 官方立場:地震無法被「預測(predict)」,但可以被「預報(forecast)」。
- 預測:對特定時間與地點的明確陳述(「6 月 28 日京都將發生大地震」)。
- 預報:機率性陳述(「南加州未來 30 年地震機率 60%」)。
古騰堡—芮氏定律:能說的與不能說的#
USGS 網站確實提供大量「預報」工具,背後依據的是 1944 年由芮氏(Charles Richter)與古騰堡(Beno Gutenberg)提出的古騰堡—芮氏定律(Gutenberg–Richter law)。
- 把地震規模與發生頻率畫在對數尺度上,幾乎是一條直線。
- 規模每增加 1,頻率約降為 1/10:規模 6 比規模 7 多約 10 倍,比規模 8 多約 100 倍。
- 這個定律不僅在全球成立,在地區層級也大致成立。
美國各大城市規模 ≥ 6.75 地震的長期頻率(USGS 預報):
- 安克拉治:每 30 年一次
- 舊金山:每 35 年一次
- 洛杉磯:每 40 年一次
- 西雅圖:每 150 年一次
- 查爾斯頓(南卡):每 600 年一次
- 紐約:每 12,000 年一次
- 丹佛:每 40,000 年一次
- 邁阿密:每 14 萬年一次

Figure 5-2: 美國主要城市規模 ≥6.75 地震頻率
德黑蘭是霍夫真正擔心的城市:
- 1960–2009 年間規模 5.0–5.9 的地震約 15 次(每 3 年 1 次)。
- 依古騰堡—芮氏定律推估,規模 6.0–6.9 約每 30 年 1 次、規模 ≥7 約每 300 年 1 次。
- 結合人口密度(13M)、貧困、建築標準鬆散,USGS 估計大型地震將造成 15–30% 死亡,意即 200–400 萬人。
古騰堡—芮氏定律告訴你「總平均」,卻不告訴你何時。
也不意味某地「快輪到」要地震。倫敦三月下雨機率 35% 並不告訴你今天該不該帶傘——地質尺度以世紀為單位,人類壽命以年為單位。
訊號的誘惑#
地震學家追求的「聖杯」,其實是**時間相依(time-dependent)**的預報——機率隨時間改變。
- 大地震幾乎必然伴隨餘震,且越接近主震時間越多——但餘震定義上比主震弱,所以對救命幫助有限。
- 1811 年密蘇里—田納西邊界的新馬德里斷層先後發生規模 8.2、6 小時後 8.x、再次 8.1、最後 8.3——你根本分不清哪個是前震、哪個是餘震。
把地震分布畫成時間—規模散點圖,會讓人誤以為見到模式:
- 拉奎拉(圖 5-4a):主震前確實有顯著前震群。
- 2011 日本(圖 5-4b):規模 9.1 主震前約 50 小時,發生規模 7.5 前震。
- 海地(圖 5-4c):規模 7.0 主震前 5 年內,連規模 4 都沒出現過——零預警。
- 2008 年雷諾、內華達:與拉奎拉前震群很像的震群,最終最大也只到規模 5.0,無大地震發生。
只有約一半的大地震有可辨識的前震,且許多看似「前震群」的事件並未引發大震。

Figure 5-4D: 雷諾、內華達 2006–2011 年地震散點圖
失敗預測的長隊#
霍夫的著作《Predicting the Unpredictable》是地震預測史的「失敗博物館」:
- 秘魯利馬(1981):地球物理學家布雷迪(Brian Brady)預測規模 9.2 大地震將在當年襲擊利馬,後來甚至升級為 9.9。預言外洩後秘魯紅十字會訂購 10 萬具屍袋,房價與觀光暴跌;當年沒有發生任何地震。
- 加州派克菲爾德:1857–1966 間每約 22 年一次地震,1985 年 USGS 撐腰的論文以 95% 信心預測 1983–1993 年將再發生(最可能 1988 年)。實際下次大震是 2004 年——遠遠超出預測窗口;同時也強化了「地震週期到了」這個錯誤直覺。
- 加州莫哈韋沙漠:UCLA 凱里斯—博羅克(Vladimir Keilis-Borok)2004 年宣稱破解地震預測,預測 9 個月內規模 6.4 將襲擊莫哈韋。USGS 一度同意此為「合理研究方向」,但預測落空;事後綜整他的明示預言,命中 3 次、失準 23 次。
- 印尼蘇門答臘:博曼(David Bowman)的 accelerated moment release 模型,2005 年成功命中蘇門答臘的規模 8.6 餘震,2006 年的論文卻將另一段斷層定為「低風險」;2007 年該段就發生規模 8.5。
- 博曼的反應與眾不同:他承認模型錯誤、放棄方法。「我做了大膽又愚蠢的事——做出可被檢證的預測。這就是我們應該做的,但答錯時會反咬你一口。」
困住地震學的兩難#
氣象學家可以「馴服」混沌,是因為他們對大氣有強的理論理解;地震學家沒有這個優勢。
博曼:「氣候系統很容易,他們抬頭看就行。我們看的是岩石,多數事件發生在地下 15 公里——除了科幻電影,根本沒辦法直接量測壓力。」
沒有理論的支撐,地震學家只能用純統計方法;但資料極度雜訊化,很難得到統計上有意義的結論。
當理論不足、資料雜訊高,常見的失敗連鎖是:
- 第一步:研究者把雜訊當訊號。
- 第二步:這些假訊號污染期刊、部落格與新聞,破壞良好科學,讓真正的理解倒退。
過度配適:你從沒聽過卻最重要的科學問題#
「過度配適(overfitting)」就是把雜訊誤當訊號的統計學名稱。
想像你被指派研究怎麼撬中學的密碼鎖。
你交回一張清單:紅色鎖是 27-12-31、黑色鎖是 44-14-19、藍色鎖是 10-3-32。
這對「特定三個鎖」毫無問題,卻完全沒有推進「鎖具一般理論」。把這份清單運到別處就完全沒用——這就是過度配適。
席佛用一張拋物線示意:
- 真實的關係是一條光滑拋物線。
- 用 100 個資料點足以辨認出這條曲線(圖 5-5)。
- 只剩 25 個資料點時,正確的做法是用簡單的二次方程擬合(圖 5-6b)。
- 「貪心」的做法是搬出複雜函數,讓曲線蜿蜒地穿過每一個離群點(圖 5-6c)——這個過度配適的模型可以解釋 85% 變異,比正確模型的 56% 漂亮,但對未來預測卻更糟。
數學家馮紐曼(John von Neumann):「給我四個參數,我能配適出一隻大象;給我五個,我還能讓牠擺動鼻子。」
過度配適是一場雙重打擊:紙上數字漂亮、實際預測卻變差。但因為數字漂亮,論文易刊、模型易賣,反而排擠了誠實的模型,傷害科學。
凱里斯—博羅克的模型正是典型的過度配適——以極為複雜的方程組去硬擬合雜訊極高的資料,最終命中率慘淡。博曼承認模型同樣的毛病後,主動拔掉自己的插頭。
過度配適的日本:3.11 為何沒被預期#
2011 年的日本地震與其後的福島核災,部分起因於對地震上限的錯誤假設。
- 福島核電廠依規模 8.6 設計,實際來臨的是 9.1。
- 考古證據早暗示歷史上曾有規模可比的海嘯(130 英尺),但被遺忘或忽略。
席佛把震央周邊的歷史地震(不含 3.11)畫成古騰堡—芮氏圖:
- 大致沿直線下降,但在規模約 7.5 處出現「拗折(kink)」——1964 年以來該區再無規模 ≥8 的地震。
- 兩種擬合方式給出截然不同的結論:
- 古騰堡—芮氏直線:規模 9 約每 300 年一次——稀有,但屬於富國應準備的等級。
- 特徵擬合(characteristic fit):強行通過拗折,得出「規模 9 約每 1.3 萬年一次」——幾乎不可能。
結果證明特徵擬合是過度配適:用一個 45 年的窗口判定 30 年事件不存在,等於因為三週沒人中威力球頭獎就斷言賓州人不可能中——資料根本不夠多。
地震學家為此編出說法:當地海床古老且密集、不會生成超大地震;2004 年蘇門答臘 9.2 的災難正是同一類錯誤——當地原本只有規模 7 級紀錄,於是有人推論不可能有更大者。古騰堡—芮氏定律雖無法說出時間,但會提醒你「可能性」存在。
地震與我們認知的極限#
最近數十年的大震讓地震學家重新思考地震規模的上限:
- 1964 年以來的地震資料,在對數圖上幾乎是一條完美直線。
- 規模 9 級事件因稀少,可能要數百年才能確認其真實頻率。
- 霍夫推測,若全球最長連續斷層帶(南美 Tierra del Fuego 至阿拉斯加 Aleutians)一次破裂,理論上限約規模 10。
- 物理學家貝克(Per Bak)的「複雜系統理論」與混沌不同:簡單元素彼此互動會展現驚人複雜性。
貝克最愛的比喻是沙堆。
一粒沙落上沙堆,可能停在原地、可能滾到底,也可能引發整堆崩塌。複雜系統就是長期穩定 + 突發災難。地震也許就是這種「不可化約的複雜」,無法被預測到某個臨界點以下。
雜訊的美#
電機工程裡,「白雜訊(white noise)」聽起來尖銳,「布朗雜訊(Brownian noise)」則接近水流聲——複雜系統往往展現後者的美感。
- 地震帶下的構造力,同時雕出斷層與壯麗山脈、肥沃谷地、迷人海岸。
- 因此,即便地震風險高,人類仍會繼續住在這些地方。
科學受審#
拉奎拉地震的最後一個諷刺:2011 年,7 名科學家與官員因「過失致死」遭起訴。
檢方指控他們在前震群之後未充分警告民眾。判決雖荒謬,但仍有可改進之處:證據顯示前震群之後大震風險可能暫時上升至基線的 100–500 倍,並非「一切正常」。
席佛的立場:
- 預測者的首要責任是忠於真相。
- 利馬與派克菲爾德的失敗、加上朱利亞尼這類「預言家」的競爭,扭曲了學界的誘因。
- 霍夫大概是對的——「短時間內準確命中」的聖杯不可得;但科學整體有它自己的長期訊號。
- 真正可改進的方向:
- 短時餘震預報:餘震分布可能沿斷層延伸;2011 年紐西蘭基督城規模 5.8 餘震致 185 人死亡,是 2010 年規模 7.0 主震在偏遠地區的延伸。
- 新感測科技:NASA 與 UC Davis 蘭德爾(John Rundle)以 GPS 衛星遠距量測斷層應力,雖然粗糙但增加了資料維度。
進步可能會來,但失敗預測也會繼續發生。
「當我們對舊錯誤的記憶淡去,那道訊號又會在地平線閃爍——口渴於預測的我們仍會追逐它,即使它只是海市蜃樓。」