粒子物理為何更可信?#
物理學素以「最硬的科學」聞名,而其中實驗粒子物理更是「Big Data」典範。CERN 的大型強子對撞機(LHC)每秒砸出上百億顆粒子,數據以兆計。
2011 年 12 月 CERN 宣布發現希格斯粒子(Higgs particle):
- 預期約十億次碰撞才出現一次跡象
- 必須從 10¹⁴ 次碰撞中找出真實訊號
這個發現之所以可信,不是因為他們用了傳統 5% 顯著性檢定——恰恰相反,他們刻意拒絕那個標準。
1984 年 CERN 的尷尬「發現」#
1984 年 CERN 宣稱發現「頂夸克(top quark)」,質量約為質子的 40 倍:
- 通過了傳統「統計顯著」門檻
- 但隨後資料顯示這只是隨機波動
- 真正的頂夸克後來在美國被發現,質量是當年宣稱的 4 倍以上
這種尷尬讓粒子物理學界對 p < 5% 失去信任。
5-sigma 的高標準#
粒子物理改用**「sigma 單位」**表達顯著性:
| sigma 等級 | 等同 p 值 | 意義 |
|---|---|---|
| 2σ | 5% | 費雪原始標準 |
| 3σ | 0.3% | 仍常見「半數錯」現象 |
| 4σ | 0.006% | 仍會褪色 |
| 5σ | 約 0.00006% | 發現門檻,比費雪嚴 80,000 倍 |
粒子物理界的口頭禪:「所有 3-sigma 結果中有一半是錯的」。 若顯著性檢定真如多數人理解,3-sigma 應該每 370 次才錯一次——但實際接近 1/2。
例外不是僥倖:超光速中微子#
2011 年義大利 OPERA 實驗宣稱中微子超越光速,數據超過 5σ。它不是僥倖——而是儀器接線出錯。即便如此,仍提醒我們:除了僥倖,還有「Error Some Place」(ESP,譯成「某處有錯」)。
用貝葉斯解構顯著性#
把「結果僥倖機率 < 5%」當成 p 值的字面意義,必須先擁有強烈先驗。 算下來:在傳統 p = 5% 結果下要把僥倖機率壓在 5%,你必須先有 90% 的把握結果不是僥倖。 換言之,「典型顯著」結果幾乎沒有為你的信念加分。
各等級證據需要的先驗信念#
| p 值 | 常見領域 | 你必須先擁有的「非僥倖信念」 |
|---|---|---|
| 10% | 經濟學、社會學、爭議性風險議題 | 95%:只能說服已相信者 |
| 5% | 行為、社會、醫學科學等 | 90%:原本就深信不疑才會驚訝 |
| 1% | 醫學、遺傳、環境科學 | 75%:必須相當有把握 |
| 0.3% (3σ) | 硬科學實驗;粒子物理早期跡象 | 50%:足以說服開放心態的人 |
| 0.1% | 遺傳學、流行病學 | 30%:除非極度懷疑論者,多數人會被打動 |
| 0.00006% (5σ) | 高能/粒子物理發現 | 0.1%:除了你的競爭對手都會接受 |
多數「統計顯著」其實證據薄弱。 即使把標準提高 50 倍到 p < 0.1%,仍要先有 30% 的非僥倖信念,才能讓僥倖機率降到 5% 以下。
「貝葉斯推論引擎」的價值#
不像費雪「胡扯機器」只看 p 值,貝葉斯推論引擎強迫研究者把:
- 數據
- 先驗信念
兩者結合,才能得到我們真正想知道的:「結果為真的機率」。
結語#
許多搶眼的「科學突破」奠基於「統計顯著」結果。 用貝葉斯定理檢驗,可得出簡單規則:絕大多數此類證據實在太薄弱——只能打動本來就「信徒」的人。 對其餘人而言,請維持懷疑——並追問先驗。