粒子物理為何更可信?#

物理學素以「最硬的科學」聞名,而其中實驗粒子物理更是「Big Data」典範。CERN 的大型強子對撞機(LHC)每秒砸出上百億顆粒子,數據以兆計。

2011 年 12 月 CERN 宣布發現希格斯粒子(Higgs particle):

  • 預期約十億次碰撞才出現一次跡象
  • 必須從 10¹⁴ 次碰撞中找出真實訊號

這個發現之所以可信,不是因為他們用了傳統 5% 顯著性檢定——恰恰相反,他們刻意拒絕那個標準。

1984 年 CERN 的尷尬「發現」#

1984 年 CERN 宣稱發現「頂夸克(top quark)」,質量約為質子的 40 倍:

  • 通過了傳統「統計顯著」門檻
  • 但隨後資料顯示這只是隨機波動
  • 真正的頂夸克後來在美國被發現,質量是當年宣稱的 4 倍以上

這種尷尬讓粒子物理學界對 p < 5% 失去信任。

5-sigma 的高標準#

粒子物理改用**「sigma 單位」**表達顯著性:

sigma 等級等同 p 值意義
5%費雪原始標準
0.3%仍常見「半數錯」現象
0.006%仍會褪色
約 0.00006%發現門檻,比費雪嚴 80,000 倍

粒子物理界的口頭禪:「所有 3-sigma 結果中有一半是錯的」。 若顯著性檢定真如多數人理解,3-sigma 應該每 370 次才錯一次——但實際接近 1/2。

例外不是僥倖:超光速中微子#

2011 年義大利 OPERA 實驗宣稱中微子超越光速,數據超過 5σ。它不是僥倖——而是儀器接線出錯。即便如此,仍提醒我們:除了僥倖,還有「Error Some Place」(ESP,譯成「某處有錯」)。

用貝葉斯解構顯著性#

把「結果僥倖機率 < 5%」當成 p 值的字面意義,必須先擁有強烈先驗。 算下來:在傳統 p = 5% 結果下要把僥倖機率壓在 5%,你必須先有 90% 的把握結果不是僥倖。 換言之,「典型顯著」結果幾乎沒有為你的信念加分

各等級證據需要的先驗信念#

p 值常見領域你必須先擁有的「非僥倖信念」
10%經濟學、社會學、爭議性風險議題95%:只能說服已相信者
5%行為、社會、醫學科學等90%:原本就深信不疑才會驚訝
1%醫學、遺傳、環境科學75%:必須相當有把握
0.3% (3σ)硬科學實驗;粒子物理早期跡象50%:足以說服開放心態的人
0.1%遺傳學、流行病學30%:除非極度懷疑論者,多數人會被打動
0.00006% (5σ)高能/粒子物理發現0.1%:除了你的競爭對手都會接受

多數「統計顯著」其實證據薄弱。 即使把標準提高 50 倍到 p < 0.1%,仍要先有 30% 的非僥倖信念,才能讓僥倖機率降到 5% 以下。

「貝葉斯推論引擎」的價值#

不像費雪「胡扯機器」只看 p 值,貝葉斯推論引擎強迫研究者把:

  • 數據
  • 先驗信念

兩者結合,才能得到我們真正想知道的:「結果為真的機率」。

結語#

許多搶眼的「科學突破」奠基於「統計顯著」結果。 用貝葉斯定理檢驗,可得出簡單規則:絕大多數此類證據實在太薄弱——只能打動本來就「信徒」的人。 對其餘人而言,請維持懷疑——並追問先驗。