閃避驚奇的胡扯機器

粒子物理為何更可信？#

物理學素以「最硬的科學」聞名，而其中實驗粒子物理更是「Big Data」典範。CERN 的大型強子對撞機（LHC）每秒砸出上百億顆粒子，數據以兆計。

2011 年 12 月 CERN 宣布發現希格斯粒子（Higgs particle）：

這個發現之所以可信，不是因為他們用了傳統 5% 顯著性檢定——恰恰相反，他們刻意拒絕那個標準。

1984 年 CERN 宣稱發現「頂夸克（top quark）」，質量約為質子的 40 倍：

這種尷尬讓粒子物理學界對 p < 5% 失去信任。

粒子物理改用**「sigma 單位」**表達顯著性：

粒子物理界的口頭禪：「所有 3-sigma 結果中有一半是錯的」。若顯著性檢定真如多數人理解，3-sigma 應該每 370 次才錯一次——但實際接近 1/2。

2011 年義大利 OPERA 實驗宣稱中微子超越光速，數據超過 5σ。它不是僥倖——而是儀器接線出錯。即便如此，仍提醒我們：除了僥倖，還有「Error Some Place」（ESP，譯成「某處有錯」）。

把「結果僥倖機率 < 5%」當成 p 值的字面意義，必須先擁有強烈先驗。算下來：在傳統 p = 5% 結果下要把僥倖機率壓在 5%，你必須先有 90% 的把握結果不是僥倖。換言之，「典型顯著」結果幾乎沒有為你的信念加分。

多數「統計顯著」其實證據薄弱。即使把標準提高 50 倍到 p < 0.1%，仍要先有 30% 的非僥倖信念，才能讓僥倖機率降到 5% 以下。

不像費雪「胡扯機器」只看 p 值，貝葉斯推論引擎強迫研究者把：

兩者結合，才能得到我們真正想知道的：「結果為真的機率」。

許多搶眼的「科學突破」奠基於「統計顯著」結果。用貝葉斯定理檢驗，可得出簡單規則：絕大多數此類證據實在太薄弱——只能打動本來就「信徒」的人。對其餘人而言，請維持懷疑——並追問先驗。