席佛以運動下注高手沃格里斯(Bob Voulgaris)的故事帶出全書最重要的工具——貝氏定理(Bayes’s theorem)。本章對比 18 世紀的貝氏/拉普拉斯與 20 世紀的費雪(R. A. Fisher)兩種統計傳統,說明為什麼「先驗(prior)+新證據(likelihood)=後驗(posterior)」的思考方式,比 p 值與顯著性檢定更貼近真實世界的預測問題。

沃格里斯的湖人豪賭#

沃格里斯出身曼尼托巴溫尼伯,父親曾擁千萬美金身家、最後輸光於賭博。他靠夏季爬樹(每棵 7 美分)、機場接運行李,存到大學畢業前的 8 萬美元——但這金額對他而言仍嫌少。

1999–2000 球季前,洛杉磯湖人剛簽下傑克遜(Phil Jackson),擁有歐尼爾(Shaquille O’Neal)與才 21 歲的布萊恩(Kobe Bryant)。

  • 拉斯維加斯一開盤湖人奪冠賠率為 4:1。
  • 開季 7 戰 5 勝,但因布萊恩傷停與媒體仍盯著前一季的混亂,賠率被拉長為 6.5:1。
  • 沃格里斯認為媒體與莊家都把太多權重放在小樣本,忽略 1997–98 年的 61–21 戰績與好教練的存在。
  • 他把 8 萬美元(一切積蓄)押湖人奪冠,命中可贏 50 萬美元。

賽季的後續:

  • 湖人拿下例行賽 67–15,季後賽四連勝太陽、五場險勝國王。
  • 西區決賽對拓荒者,湖人 3–1 領先後被連扳兩場,G7 主場再被拓荒者一度領先 16 分。
  • 第四節拓荒者體力崩潰,湖人連得分上門,最後以布萊恩—歐尼爾的空中接力鎖定勝局。
  • 兩週後湖人擊敗溜馬,自魔術強森時代後再奪冠。沃格里斯一夕半個千萬富翁。

維加斯給湖人的隱含奪冠機率約 13%;沃格里斯估計接近 25%。

結果機率淨損益
奪冠25%+$520,000
未奪冠75%−$80,000
期望值+$70,000

對成功的賭徒而言,未來不是是非題,而是隨新資訊而閃爍的機率分布。當你估計的機率與市場賠率出現足夠大的偏離時,才下注。

Figure 8-1: 沃格里斯眼中的湖人賭注

賭徒如何思考#

沃格里斯如今已能負擔較小的勝率優勢,每晚下三、四注:

  • 沒有秘訣,只有上千條小訊號:自建的比賽模擬器、每場親看、雇助手繪製防守站位、追幾十位 NBA 球員的 Twitter、解讀教練記者會用語。
  • 「教練說想讓球隊『學好戰術』、『打好基本功』」常暗示要放慢節奏。
  • 例:2002 年球季尾聲,他注意到騎士的對戰常超過大小分線——點研究後發現問題出在自私先發後衛戴維斯(Ricky Davis)正逢自由球員年,極力衝個人數據。對手球隊也常已出局而樂於配合。
  • 騎士最後三週的場均得分從 192 飆到 207——投「Over」幾乎像撿錢。

找到模式並不難——資料一多,模式遍地都是。難的是分辨「訊號」還是「雜訊」。

沃格里斯的方法是:用對籃球的領域知識作為「先驗」,再讓資料快速分辨真偽。這種「先有故事、再用證據檢驗」的思維就是貝氏推理。

貝氏的意外遺產#

托馬斯・貝氏(Thomas Bayes,1701?–1761)是英國非國教派牧師,因身份被牛津、劍橋拒於門外,赴愛丁堡求學。他生平資料極少,連肖像是否真為其本人都有爭議。

  • 早期論文〈Divine Benevolence〉處理神義論:別把人類的不完美誤當作上帝的不完美。
  • 死後友人普萊斯(Richard Price)把他的論文〈An Essay toward Solving a Problem in the Doctrine of Chances〉送進皇家學會(1763)。
  • 普萊斯舉的例子:一個剛出生的人首次看見日出,他不知道明天太陽是否會再升起;隨著每一天太陽如約升起,他的信心會逐漸(但永遠不到 100%)逼近「太陽必升」。

這個觀點與蘇格蘭哲學家休謨(David Hume)的懷疑論相對:休謨認為既然不能確定明天的太陽會升,「會升」與「不會升」一樣不理性。貝氏與普萊斯則主張理性是機率性的——別怪自然,是你太蠢;走出懷疑論的殼,做出預測,便能慢慢逼近真理。

機率與進步#

把貝氏定理寫成今天通行數學形式的,是法國天文學家、數學家拉普拉斯(Pierre-Simon Laplace)。

他原本相信「給我所有粒子的位置與作用力,就能完美預測一切」。但木星與土星的觀測資料異常困擾著他——彷彿木星將墜入太陽、土星將飄向外太空。觀測儀器粗糙是主因,他便發展出機率推論來補位。對他而言,機率正是「無知」與「知識」之間的中途。

從貝氏到拉普拉斯,18 世紀的思想家就明白:機率、預測、科學進步三者環環相扣。20 世紀「測量誤差」典範的興起,反而把預測與不確定性的真意推到一旁。

貝氏定理的簡單數學#

貝氏定理只是一條代數恆等式,三個已知 → 一個未知。

它處理的是條件機率:在某事件已經發生的條件下,假設為真的機率。

席佛以情境舉例:

出差回家在抽屜發現一條陌生的內褲。

  • P(內褲 ∣ 出軌):若伴侶確實出軌,內褲出現的機率,例設 50%。
  • P(內褲 ∣ 沒出軌):若沒出軌也可能(行李混淆、信任的女性朋友借宿、忘記包裝送禮),共合 5%。
  • 先驗 P(出軌):根據統計,已婚伴侶任一年出軌率約 4%。
  • 套入貝氏定理 → 後驗 P(出軌 ∣ 內褲) ≈ 29%

直覺上「鐵證如山」,數學上仍只有 29%——因為先驗本身偏低。

強先驗的另一個典型:40 多歲女性乳癌。

  • 該年齡層乳癌實際發生率約 1.4%。
  • 假陽性率約 10%、敏感度約 75%。
  • 套入貝氏定理:陽性結果下實際罹癌機率僅約 10%。
  • 這也是為何醫師多建議 50 歲後再開始定期乳癌篩檢——先驗機率提高,檢測的條件機率才有意義。
  • 一份問卷顯示,僅 3% 的美國成人能算出正確答案。

Figure 8-4: 貝氏定理——乳房 X 光案例

強證據可以瞬間翻轉先驗#

貝氏定理不只解釋慣性,也解釋瞬間翻轉:

9/11 早晨,曼哈頓高樓被恐怖攻擊的先驗機率約 1/20,000。

  • 1945(帝國大廈)、1946(華爾街 40 號)顯示:曼哈頓飛機意外撞樓的歷史機率約每 25,000 飛行日 2 起 → 1/12,500。
  • 第一架撞上世貿後,後驗瞬間升到約 38%。
  • 第二架撞上時,再代入計算,後驗達 99.99%——一個晴朗早晨的兩起意外幾乎不可能。

席佛強調:貝氏不是讓你絕對精準,而是讓你思考機率——不需要相信宇宙本質隨機,只要承認自己的知識有限就足夠。

偽陽性的問題#

不會貝氏式思考的代價:偽陽性會吞噬整個科學。

Ioannidis 2005 的論文〈為何多數已發表研究結果是錯的〉之後,拜耳實驗室證實無法重現約 2/3 的醫學期刊正向結論。

在大數據時代,這個問題只會更嚴重——例如 4.5 萬個經濟變數的兩兩配對是 10 億組假設;而真實的因果關係並沒有跟著資訊量同步增加。

設想一個圖:

  • 真假設裡 80% 被正確判定為真。
  • 假假設裡 90% 被正確拒絕。
  • 但真假設本來就稀少時,被宣告為「真」的當中,約有 2/3 其實是假的

Figure 8-6: 偽陽性的圖示

這就是費雪式統計顯著性與貝氏觀點的根本分歧:真相在沙堆中愈稀少,先驗就愈關鍵,否則再嚴格的閾值也只是製造偽陽性。

統計學如何從貝氏退回頻率派#

費雪(R. A. Fisher,1890–1962)是 20 世紀統計學最具影響力的人物:

  • 他發明了顯著性檢定及其術語、奠定了今日仍主流的方法論。
  • 他第一個在公開論文中以貶意使用「Bayesian」一詞,並斷言該理論「必須完全被拒絕」。
  • 「頻率派(frequentism)」由他奠基,主張不確定性來自「對母體取樣」,與你對世界的信念無關。

頻率派的盲點:

  • 政治民調的「抽樣誤差」只是不確定性的一小部分。2008 年新罕布夏初選 1.5 萬人受訪,理論誤差 ±0.8 個百分點,實際誤差約十倍——希拉蕊贏 3 個百分點,民調預測她輸 8 個百分點。
  • 偏誤的測量工具,無論測幾百萬次都對不準目標。
  • 頻率派把問題封進實驗室,不鼓勵研究者思考假設的合理性,因此可以一視同仁地對待「香煙導致肺癌」與「蟾蜍預測地震」等顯著性結果。

沒有脈絡的資料毫無用處#

費雪晚年最大的污點是反對「香菸導致肺癌」:

  • 1950 年代多篇研究(含貝氏方法)已建立統計與臨床上的因果證據。
  • 費雪堅稱那只是相關,不是因果,甚至說「肺癌患者因肺痛而吸菸」。
  • 部分原因是他是菸草公司付費顧問、本人也是老菸槍。但更關鍵的,是他的統計哲學從不要求他考慮假設的合理性。

「相關不等於因果」是個老生常談,但費雪式方法不會幫你判斷哪些相關蘊含因果、哪些不蘊含。

一輩子這樣思考,最後連「香菸與蟾蜍」這類差異都看不出來。

Bob the Bayesian#

回到沃格里斯:

  • 他下注時要求自己估計勝率至少 54%(用以涵蓋抽水與風險)。
  • 即使是世界級高手,他長期命中率也只有 57%。
  • 把 53% 的估計提升到 56%,就決定了他能否養活生計。

顯著性檢定那種「±2σ」的閾值對賭徒太粗糙;他需要的是把領域知識轉化成能更新機率的先驗。

沃格里斯的工作流程,幾乎是科學方法的純粹版本:

科學方法沃格里斯的籃球版本
觀察現象騎士的比賽常打超大小分線
提出假設戴維斯為了個人合約年想多得分
提出可檢證預測戴維斯動機到本季結束都不變,故騎士比賽繼續高分
檢驗預測下注

Figure 8-7: 科學方法

當沃格里斯對假設信心強,他能更早、更積極地下注;當市場上的數字像 1999 年湖人開季那樣其實沒有實質訊號,他不為所動。

通往「越來越少錯誤」的貝氏路#

貝氏觀點承認我們永遠不會 100% 客觀,但能朝著更不主觀、更不非理性、更少錯誤前進。

  • 貝氏定理允許你持有 0% 或 100% 的信念——但這意味著任何證據都不能撼動你。如果費雪心中「香菸致癌」先驗為 10⁻⁵,再多證據都救不回他。
  • 兩個人若分別堅信 0% 與 100%,再多辯論都無解;許多戰爭就是這種前提下的延伸。

貝氏定理的另一個性質:當證據夠多,不同先驗會收斂到同一結論、收斂到真理。

席佛模擬三位投資人對「現在是牛市還是熊市」的初始信念差異很大(10% / 50% / 90%);只要市場長期上漲機率為 60%,每天用貝氏更新後,他們的信念都會逼近「牛市」幾乎 100%。

Figure 8-8: 貝氏收斂

貝氏將會贏#

費雪式範式正在被重新檢視:

  • 多領域學者提倡停止對大學部教授頻率派;部分專業期刊甚至考慮禁用 p 值。
  • 過去十年的方法論文獻幾乎一面倒推進貝氏方向。
  • 沃格里斯不會在每次決策時拿出貝氏公式計算,但他用領域知識形成假設、再以資料更新——這就是貝氏式行動。

「貝氏定理預測:貝氏派將會贏。」

預測是衡量我們對世界理解程度的尺度;好的預測者不假裝自己對真理握有所有權,而是承諾每天讓自己「越來越少錯誤」。