越來越少的錯誤

席佛以運動下注高手沃格里斯（Bob Voulgaris）的故事帶出全書最重要的工具——貝氏定理（Bayes’s theorem）。本章對比 18 世紀的貝氏／拉普拉斯與 20 世紀的費雪（R. A. Fisher）兩種統計傳統，說明為什麼「先驗（prior）＋新證據（likelihood）＝後驗（posterior）」的思考方式，比 p 值與顯著性檢定更貼近真實世界的預測問題。

沃格里斯的湖人豪賭#

沃格里斯出身曼尼托巴溫尼伯，父親曾擁千萬美金身家、最後輸光於賭博。他靠夏季爬樹（每棵 7 美分）、機場接運行李，存到大學畢業前的 8 萬美元——但這金額對他而言仍嫌少。

1999–2000 球季前，洛杉磯湖人剛簽下傑克遜（Phil Jackson），擁有歐尼爾（Shaquille O’Neal）與才 21 歲的布萊恩（Kobe Bryant）。

拉斯維加斯一開盤湖人奪冠賠率為 4:1。
開季 7 戰 5 勝，但因布萊恩傷停與媒體仍盯著前一季的混亂，賠率被拉長為 6.5:1。
沃格里斯認為媒體與莊家都把太多權重放在小樣本，忽略 1997–98 年的 61–21 戰績與好教練的存在。
他把 8 萬美元（一切積蓄）押湖人奪冠，命中可贏 50 萬美元。

賽季的後續：

湖人拿下例行賽 67–15，季後賽四連勝太陽、五場險勝國王。
西區決賽對拓荒者，湖人 3–1 領先後被連扳兩場，G7 主場再被拓荒者一度領先 16 分。
第四節拓荒者體力崩潰，湖人連得分上門，最後以布萊恩—歐尼爾的空中接力鎖定勝局。
兩週後湖人擊敗溜馬，自魔術強森時代後再奪冠。沃格里斯一夕半個千萬富翁。

維加斯給湖人的隱含奪冠機率約 13%；沃格里斯估計接近 25%。
結果機率淨損益
奪冠 25% +$520,000
未奪冠 75% −$80,000
期望值 +$70,000
對成功的賭徒而言，未來不是是非題，而是隨新資訊而閃爍的機率分布。當你估計的機率與市場賠率出現足夠大的偏離時，才下注。

結果	機率	淨損益
奪冠	25%	+$520,000
未奪冠	75%	−$80,000
期望值		+$70,000

賭徒如何思考#

沃格里斯如今已能負擔較小的勝率優勢，每晚下三、四注：

沒有秘訣，只有上千條小訊號：自建的比賽模擬器、每場親看、雇助手繪製防守站位、追幾十位 NBA 球員的 Twitter、解讀教練記者會用語。
「教練說想讓球隊『學好戰術』、『打好基本功』」常暗示要放慢節奏。
例：2002 年球季尾聲，他注意到騎士的對戰常超過大小分線——點研究後發現問題出在自私先發後衛戴維斯（Ricky Davis）正逢自由球員年，極力衝個人數據。對手球隊也常已出局而樂於配合。
騎士最後三週的場均得分從 192 飆到 207——投「Over」幾乎像撿錢。

找到模式並不難——資料一多，模式遍地都是。難的是分辨「訊號」還是「雜訊」。
沃格里斯的方法是：用對籃球的領域知識作為「先驗」，再讓資料快速分辨真偽。這種「先有故事、再用證據檢驗」的思維就是貝氏推理。

貝氏的意外遺產#

托馬斯・貝氏（Thomas Bayes，1701？–1761）是英國非國教派牧師，因身份被牛津、劍橋拒於門外，赴愛丁堡求學。他生平資料極少，連肖像是否真為其本人都有爭議。

早期論文〈Divine Benevolence〉處理神義論：別把人類的不完美誤當作上帝的不完美。
死後友人普萊斯（Richard Price）把他的論文〈An Essay toward Solving a Problem in the Doctrine of Chances〉送進皇家學會（1763）。
普萊斯舉的例子：一個剛出生的人首次看見日出，他不知道明天太陽是否會再升起；隨著每一天太陽如約升起，他的信心會逐漸（但永遠不到 100%）逼近「太陽必升」。

這個觀點與蘇格蘭哲學家休謨（David Hume）的懷疑論相對：休謨認為既然不能確定明天的太陽會升，「會升」與「不會升」一樣不理性。貝氏與普萊斯則主張理性是機率性的——別怪自然，是你太蠢；走出懷疑論的殼，做出預測，便能慢慢逼近真理。

機率與進步#

把貝氏定理寫成今天通行數學形式的，是法國天文學家、數學家拉普拉斯（Pierre-Simon Laplace）。
他原本相信「給我所有粒子的位置與作用力，就能完美預測一切」。但木星與土星的觀測資料異常困擾著他——彷彿木星將墜入太陽、土星將飄向外太空。觀測儀器粗糙是主因，他便發展出機率推論來補位。對他而言，機率正是「無知」與「知識」之間的中途。

從貝氏到拉普拉斯，18 世紀的思想家就明白：機率、預測、科學進步三者環環相扣。20 世紀「測量誤差」典範的興起，反而把預測與不確定性的真意推到一旁。

貝氏定理的簡單數學#

貝氏定理只是一條代數恆等式，三個已知 → 一個未知。
它處理的是條件機率：在某事件已經發生的條件下，假設為真的機率。

席佛以情境舉例：

出差回家在抽屜發現一條陌生的內褲。
P(內褲 ∣ 出軌)：若伴侶確實出軌，內褲出現的機率，例設 50%。
P(內褲 ∣ 沒出軌)：若沒出軌也可能（行李混淆、信任的女性朋友借宿、忘記包裝送禮），共合 5%。
先驗 P(出軌)：根據統計，已婚伴侶任一年出軌率約 4%。
套入貝氏定理 → 後驗 P(出軌 ∣ 內褲) ≈ 29%。

直覺上「鐵證如山」，數學上仍只有 29%——因為先驗本身偏低。

強先驗的另一個典型：40 多歲女性乳癌。
該年齡層乳癌實際發生率約 1.4%。
假陽性率約 10%、敏感度約 75%。
套入貝氏定理：陽性結果下實際罹癌機率僅約 10%。
這也是為何醫師多建議 50 歲後再開始定期乳癌篩檢——先驗機率提高，檢測的條件機率才有意義。
一份問卷顯示，僅 3% 的美國成人能算出正確答案。

強證據可以瞬間翻轉先驗#

貝氏定理不只解釋慣性，也解釋瞬間翻轉：

9/11 早晨，曼哈頓高樓被恐怖攻擊的先驗機率約 1/20,000。
1945（帝國大廈）、1946（華爾街 40 號）顯示：曼哈頓飛機意外撞樓的歷史機率約每 25,000 飛行日 2 起 → 1/12,500。
第一架撞上世貿後，後驗瞬間升到約 38%。
第二架撞上時，再代入計算，後驗達 99.99%——一個晴朗早晨的兩起意外幾乎不可能。

席佛強調：貝氏不是讓你絕對精準，而是讓你思考機率——不需要相信宇宙本質隨機，只要承認自己的知識有限就足夠。

偽陽性的問題#

不會貝氏式思考的代價：偽陽性會吞噬整個科學。
Ioannidis 2005 的論文〈為何多數已發表研究結果是錯的〉之後，拜耳實驗室證實無法重現約 2/3 的醫學期刊正向結論。
在大數據時代，這個問題只會更嚴重——例如 4.5 萬個經濟變數的兩兩配對是 10 億組假設；而真實的因果關係並沒有跟著資訊量同步增加。

設想一個圖：

真假設裡 80% 被正確判定為真。
假假設裡 90% 被正確拒絕。
但真假設本來就稀少時，被宣告為「真」的當中，約有 2/3 其實是假的。

這就是費雪式統計顯著性與貝氏觀點的根本分歧：真相在沙堆中愈稀少，先驗就愈關鍵，否則再嚴格的閾值也只是製造偽陽性。

統計學如何從貝氏退回頻率派#

費雪（R. A. Fisher，1890–1962）是 20 世紀統計學最具影響力的人物：

他發明了顯著性檢定及其術語、奠定了今日仍主流的方法論。
他第一個在公開論文中以貶意使用「Bayesian」一詞，並斷言該理論「必須完全被拒絕」。
「頻率派（frequentism）」由他奠基，主張不確定性來自「對母體取樣」，與你對世界的信念無關。

頻率派的盲點：
政治民調的「抽樣誤差」只是不確定性的一小部分。2008 年新罕布夏初選 1.5 萬人受訪，理論誤差 ±0.8 個百分點，實際誤差約十倍——希拉蕊贏 3 個百分點，民調預測她輸 8 個百分點。
偏誤的測量工具，無論測幾百萬次都對不準目標。
頻率派把問題封進實驗室，不鼓勵研究者思考假設的合理性，因此可以一視同仁地對待「香煙導致肺癌」與「蟾蜍預測地震」等顯著性結果。

沒有脈絡的資料毫無用處#

費雪晚年最大的污點是反對「香菸導致肺癌」：

1950 年代多篇研究（含貝氏方法）已建立統計與臨床上的因果證據。
費雪堅稱那只是相關，不是因果，甚至說「肺癌患者因肺痛而吸菸」。
部分原因是他是菸草公司付費顧問、本人也是老菸槍。但更關鍵的，是他的統計哲學從不要求他考慮假設的合理性。

「相關不等於因果」是個老生常談，但費雪式方法不會幫你判斷哪些相關蘊含因果、哪些不蘊含。
一輩子這樣思考，最後連「香菸與蟾蜍」這類差異都看不出來。

Bob the Bayesian#

回到沃格里斯：

他下注時要求自己估計勝率至少 54%（用以涵蓋抽水與風險）。
即使是世界級高手，他長期命中率也只有 57%。
把 53% 的估計提升到 56%，就決定了他能否養活生計。

顯著性檢定那種「±2σ」的閾值對賭徒太粗糙；他需要的是把領域知識轉化成能更新機率的先驗。
沃格里斯的工作流程，幾乎是科學方法的純粹版本：
科學方法沃格里斯的籃球版本
觀察現象騎士的比賽常打超大小分線
提出假設戴維斯為了個人合約年想多得分
提出可檢證預測戴維斯動機到本季結束都不變，故騎士比賽繼續高分
檢驗預測下注

科學方法	沃格里斯的籃球版本
觀察現象	騎士的比賽常打超大小分線
提出假設	戴維斯為了個人合約年想多得分
提出可檢證預測	戴維斯動機到本季結束都不變，故騎士比賽繼續高分
檢驗預測	下注

當沃格里斯對假設信心強，他能更早、更積極地下注；當市場上的數字像 1999 年湖人開季那樣其實沒有實質訊號，他不為所動。

通往「越來越少錯誤」的貝氏路#

貝氏觀點承認我們永遠不會 100% 客觀，但能朝著更不主觀、更不非理性、更少錯誤前進。
貝氏定理允許你持有 0% 或 100% 的信念——但這意味著任何證據都不能撼動你。如果費雪心中「香菸致癌」先驗為 10⁻⁵，再多證據都救不回他。
兩個人若分別堅信 0% 與 100%，再多辯論都無解；許多戰爭就是這種前提下的延伸。

貝氏定理的另一個性質：當證據夠多，不同先驗會收斂到同一結論、收斂到真理。
席佛模擬三位投資人對「現在是牛市還是熊市」的初始信念差異很大（10% / 50% / 90%）；只要市場長期上漲機率為 60%，每天用貝氏更新後，他們的信念都會逼近「牛市」幾乎 100%。

貝氏將會贏#

費雪式範式正在被重新檢視：

多領域學者提倡停止對大學部教授頻率派；部分專業期刊甚至考慮禁用 p 值。
過去十年的方法論文獻幾乎一面倒推進貝氏方向。
沃格里斯不會在每次決策時拿出貝氏公式計算，但他用領域知識形成假設、再以資料更新——這就是貝氏式行動。

「貝氏定理預測：貝氏派將會贏。」
預測是衡量我們對世界理解程度的尺度；好的預測者不假裝自己對真理握有所有權，而是承諾每天讓自己「越來越少錯誤」。

沃格里斯的湖人豪賭#

Figure 8-1: 沃格里斯眼中的湖人賭注

賭徒如何思考#

貝氏的意外遺產#

機率與進步#

貝氏定理的簡單數學#

Figure 8-4: 貝氏定理——乳房 X 光案例

強證據可以瞬間翻轉先驗#

偽陽性的問題#

Figure 8-6: 偽陽性的圖示

統計學如何從貝氏退回頻率派#

沒有脈絡的資料毫無用處#

Bob the Bayesian#

Figure 8-7: 科學方法

通往「越來越少錯誤」的貝氏路#

Figure 8-8: 貝氏收斂

貝氏將會贏#