席佛把自己 2003–2007 年的撲克歲月寫成一個「水位」(water level)的故事:當業餘玩家湧入時,水位低、平庸的高手都能賺錢;當立法與業界結構改變、水位升高,多數人立刻從鯊魚變成餌魚。本章是貝氏推理的應用題:撲克高手不是預測下一張牌,而是不斷更新「對手手牌分布」的後驗機率,並學會將自身的命中率與運氣分開。

撲克熱潮:Moneymaker 與網路撲克#

2003 年的兩個導火線造就「撲克熱(poker boom)」:

  • 27 歲業餘玩家、田納西會計師 Chris Moneymaker,從 39 美元線上資格賽一路打進世界撲克大賽(WSOP)並奪冠,獲得 250 萬美元獎金;ESPN 把他的故事剪成迷你影集反覆播出。
  • Party Poker、PokerStars 等網路撲克平台積極行銷,2003 年起成為主流。
  • WSOP 主賽事(買入 1 萬美元)的人數從 Moneymaker 奪冠那年的 839 人,三年內爆增到 8,773 人。

Figure 10-1: 世界撲克大賽主賽事參賽人數,1970–2006

ESPN 的剪輯讓觀眾以為撲克簡單、好賺、節奏緊湊。

  • 為了把 40 小時、800 多人的賽事壓進 6 小時節目,他們只播了少數手牌。
  • 「洞察攝影機(hole cam)」讓家中觀眾同時看到所有人的底牌,造成上帝視角的錯覺。
  • 解說員把 Moneymaker 每個動作詮釋為英明的判讀——其實他多半是運氣好。

席佛當年正在 KPMG 做轉移定價顧問,被同事邀請開盤。他從 Pacific Poker 領了 25 美元免費籌碼,輸掉後再充值 100 美元,連勝六個月後辭職全職打牌——「我就像把系統破解了一樣自由」。

撲克玩家如何「預測」對手的牌#

好的撲克玩家不是預測下一張牌,而是預測對手的手牌分布

德州撲克每位玩家從 1,326 種可能組合中拿到一手;高手所做的「讀牌(hand reading)」就是把這 1,326 種可能逐步收斂、為每一種賦予機率。

Figure 10-2A: 對手手牌範圍的機率表示

決策步驟基本上是貝氏:

  • 開局前用先驗(player profile):對手是緊/鬆、被動/激進,年齡、國籍、性別都是參考——刻板印象只要 55% 的時候對,就有可用之處。
  • 隨著動作(call、raise、fold)展開,每個事件都更新後驗——這是 Bayes 推理在現實世界中最直觀的應用之一。

一場「不簡單」的牌局#

席佛舉一個 5/10 無限注德州撲克的範例。對手「律師」(Lawyer)的形象:六十多歲、保守、穩定。我們手上是一對 8。

演化過程:

  • 我們 raise 25,他 call。
  • 翻牌 K♣ 9♣ 3——我們的對 8 沒升級,但他不一定強。
  • 我們下注 35,他再 call。對手手牌分布:30% 已成 K 對以上、20% 中對(仍贏我們)、25% 同花順抽牌、25% 弱牌或詐唬。
  • Turn 出 8♥,我們做出三條 8——下注 100,他 call。範圍進一步收窄至 ~75 種組合。
  • River 出 5♠(無同花),我們下 250,他突然 all-in 1,200。

直覺:他是不是抓到 7♣ 6♣ 的順子?應該蓋牌?

貝氏會告訴你:請不要蓋牌。

  • 他開局就剛好拿 7♣ 6♣ 的先驗只有 ~1%。
  • 即便此時 7♣ 6♣ 是「最像」的牌,也仍有許多其他可能:他可能誤判牌力(拿小三條、KK♠ + 5♦ 兩對甚至 AA);可能單純詐唬。
  • 我們只要勝率超過 35%,call 就有正期望值。電腦模擬大約給我們 2/3 勝率。

薛丁格的撲克手#

電視 ESPN 賽事配旁白容易給觀眾錯誤的「結果決定論」:解說員看到底牌就會說「Phil Ivey 應該蓋牌」。

2009 年 Tom Dwan vs Phil Ivey 一手價值百萬美元的撲克牌:

  • turn 牌讓 Ivey 做出 5 高順、Dwan 同時做出 7 高順——Dwan 是當下唯一可能勝出的牌。
  • 解說員說「能逃過這一手的只有 Phil Ivey」——但 Ivey 在當下只看自己手牌,依資訊應該有 ≥90% 勝率,蓋牌反而是大錯
  • Dwan:「能把對手的牌縮減到單一手牌的情況遠不如電視節目讓你以為的那樣常見。」

讓自己變得難以預測#

Dwan(線上 ID「durrrr」,刻意選不順眼以激怒對手)17 歲在 Full Tilt Poker 存入 50 美元起步,後來成為線上 NLHE 的頂尖掠食者:

  • 每月數百萬美金流經他的帳戶。
  • 他在 2009 年公開挑戰世界上任何人(除好友 Galfond),三人應戰,Dwan 贏其二。
  • 他低調但思維高度機率化:「在大多數場域,重要的不是答 Yes 或 No,而是給出一個機率。」

撲克最重要的兩件事:

  • 第一:讀牌——估出對手手牌的機率分布。
  • 第二:讓自己難以被讀——刻意把可能的範圍擴大、混淆對手的條件機率計算。

席佛自己的策略是用一些「非預期」的牌(如 7♣ 6♣)做 raise:

  • 翻牌大時,對手以為你抓到大牌,會棄掉中等牌;翻牌小時,你反而可能命中。
  • 一旦對手識破,他們會更傾向 call——這時你拿 KK 等強牌反而更好賺。
  • 「最強和最弱的玩家都打得很隨機,差別只在原因不同」——你可以借此偽裝成弱者再吃對手。

預測的學習曲線:80/20 法則#

「預測的帕雷托法則(Pareto Principle of Prediction)」:

  • 把基本功做對(折掉爛牌、認真評估對手範圍、量化機率)就能拿到約 80% 的最佳表現。
  • 接下來每多一分準度,需要的努力呈指數級增加。
  • 在競爭激烈的領域(金融、頂尖撲克),你必須比別人準上那一點點才能存活;在「水位低」的領域,做對基本功就能輕鬆獲利。

Figure 10-6: 預測的帕雷托法則

席佛舉自己的例子:

  • 棒球:Beane 早期靠「上壘率比打擊率重要」這條基本功就賺進大量價值;現在每隊都懂。
  • 政治:FiveThirtyEight 在多數時候是和「不認真做預測」的電視名嘴比賽。
  • 撲克:2000 年代中期的水位被新手們拉得很低。

Figure 10-7: 競爭環境下的預測帕雷托法則

撲克泡沫的經濟學#

席佛把線上 NLHE 玩家依長期勝率排序十等分:

  • 每 100 手最強玩家獲利約 $110,最弱玩家虧損超過 $400——還不如蓋掉每手(蓋牌的最大損失只有 $150 / 100 手)。
  • 一張桌只要有一條「魚」每 100 手帶來 ~$40 的補貼,剩下半桌玩家就有可能維持小幅獲利。

Figure 10-8A: $5/$10 NLHE 桌每 100 手估計盈虧

但魚被吃掉後,整個生態會反向級聯:原本的次差變成新魚,再被淘汰。

  • Cirque du Soleil 的 CEO Guy Laliberté 據傳 2008 年於線上撲克輸掉 1,700 萬美元——對億萬富翁就像散戶在 21 點輸幾百塊。
  • 多數情況下,是一連串輪流貢獻一千、幾千美元的小魚維持生態。
  • 若立法或行銷環境改變,魚的供應立刻枯竭。

Figure 10-8B: 魚被淘汰後的每 100 手估計盈虧

撲克泡沫如何破裂#

2006 年 10 月,美國國會通過《非法網路賭博執行法》(UIGEA):

  • 該法不直接禁玩撲克,但禁止第三方資金通道,等於「玩可以、籌碼進不來」。
  • Party Poker 兩週內封鎖美國玩家,股價當日暴跌 65%。
  • BetOnSports CEO 在德州轉機時被捕,緊接而來的還有更多起訴。

撲克生態崩盤後,水位立刻拉高。

  • 席佛把多數獲利留在 Party Poker、行銷激進、魚最多的場子;封鎖後他到 PokerStars 開始連敗,2006 年最後幾個月輸了 $75,000,2007 年再輸 $60,000。
  • 大量業餘玩家退場,剩下的多為職業玩家——「鯊魚開始彼此互咬」。
  • 2011 年 DOJ「Black Friday」起訴讓多家網站停運,部分網站破產,玩家本金無法贖回。

對席佛來說,這次失敗反而讓他把心力轉向政治預測,孵出 FiveThirtyEight。但這並未讓他忘記撲克的另一個教訓——撲克的波動極大。

運氣 vs 技術#

席佛繪出一個矩陣:

運氣低運氣高
技術低井字遊戲輪盤
技術高西洋棋撲克

撲克與棒球極相似:技術差距明顯,但短期結果幾乎被運氣支配。

  • 2011 年 4 月與 5 月美聯打者打擊率的相關係數接近 0(Brendan Ryan 4 月打 .184、5 月打 .384);要拉長到整季甚至生涯才看得出差異。

Figure 10-9: 美聯打者 4 月與 5 月打擊率

  • 一個每 100 手平均贏 $200 的優秀 limit hold’em 玩家,標準差可達 $3,200——即使在 60,000 手後仍可能輸 $35,000。
  • 這就是為什麼撲克常被稱為「最難賺的一個輕鬆飯碗」。

用貝氏統計判定自己是否真的是長期贏家。

《The Mathematics of Poker》一書計算過:在 $100/$200 limit 桌打了 10,000 手贏了 $30,000 的玩家,仍有過半機率其實是長期輸家。

撲克的「平均玩家必輸」因為莊家抽水(rake)已經先把錢拿走,先驗就應偏悲觀。

撲克玩家的妄想#

Dwan:「撲克裡所有事情都繞著一群以為自己是長線贏家、實際上不是的人發生。」

撲克程式作者 Darse Billings:「我從未看過任何遊戲讓人類如此自大。如果電腦程式靠人類的虛榮維生,撲克對它而言就是御膳。」

過度自信不是撲克獨有:第 11 章將討論華爾街交易員。研究顯示,52% 的線上撲克玩家有大學學歷,是美國平均的兩倍——他們聰明到知道有人能長期贏,卻也聰明到自欺。

為什麼我們會 Tilt#

職業玩家 Tommy Angelo 在 32 歲時辭去鼓手與鋼琴手工作轉戰全職撲克。他的書《Elements of Poker》用一整段排比描寫 tilt:

Angelo 的 tilt 詞典(節錄):

蒸氣式 tilt、悶燒式 tilt、太鬆 tilt、太緊 tilt、太兇 tilt、太被動 tilt、賭注太高 tilt、打太久 tilt、太累 tilt、entitlement tilt、被詐唬 tilt、最經典的「我得追回去 tilt」與「demolition tilt」。

  • 即便擁有世界級水準,只要 10% 的時間在 tilt 上,整體仍可能虧損。
  • Angelo 後來轉職教練:「我發現別人的妄想很容易看見。如果其他人都妄想,我也一定如此。」
  • 「沒有人不會 tilt」——他眼中那是另一句來自妄想者的妄想。

席佛自己的 tilt 觸發因素是「entitlement(覺得自己應該贏)」:當他正確識破對方詐唬,對方卻在 river 抽中神牌取勝時,他會用糟糕的決策把自己「重新平衡」回該輸的水準。

超越「以結果論英雄」#

美國文化偏好結果導向:誰賺到錢、誰出名,誰就被視為應得。

預測領域更是如此——抓到股市底部的投資人是天才,即便只是運氣;抓不到的就被視為平庸。

但區別「運氣」與「技術」是預測者必須的工夫:

  • 信評機構在金融崩盤後就用「我們只是不走運」自我洗白。
  • 反之我們也常把成功預測過度歸功於技術。

Dwan:「任何人覺得自己已經夠強、撲克已被解開了,他正在準備迎接大幅下跌。」

Tommy Angelo 對學員的建議:

  • 提升自我覺察、學會分辨可控與不可控。
  • 部分學員配合冥想練習,重點不在禪修本身,而是逼迫自己看見決策過程。

撲克控制的是決策過程,不是發牌。識破對手詐唬後即使輸了,也應該感到滿意;以更少的結果焦慮反而換來更穩定的勝率。

我們是住在不確定宇宙裡的不完美生物。

預測失敗時,我們無法絕對知道是模型錯了還是運氣不好。最接近的解方,是與訊號和雜訊的共存達成某種平靜——承認兩者都是宇宙的不可化約的一部分,並學會欣賞它們本來的樣子。