席佛以 1997 年深藍(Deep Blue)擊敗西洋棋世界冠軍卡斯帕洛夫(Garry Kasparov)為主軸,討論電腦在預測中的恰當角色。本章貫穿三個提醒:電腦不是有靈的存在;它最強的場域是規則明確、資料豐富、需要大量重複運算的問題;而當你看見模型輸出令人費解的結果時,「bug」往往比「天才」更可能是答案。

機械土耳其人:人類對 AI 的早期想像#

19 世紀初,27 歲的愛倫坡(Edgar Allan Poe)寫下著名的揭密文章:所謂可在西洋棋戰勝拿破崙與富蘭克林的「機械土耳其人」,內部其實藏著一位西洋棋大師(後來證實為德國棋手 William Schlumberger)。

愛倫坡的真正洞見在於他抓到了「人工智慧」的兩種誤解:

  • 過度神化:他認為若機器真會下棋,就應「永遠完美」、不會輸棋;機器的失誤反證它必有人在操控。
  • 過度恐懼:機器會不會有一天接管我們?這份矛盾的崇拜與懼怕一直延續到現代——人們既覺得電腦完美無瑕,又把醫院預測系統幻想成《2001 太空漫遊》裡會掐死太空人的 HAL 9000。

大數據時代更需要對電腦保持成熟態度:科技是省力工具,但別期待機器替我們思考

2012 年兩名英國少年靠虛構的「股票機器人 MARL」(號稱每秒 1,986,832 次運算、無人類直覺)詐取 100 多萬美元——這正是過度信任電腦的代價。

西洋棋電腦的誕生#

  • 1912 年西班牙工程師托雷斯(Leonardo Torres y Quevedo)造出 El Ajedrecista,僅能處理三子殘局。
  • 1950 年 MIT 的香農(Claude Shannon)發表〈Programming a Computer for Playing Chess〉,奠定當今西洋棋程式的演算法骨幹。

香農把人機競爭看成一場勢均力敵的比較:

  • 電腦的四項優勢:運算速度、不犯計算錯誤、不偷懶、不情緒化。
  • 人類的四項優勢:思維彈性、想像力、推理力、學習力。

香農並未認為電腦勝出是必然。事實上,直到 1990 年代中期,人類仍佔上風。深藍與卡斯帕洛夫的兩次對戰,正是這個天平翻轉的瞬間。

西洋棋、預測與啟發法(heuristics)#

西洋棋是「決定性」遊戲,棋盤狀態完全可見,但組合爆炸讓人類無法窮舉。

  • 第一回合後可能的局面 = 4,000;第二回合 = 71,852;第三回合 = 9,132,484。
  • 整盤可能的下棋過程,數量被估到比宇宙原子數還多。

因為窮舉不可行,人與電腦都依賴「啟發法(heuristics)」——粗略但實用的「拇指規則」。

啟發法源自希臘字根,與「Eureka」同源。它必然帶來偏誤與盲點:例如「遇到危險動物就跑」對熊不適用——美國國家公園局建議遇到灰熊時保持靜止,必要時裝死。

卡斯帕洛夫的失敗預測#

1988 年初,世界排名第一的卡斯帕洛夫公開斷言「2000 年前不可能有電腦擊敗大師」,並戲言「若哪位大師有困難,我很樂意提供建議」。

  • 同年丹麥大師拉森(Bent Larsen)就敗於卡內基美隆研究生的 Deep Thought。
  • 卡斯帕洛夫 1989 年仍輕鬆擊敗 Deep Thought,並僅輕描淡寫地說「將來可能會有逼我用 100% 全力的電腦」。
  • IBM 收編 Deep Thought 團隊,深藍由此成型。1996 費城首戰深藍贏下首局但整體輸給卡斯帕洛夫;1997 年的紐約復仇賽,世界冠軍首次被一台電腦嚇住

開局:人類 vs 電腦#

棋局可分三段:開局、中局、殘局——各自考驗不同的能力。

開局看似電腦的天堂——資源最多、可能性最高、能高速運算(IBM 宣稱每秒 2 億局,卡斯帕洛夫每秒約 3 局)。

但開局目標最抽象,啟發法(控制中央、保護兵型)反而更有效;歷史資料庫也佔上風——98% 的競技開局集中於最佳的 4 種走法。

卡斯帕洛夫第 1 局策略:讓深藍盡早脫離資料庫

  • 第 3 步後,他與深藍走到的局面在百萬筆對戰中只出現過 1 次。
  • 沒有大樣本支撐的時候,純統計派就會崩盤——深藍必須開始「自己想」。

Figure 9-2: 卡斯帕洛夫第 1 局第 3 步後的局面

中局:廣度 vs 深度#

中局棋盤對戰,可能合法走法平均達 40 種:

  • 計算未來 3 個完整回合,開局約需 64,000,000 局面、中局約需 41 億局面。
  • 深藍 20 秒內可算完,卡斯帕洛夫需要 43 年。

高手與業餘的差別:高手不追求「完美一步」,而是判斷「夠好的一步」。

荷蘭心理學家 Adriaan de Groot 的研究顯示,業餘玩家常因執著於完美而動彈不得。

大師會在「廣度(探索多分支幾步)」與「深度(少分支算到深處)」間動態切換——這是元認知(metacognition)。同樣的權衡也發生在反恐情報、科學決策等領域。

戰術 vs 策略:電腦擅長前者#

電腦會用啟發法剪枝、把運算力放在最有潛力的分支,但缺乏「整盤是有機體」的策略觀。

  • 第 1 局第 32 步,卡斯帕洛夫以一個犧牲(rook for bishop)誘深藍接受——以分數計算深藍此時看似領先 1 個兵的價值。
  • 但卡斯帕洛夫把局面看成 3 個兵壓向白王、女王和主教斜線伺機而動的整體威脅。
  • 13 步後深藍認輸。「典型的電腦弱點,」卡斯帕洛夫說,「它一定很滿意自己的位置,但結果太深它判斷不出來。」

Figure 9-3A: 卡斯帕洛夫第 1 局第 32 步後的局面

Figure 9-3B: 局面的離散評分

Figure 9-3C: 局面的整體評估

「終局」前的詭異一步#

第 1 局結尾,深藍即將敗北卻做了不合常理的第 44 步——讓兵升后的威脅成真,下一步即認輸。

卡斯帕洛夫過後與棋訊作家 Friedel 用 Fritz 程式覆盤,得出結論:

深藍要麼選擇 20+ 步後仍會被將死的常規路線,要麼選擇了「推延敗局最久」的這一步——這意味著它能看見 20 步以外的劫難。

卡斯帕洛夫陷入心理動搖。

Figure 9-5: 深藍那一步令人困惑的走法

殘局:電腦的另一個強項#

殘局上的 6 子以下殘局已被全盤求解,部分 7 子殘局亦然。

  • 6 子局面所有勝、負、和已被記憶。
  • 部分解法竟需 517 步精準執行——人類完全做不到,電腦卻可記憶。
  • 這形成「黑洞效應」:一旦進入這些局面,電腦會把該贏的全贏、該和的全和。

Figure 9-4: 白方必勝的 262 步局面

第 2 局:人被嚇崩潰#

第 36 步,多數大師預期深藍把后推進;它卻選擇「兵交換 + 開放左翼」的更具策略性的一步。

  • 卡斯帕洛夫覺得這像他的宿敵 Karpov 的風格——「電腦不會無緣無故走這樣的棋,除非它能看 20 步以後」。
  • 第 45 步後他直接認輸,認為再也下不出和局。
  • 隔天助手用 Fritz 覆盤發現:再 7 步即可形成連續將軍、迫使深藍走和——他放棄了一個本可保住的和局。

卡斯帕洛夫的兩種猜測互相矛盾——這恰似愛倫坡對機械土耳其人的兩種解釋:

  • 電腦下得太好,所以裡面一定藏著人。
  • 或者它的智慧大到無人可及。

他在記者會上引用馬拉度納的「上帝之手」暗指 IBM 作弊。心理崩潰後的後續第 3 至 5 局全和,第 6 局以他極少使用的 Caro-Kann 防禦開局,僅 19 步後就投降。

那一步其實是 bug#

席佛拜訪深藍工程師 Murray Campbell(現主管 IBM 統計建模部門)。

Campbell 透露:第 1 局第 44 步的怪招其實是程式 bug。

  • 深藍當時無法選擇任何走法,便依「最後保險(fail-safe)」隨機挑了一步。
  • 該 bug 在 1997 年初一場測試對局曾出現,工程師以為已修好,實際還剩一個漏網狀況。
  • 對該局結果毫無實質影響——但讓卡斯帕洛夫誤以為深藍可洞見 20 步以後,引發他在第 2 局的崩潰。
  • 「卡斯帕洛夫從未想過那是個 bug。」

席佛把這段故事連到沃格里斯第 8 章的故事:他曾用模擬器下注 MLB,模型一直推 Phillies 的 Under。事後追查發現助手把費城主場「P-H-I」誤打成「P-H-l」(小寫 L),一個字元就讓模型在錯的訊號上重壓資金;他從此放棄那套棒球程式。

一般原則:當模型輸出讓你費解,先當作 bug 看待,而不是把它當「電腦的天才」。

雜訊極容易被誤認為訊號;連天才預測者都可能因為一行錯字毀掉所有努力。

計算可在百萬局面間找到「斐索式」走法#

深藍最終比創造它的人更會下棋。Campbell 說,過去他會懷疑每一個怪招是錯誤,但久了會發現往往是電腦看見了人類沒看到的東西。

1956 年費雪(Bobby Fischer,13 歲)在「世紀之戰」中犧牲騎士、留后不護,後來證明都是必勝走法。

多數大師會被「除非換后或立即將軍,否則別棄后」這條啟發法綁住。Fritz 程式僅花幾秒就找到 Fischer 的走法——電腦的優勢不是「創造力」,而是它沒有人類的偏執,會公平地考慮所有可能。

Figure 9-7: 費雪 1956 年的著名犧牲

電腦真正擅長什麼#

GIGO(garbage in, garbage out):

  • 電腦快、忠實、無情緒。
  • 但給它垃圾資料、糟糕指令,它就還你垃圾預測。
  • 它不擅長創造、不擅長提出新理論。

電腦對預測幫助最大的場域:

  • 規則簡單明確、資料豐富、需要大量重複求解 ——氣象、西洋棋是代表。
  • 規則模糊、資料雜訊高的領域——經濟、地震——電腦力量提升並未帶來等比進步。

試錯法的價值:Google 的範例#

Google 是介於兩極之間的代表:資料尚可、系統理解部分。

  • Hal Varian(Google 首席經濟學家):「我們每年大約跑 6,000 個搜尋實驗、6,000 個廣告變現實驗,總計約 1 萬個。」
  • 多數實驗只更動小小的視覺差異,並只對 0.5% 用戶執行。
  • 「PageRank」其實只是約 200 個訊號之一;用人類評審員對代表性查詢評分,再找出最能逼近這些評分的統計量。

Google 把搜尋結果視為「對使用者最佳網頁的預測」,並用持續實驗去改進它。

它的成功來自把「自由創意文化」與「嚴格實驗主義」並列——人提出大量想法,電腦負責檢驗。

這正是 Bayesian 思維——永遠處於 work-in-progress、不斷以新證據修正信念。

克服我們對科技的盲點#

人類演化以千年計、運算力卻每兩年翻倍。我們在資訊洪流中容易把雜訊看成模式(古早部落為了生存所需的本能反而被廣告人與政客利用)。

西洋棋的故事最終以美好結局收場:

2005 年 ChessBase.com 的「自由式(freestyle)」比賽允許玩家結合任何電腦程式與網路助力。冠軍是兩位來自新罕布夏的 20 多歲業餘玩家,他們同時運行三套程式並充當「教練」——既不畏懼也不盲目崇拜技術。

席佛收尾的提醒:

  • 「電腦認為洋基會奪冠」這句話只要用作簡稱(「程式輸出顯示洋基會奪冠」)即可。
  • 一旦講話者真把電腦當作有靈的存在、把模型視為自有意志的腦袋——通常代表他根本沒在思考,而模型上的偏見與盲點將被原封不動延續。
  • 沒有人設計過、也許永遠沒人能設計,能像人類一樣思考的電腦。但電腦本身正是人類進步的延伸——「設計者是人,artifice 中的智能就不算 artificial」。