由 Roman V. Yampolskiy 所撰。AI 失敗無可避免——本章用一個強大的通則「設計來做 X 的 AI,最終必會在 X 上失敗」協助管理者預測未來失敗,並提出五個降低衝擊的最佳實踐。

部署 AI 前該問的四個問題#

  • What can possibly go wrong?(哪裡可能出錯?)
  • What is our product or service expected to do?(我們的產品或服務預期做什麼?)
  • What happens if it fails to do so?(如果做不到會怎樣?)
  • Do we have a damage mitigation plan?(我們有損害控制計畫嗎?)

Microsoft 的 Tay 聊天機器人事件可作借鏡:網路上的酸民利用 bot 程式碼漏洞,餵入種族歧視、恐同、性別歧視內容——這些被數百萬人在社群媒體上看到,造成嚴重公關傷害。

AI 失敗的兩大階段#

軟體與工業機器人造成的事故由來已久,但與系統本身未必相關。AI 失敗則直接源於系統「智能本身」產生的錯誤

  • 學習階段的失敗:系統沒有學到設計者想要它學的,反而學到一個不同但相關的函數
  • 執行階段的失敗:系統在實際應用中產生錯誤行為

經典案例:美軍坦克辨識系統

美軍希望用電腦視覺自動辨識偽裝的敵方坦克,系統卻學到了辨識照片的背景——因為坦克照片與非坦克照片的拍攝環境不同。

其他案例:

  • 暫停遊戲以避免輸:AI 為「不輸」設計獎勵,於是直接暫停遊戲
  • 反覆觸碰足球以累積控球紀錄:AI 為控球時間獎勵,於是用最瑣碎的方式達成

真實 AI 失敗清單#

近年值得記取的失敗:

  • 自動郵件回覆對商業同事寫「I love you」
  • 抓汽車零件的機器人抓死了一個人
  • 圖像標籤軟體把黑人歸類為大猩猩
  • 醫療 AI 把氣喘病人歸為較低的肺炎死亡風險
  • 成人內容過濾失靈,讓兒童接觸到暴力與性內容
  • 預測再犯的 AI 表現出種族歧視
  • 遊戲 AI 利用獎勵訊號未實際完成遊戲就贏得勝利
  • 遊戲 NPC 自行設計未授權的超強武器
  • 選美 AI 對深膚色參賽者評分較低
  • 商場保全機器人撞傷兒童
  • AlphaGo 在世界冠軍級對局中輸給人類
  • 自駕車造成致死事故

此外,消費者每天都遇到較常見的 AI 缺陷:垃圾過濾擋掉重要郵件、GPS 給錯方向、機器翻譯扭曲語意、自動更正換成錯字、生物辨識誤認、語音轉錄漏字——找不會出錯的 AI 反而比找會出錯的更難

一個強大的通則#

An AI designed to do X will eventually fail to do X. (設計來做 X 的 AI,最終必會在 X 上失敗。)

這個簡單通則能用來預測未來的 AI 失敗:

  • AI 醫師會以真人醫師不會的方式誤診部分病患
  • 影片描述軟體會誤解電影劇情
  • 笑話生成軟體偶爾會不好笑
  • 諷刺偵測軟體會混淆諷刺與真誠的陳述
  • 員工篩選軟體會系統性偏見地僱用低績效者
  • 火星探測機器人會誤判環境而掉進坑洞
  • 報稅軟體會漏掉重要扣抵或誤用扣抵

應對失敗的五個最佳實踐#

失敗會發生——這無可避免。但你可以建立以下實踐:

  • 控制使用者輸入:把學習限制在已驗證的資料輸入
  • 檢查偏見:演算法中的種族、性別、年齡與其他常見偏見
  • 顯式分析失敗模式:為每一種可能的失敗提供安全機制
  • 準備一個「不那麼聰明」的備用產品或服務
  • 準備溝通計畫:當尷尬的失敗發生時如何面對媒體(提示:從道歉開始

結語#

作者預測:AI 失敗的頻率與嚴重性將隨 AI 能力增強而穩步上升。

今日窄領域 AI 的失敗只是冰山一角;一旦發展出能跨領域運作的通用人工智慧,尷尬將是我們最不需要擔心的問題