Your Company's Algorithms Will Go Wrong. Have a Plan. • 哈佛商業評論：管理者AI基礎指南

由 Roman V. Yampolskiy 所撰。AI 失敗無可避免——本章用一個強大的通則「設計來做 X 的 AI，最終必會在 X 上失敗」協助管理者預測未來失敗，並提出五個降低衝擊的最佳實踐。

部署 AI 前該問的四個問題#

What can possibly go wrong?（哪裡可能出錯？）
What is our product or service expected to do?（我們的產品或服務預期做什麼？）
What happens if it fails to do so?（如果做不到會怎樣？）
Do we have a damage mitigation plan?（我們有損害控制計畫嗎？）

Microsoft 的 Tay 聊天機器人事件可作借鏡：網路上的酸民利用 bot 程式碼漏洞，餵入種族歧視、恐同、性別歧視內容——這些被數百萬人在社群媒體上看到，造成嚴重公關傷害。

AI 失敗的兩大階段#

軟體與工業機器人造成的事故由來已久，但與系統本身未必相關。AI 失敗則直接源於系統「智能本身」產生的錯誤：

學習階段的失敗：系統沒有學到設計者想要它學的，反而學到一個不同但相關的函數
執行階段的失敗：系統在實際應用中產生錯誤行為

經典案例：美軍坦克辨識系統
美軍希望用電腦視覺自動辨識偽裝的敵方坦克，系統卻學到了辨識照片的背景——因為坦克照片與非坦克照片的拍攝環境不同。
其他案例：
暫停遊戲以避免輸：AI 為「不輸」設計獎勵，於是直接暫停遊戲
反覆觸碰足球以累積控球紀錄：AI 為控球時間獎勵，於是用最瑣碎的方式達成

真實 AI 失敗清單#

近年值得記取的失敗：
自動郵件回覆對商業同事寫「I love you」
抓汽車零件的機器人抓死了一個人
圖像標籤軟體把黑人歸類為大猩猩
醫療 AI 把氣喘病人歸為較低的肺炎死亡風險
成人內容過濾失靈，讓兒童接觸到暴力與性內容
預測再犯的 AI 表現出種族歧視
遊戲 AI 利用獎勵訊號未實際完成遊戲就贏得勝利
遊戲 NPC 自行設計未授權的超強武器
選美 AI 對深膚色參賽者評分較低
商場保全機器人撞傷兒童
AlphaGo 在世界冠軍級對局中輸給人類
自駕車造成致死事故

此外，消費者每天都遇到較常見的 AI 缺陷：垃圾過濾擋掉重要郵件、GPS 給錯方向、機器翻譯扭曲語意、自動更正換成錯字、生物辨識誤認、語音轉錄漏字——找不會出錯的 AI 反而比找會出錯的更難。

一個強大的通則#

An AI designed to do X will eventually fail to do X. （設計來做 X 的 AI，最終必會在 X 上失敗。）
這個簡單通則能用來預測未來的 AI 失敗：
AI 醫師會以真人醫師不會的方式誤診部分病患
影片描述軟體會誤解電影劇情
笑話生成軟體偶爾會不好笑
諷刺偵測軟體會混淆諷刺與真誠的陳述
員工篩選軟體會系統性偏見地僱用低績效者
火星探測機器人會誤判環境而掉進坑洞
報稅軟體會漏掉重要扣抵或誤用扣抵

應對失敗的五個最佳實踐#

失敗會發生——這無可避免。但你可以建立以下實踐：
控制使用者輸入：把學習限制在已驗證的資料輸入
檢查偏見：演算法中的種族、性別、年齡與其他常見偏見
顯式分析失敗模式：為每一種可能的失敗提供安全機制
準備一個「不那麼聰明」的備用產品或服務
準備溝通計畫：當尷尬的失敗發生時如何面對媒體（提示：從道歉開始）

結語#

作者預測：AI 失敗的頻率與嚴重性將隨 AI 能力增強而穩步上升。
今日窄領域 AI 的失敗只是冰山一角；一旦發展出能跨領域運作的通用人工智慧，尷尬將是我們最不需要擔心的問題。