Assembling Your AI Operations Team • 哈佛商業評論：管理者AI基礎指南

由 Tse、Esposito、Mizuno、Goh 共同撰寫。本章揭露 AI 專案失敗的「最笨原因」：再頂尖的 AI 模型，若無法接到既有系統，就毫無用處。解方是建立 **AIOps（AI operations，AI 維運）**團隊。

一個常見的悲傷故事#

企業與一家有潛力的技術廠商合作，投入時間、金錢與人力，**概念驗證（proof of concept, PoC）**大獲成功，展示 AI 將如何改善業務。然後——一切戛然而止，PoC 被封存，團隊挫敗。

為什麼？因為要把 AI 模型整合進公司整體技術架構極其困難。企業把所有時間與資源投在 AI 模型上，卻沒思考如何讓模型真的能與既有系統一起運作。

AIOps 涵蓋建置、整合、測試、發布、部署與管理整套系統，把 AI 模型的結果轉化為終端使用者所需的洞察。最基本層次上，AIOps 同時需要：

AIOps 演化自 DevOps（軟體開發與營運的整合實踐），是把 AI 引擎的工作轉化為真正商業產出、達到大規模可靠運行的關鍵。

在許多 AI 驅動的企業中，只有一小部分程式碼真正在做 AI 的事——AI 模型只是更大系統中的一小塊，使用者如何與其互動和模型本身一樣重要。要釋放 AI 價值，必須從設計良好的**生產環境（production environment）**開始。

好的生產環境須符合三項標準：

當前 AI 技術充滿技術問題：

避免資料瓶頸是建立可靠環境的關鍵。
設計周全的處理與儲存架構可解決吞吐量與延遲問題
良好的 AIOps 團隊會主動設想環境如何避免崩潰，並準備好應變計畫

業務目標與背後的流程持續變動，但系統層級必須像時鐘般精準：資料匯入要按規則定期執行、報表機制要持續更新、避免使用過期資料。

把架構拆成可管理的「樂高積木」——可以後續新增、替換或移除——能讓系統在不影響運行效率的前提下快速重組與同步資料。

當業務擴張時，基礎建設裡的「水管」也得跟著調整。不同 IT 系統的效能、可擴充性與延展性各異，跨系統時往往出問題。

成功關鍵在於團隊能否一邊維持「business as usual」、一邊嵌入升級的 AI 模型——透過持續調整、修補、測試，讓新舊系統達成平衡。

最重要的決策：AIOps 團隊要自建還是外包。

優勢：

代價：

優勢：

代價：

對任何想善用 AI 紅利的企業來說，真正關鍵的不是 AI 模型本身，而是「由 AI 驅動、能把公司從現在帶到未來的那台運轉良好的機器」。
一次性的專案與漂亮的願景做不到。AIOps 不是事後補上的，而是競爭上的必需。