由 Walter Frick 訪談 Hilary Mason(Fast Forward Labs 創辦人)所成。本章從實務角度剖析 AI 應落在組織何處、與既有資料能力如何銜接,以及領導者該如何避開常見的管理陷阱。
從大數據到 AI:一個堆疊式的演進#
過去十年的技術演進,可看成一座堆疊起來的金字塔,每一層都依賴下一層:
- 大數據(big data)(2000 年代末):能否把資料集中、可查詢的基礎建設問題
- 分析(analytics):聰明地「計算」資料以回答有商業或產品價值的問題;2009 年起新軟體讓它變得平價、普及
- 資料科學(data science):更聰明地計算、做預測、在資料上建模——成本下降使其應用從精算這類高價值問題擴及推薦、搜尋等「看似平凡」的場景
- 機器學習(machine learning):資料科學中的一組工具,加入回饋迴圈——用模型從世界取得更多資料,再回頭改善模型
- AI:本質是用機器學習(特別是深度學習)建構在這整個堆疊之上的應用
這種堆疊關係意味著:沒有機器學習,就沒有 AI;沒有分析,就沒有機器學習;沒有資料基礎建設,就沒有分析。
資料科學的三種能力,分屬三種地方#
常見的管理錯誤,是因為它們「跑在同一套技術堆疊上」就把資料科學當成單一事物。Mason 把它拆成三個能力:
1. 理解業務(分析 / 商業智慧)#
- 提出問題、分析資訊以做出更好的決策
- 通常掛在 CFO 或 COO 之下
- 不一定是技術領域
2. 產品資料科學#
- 打造演算法與系統來改善產品本身
- 包含垃圾郵件過濾、推薦系統、搜尋演算法、資料視覺化
- 通常隸屬於某條業務線,由產品開發或工程部門帶領
3. 研發(R&D)#
- 用資料開創新產品、新業務、新營收機會
- 最常被忽略,或被誤併入產品資料科學
深度學習對三種能力的影響#
**深度學習(deep learning)**對三種能力都有影響:
- 分析:讓過去無法分析的影像、影音資料變得可用
- 產品:能在文字摘要、電商推薦等難題上產出品質更高的預測模型
- 研發:把技術可能性的邊界繼續往外推
公司在資料科學上常犯的錯#
一個大錯是把資料科學硬塞進軟體工程流程。兩者根本不同:
- 軟體工程:開始時你知道它會跑通
- 資料科學:開始時你不知道它會不會成功
軟體工程流程一遇到不確定性就崩潰;資料科學需要一個能容納不確定性的實驗式流程。
文化障礙#
- 許多公司不容許「做了不成功」的工作
- 結果是:做高風險研究的資料科學家在年度考評中受罰,即使工作做得好
- 公司必須把它視為投資組合——其中部分專案最終會帶來遠超漸進式改善的價值
如何看穿炒作?#
Mason 的核心建議:沒有魔法。AI 在概念層次沒有任何高階主管無法理解的內容。如果有人在推銷時說「我不想解釋它怎麼運作,反正就是 AI」,請持續追問:
- 它怎麼運作?
- 輸入哪些資料?
- 資料中有哪些模式可能被學到?
- 輸出的是什麼?
深度學習系統的輸出,本質上就是「為原本沒有標籤的資料點貼上標籤」加上信心分數而已。它不像人類那樣具備智能——距離真正的人類智能仍非常、非常遙遠。
過去叫「迴歸分析」的東西,現在常被包裝成 AI 以提升行銷價值——保持懷疑,是執行長的基本功。