由 Kathryn Hume 所撰。本章主張:發現 AI 機會的能力不需博士學位,但需要對機器學習如何運作的基本直覺——以及一段回到高中代數的小旅程。
為什麼非技術人員也要懂機器學習?#
企業最缺的不只是資料科學家,更是能發現 AI 機會的高階主管與非技術員工。機器學習科學家不能在真空中工作——業務利害關係人必須:
- 協助找出值得解決的問題
- 指派領域專家把知識轉化為資料標籤
- 對輸出提供回饋
- 設定演算法成功的標準
高中代數教你的 AI 直覺#
吳恩達說過:「AI 近期的進展,幾乎都來自某種輸入資料(A)快速產出簡單回應(B)。」
回想直線方程式:
y = mx + b- 高中代數:給你 m 和 b,輸入 x,求出 y
- 監督式學習(supervised learning):給你很多 x 與 y,反過來求 m 和 b——「學習」的意思是隨著看到更多資料,可以更新方程式、調整斜率以更貼合資料
這個方程式幾乎不會 100% 精準描述 x 與 y 的關係。但它的威力在於:一旦找到能可靠捕捉 x、y 關係的斜率,未來給定新的 x,就能對 y 做出有根據的猜測。
更複雜的監督式機器學習演算法本質上也在做同樣的事——只是 m 變得很複雜。**線性迴歸(linear regression)**就是其中最簡單的形式。
監督式學習的前提:你必須同時擁有輸入 x 與對應結果 y 的範例。
因此,發現 AI 機會的起點是兩個問題:
- 有哪些值得猜測的結果?
- 我們是否有足夠資料來做監督式學習?
監督式學習的兩大類問題#
1. 預測(Prediction)#
例如預測房價:資料科學家發現房價(y)與房屋大小(x)高度相關,用大量「大小+價格」的資料估出斜率 m,就能用 y = mx + b 預測新房屋的價格。
組織常用類似手法預測:
- 未來產品銷量
- 投資組合風險
- 顧客流失(churn)
預測的輸出形式各異:
- 簡單的「點預測」(we think y will happen)
- 帶信心區間的範圍預測(70% 機率 y 會發生;改變一個假設後降為 60%)
2. 分類(Classification)#
把資料丟進不同「桶子」。資料科學家尋找能可靠代表類別的特徵——如果有特徵 x 就放桶 1,否則放桶 2。
組織用分類演算法來:
- 過濾垃圾郵件
- 從 X 光片診斷異常
- 為訴訟挑選相關文件
- 履歷分流
- 顧客分群
分類的真正威力來自類別變多時。感知任務(perception tasks)——例如訓練電腦辨識圖片中的物體——其實就是分類,只是輸出類別變成了「各種動物名稱」。
這讓監督式學習系統看起來比實際聰明。它們其實只是按學到的函數,把資料分到桶 1、桶 2、… 桶 n 而已。
如何在日常工作中找出 AI 機會?#
1. 把你工作的內容寫下來#
把活動拆解為:
- 每天/規律 vs. 偶爾做的事
- 已成第二天性 vs. 需要耐心思考的事
- 流程的一部分 vs. 你獨立完成的事
2. 檢視任務本身#
對於那些規律執行、感覺自動化的任務,問自己:
- 組織內有多少人做類似任務?歷史上有多少人做過?
- 這些任務是在預測什麼,還是把東西分到類別?
關鍵測試:若 10 位同事執行這個任務,他們會給出相同答案嗎?
如果連人類都無法對「真假」達成共識,電腦更不可能可靠地把判斷轉成統計模式。
也要問:組織做這件事多久了?是否保留了成功完成的紀錄?
- 是 → 可作為監督式學習的訓練資料集
- 否 → 從今天開始蒐集,並讓人在迴圈中(human in the loop)長期訓練演算法
3. 與資料科學團隊聊聊這個任務#
帶他們走過你的思考過程,告訴他們你完成任務時關注哪些資訊面向。這能幫他們判斷自動化是否可行,並理出資料中對輸出最有預測力的特徵。
4. 思考潛在後果#
- 自動化後,提供給顧客的產品會如何改變?
- 業務最糟可能發生什麼事?
- 演算法輸出錯誤、或只有 65–70% 準確率時,業務的最糟情境是什麼?
- 業務要求的最低準確率門檻是多少?
結語#
善用監督式學習,意味著工作觀點的轉變:用過去的工作(人類判斷與領域專業)打造一個能把這些專業套用到未來工作的演算法。
用得好,員工生產力提升、新價值被創造出來。但這一切都從「找到值得解的問題」與「把它想成 x 和 y 的輸入輸出」開始。