由 Kathryn Hume 所撰。本章主張:發現 AI 機會的能力不需博士學位,但需要對機器學習如何運作的基本直覺——以及一段回到高中代數的小旅程。

為什麼非技術人員也要懂機器學習?#

企業最缺的不只是資料科學家,更是能發現 AI 機會的高階主管與非技術員工。機器學習科學家不能在真空中工作——業務利害關係人必須:

  • 協助找出值得解決的問題
  • 指派領域專家把知識轉化為資料標籤
  • 對輸出提供回饋
  • 設定演算法成功的標準

高中代數教你的 AI 直覺#

吳恩達說過:「AI 近期的進展,幾乎都來自某種輸入資料(A)快速產出簡單回應(B)。」

回想直線方程式:

y = mx + b
  • 高中代數:給你 m 和 b,輸入 x,求出 y
  • 監督式學習(supervised learning):給你很多 x 與 y,反過來求 m 和 b——「學習」的意思是隨著看到更多資料,可以更新方程式、調整斜率以更貼合資料

這個方程式幾乎不會 100% 精準描述 x 與 y 的關係。但它的威力在於:一旦找到能可靠捕捉 x、y 關係的斜率,未來給定新的 x,就能對 y 做出有根據的猜測。

更複雜的監督式機器學習演算法本質上也在做同樣的事——只是 m 變得很複雜。**線性迴歸(linear regression)**就是其中最簡單的形式。

監督式學習的前提:你必須同時擁有輸入 x 與對應結果 y 的範例

因此,發現 AI 機會的起點是兩個問題:

  • 有哪些值得猜測的結果?
  • 我們是否有足夠資料來做監督式學習?

監督式學習的兩大類問題#

1. 預測(Prediction)#

例如預測房價:資料科學家發現房價(y)與房屋大小(x)高度相關,用大量「大小+價格」的資料估出斜率 m,就能用 y = mx + b 預測新房屋的價格。

組織常用類似手法預測:

  • 未來產品銷量
  • 投資組合風險
  • 顧客流失(churn)

預測的輸出形式各異:

  • 簡單的「點預測」(we think y will happen)
  • 帶信心區間的範圍預測(70% 機率 y 會發生;改變一個假設後降為 60%)

2. 分類(Classification)#

把資料丟進不同「桶子」。資料科學家尋找能可靠代表類別的特徵——如果有特徵 x 就放桶 1,否則放桶 2。

組織用分類演算法來:

  • 過濾垃圾郵件
  • 從 X 光片診斷異常
  • 為訴訟挑選相關文件
  • 履歷分流
  • 顧客分群

分類的真正威力來自類別變多時。感知任務(perception tasks)——例如訓練電腦辨識圖片中的物體——其實就是分類,只是輸出類別變成了「各種動物名稱」。

這讓監督式學習系統看起來比實際聰明。它們其實只是按學到的函數,把資料分到桶 1、桶 2、… 桶 n 而已。

如何在日常工作中找出 AI 機會?#

1. 把你工作的內容寫下來#

把活動拆解為:

  • 每天/規律 vs. 偶爾做的事
  • 已成第二天性 vs. 需要耐心思考的事
  • 流程的一部分 vs. 你獨立完成的事

2. 檢視任務本身#

對於那些規律執行、感覺自動化的任務,問自己:

  • 組織內有多少人做類似任務?歷史上有多少人做過?
  • 這些任務是在預測什麼,還是把東西分到類別

關鍵測試:若 10 位同事執行這個任務,他們會給出相同答案嗎?

如果連人類都無法對「真假」達成共識,電腦更不可能可靠地把判斷轉成統計模式。

也要問:組織做這件事多久了?是否保留了成功完成的紀錄?

  • → 可作為監督式學習的訓練資料集
  • → 從今天開始蒐集,並讓人在迴圈中(human in the loop)長期訓練演算法

3. 與資料科學團隊聊聊這個任務#

帶他們走過你的思考過程,告訴他們你完成任務時關注哪些資訊面向。這能幫他們判斷自動化是否可行,並理出資料中對輸出最有預測力的特徵。

4. 思考潛在後果#

  • 自動化後,提供給顧客的產品會如何改變?
  • 業務最糟可能發生什麼事?
  • 演算法輸出錯誤、或只有 65–70% 準確率時,業務的最糟情境是什麼?
  • 業務要求的最低準確率門檻是多少?

結語#

善用監督式學習,意味著工作觀點的轉變:用過去的工作(人類判斷與領域專業)打造一個能把這些專業套用到未來工作的演算法。

用得好,員工生產力提升、新價值被創造出來。但這一切都從「找到值得解的問題」與「把它想成 x 和 y 的輸入輸出」開始。