「如果你不能理解,就不能改變。」
— 艾文斯(Eric Evans)
要改善一個系統,先得了解它目前運作得如何。困難在於:你不能讓世界停下來讓你慢慢量。系統必須在運作中被分析——本章探討如何拆解、量測、解讀。
拆解#
「完美中無法產出新東西。每個過程都涉及把某物拆解。」
— 坎伯(Joseph Campbell)
複雜系統包含許多相互依賴的流動、存量、流程與部件,整體一次看完會踩到認知範圍極限。**拆解(Deconstruction)**是把複雜系統切成可理解的子系統,逐一研究後再串起來。
拆解時要關注:
- 觸發點與終點:什麼啟動子系統?什麼結束?
- 條件式:哪些 if-then 規則影響運作?
- 流動圖:用流程圖比文字更清晰
別忘了相互依存——子系統不是孤立存在的。
量測與關鍵績效指標#
「上帝面前可信,其他人請帶資料來。」
— 戴明(W. Edwards Deming)
量測(Measurement)幫助你避開缺席盲視——糖尿病患者必須測血糖,否則直到昏迷才會發現問題。但量太多會被資料淹沒,所以要找關鍵績效指標(Key Performance Indicators, KPIs)。
易測量未必重要。「程式碼行數」常被誤當生產力指標——好工程師的重寫常是「砍掉一萬行」。再加上激勵偏差,KPI 抓錯,整個系統就被推往錯誤方向。
商業常見 KPI 對應五項基本職能:
- 價值創造:流入速度有多快?
- 行銷:多少人關注?多少人允許你後續聯繫?
- 銷售:多少潛在客戶轉為付費?平均終身價值多少?
- 價值交付:服務一位客戶要多久?退貨/客訴率?
- 財務:利潤率?購買力?是否充足?
每個系統限制在 3–5 個 KPI,必要時再深挖數據。
Garbage In, Garbage Out#
「謹守起點,結果會自動安排好。」
輸入垃圾就輸出垃圾:低品質資料只能得出低品質分析。輸入決定產出的上限——飲食、團隊、原料、訊息來源都一樣。
容忍度與變異#
- 容忍度(Tolerance):可以接受的「正常誤差」範圍。100% 可靠並不存在;越緊(如「五個 9」99.999%)通常越貴,留給最關鍵子系統。
- 變異(Variance):資料的波動程度。光看平均沒用,要建立統計過程控制(statistical process control)——典型值加上下限。
- 突破上限或連續多日逼近上限,才是可採取行動的訊號。
- 對於難以全部測試的產品,追蹤客訴/退貨/保固請求的變異,能搶在大規模問題爆發前介入。
分析誠實#
當量測會影響你的社會地位時,準確性會被犧牲。作者在 P&G 發現網站訪客數量被機器人灌水,但業務單位不願換更準確的系統,因為新系統會讓 KPI 大幅下降,看起來變差——他們選擇繼續活在謊言裡。
找一個對結果沒有利害關係的第三方稽核 KPI 與分析方法。
你不一定喜歡聽到的結果,但至少能避免確認偏差與激勵偏差扭曲決策。
脈絡、抽樣、誤差幅度#
- 脈絡(Context):「這個月營收 20 萬」是好是壞?看上個月、看支出才能判斷。任何單一數字本身沒有意義。別愛上「魔術數字」儀表板。
- 抽樣(Sampling):系統太大或太複雜時,從輸出中隨機抽樣作為整體代理。抽血檢驗、密探客(mystery shopper)都是抽樣。但樣本必須隨機與均勻,否則會偏差(在曼哈頓抽樣量「美國平均收入」會嚴重失真)。
- 誤差幅度(Margin of Error):樣本越大、誤差越小、結論越可信。聽到任何「平均」「機率」時,先問樣本怎麼來、有多大。
比率與典型性#
- 比率(Ratio):兩個量度的相對關係。常用如:
- 廣告報酬:每花 1 美元廣告帶回多少營收
- 每員工利潤
- 成交率:每位來客中有多少購買
- 退貨/客訴率
- 典型性(Typicality):用「平均、中位數、眾數、中距」描述「正常值」。
- **平均(mean)**易受極端值左右——巴菲特讀《華爾街日報》就會把讀者「平均淨值」拉到 150 萬美元,並非真正典型讀者
- **中位數(median)**較不受極端值影響
- **眾數(mode)**找資料群聚熱點
- 中距(midrange):(最高+最低)/2,快速估算但易被異常值扭曲
相關不等於因果#
「相關不是因果,但確實是個提示。」
— 塔夫蒂(Edward Tufte)
- 心臟病患者一年吃 57 個培根起司堡——起司堡是元兇?
- 但他們也沖了 365 次澡、眨了 560 萬次眼——洗澡眨眼會引發心臟病嗎?
相關(Correlation)≠ 因果(Causation)。你的廣告與銷售上升 30% 同時發生,可能是巧合(鎮上有展會、學校放假、餐廳同時推促銷 ⋯⋯)。要證明因果需隔離變因;複雜系統中變因太多,因果通常難以證實。
基準、代理、區隔、人性化#
- 基準(Norms):用歷史資料提供脈絡(季節性比較)。改了量測方法就不能再用舊基準——蘋果橘子比不得。也別假設「過去有效就會永遠有效」。
- 代理(Proxy):難以直接量測時,用相關度高的另一個量測。電磁波長代理太陽溫度、滑鼠位置代理使用者注意力(CMU 研究:滑鼠經過區域與眼動注視重疊 84%)。
- 代理必須真的與目標相關,否則「程式碼行數」就會成為陷阱。
- 區隔(Segmentation):把資料切成有意義的子群——按過去行為、人口統計、心理特質。
- 「本月訂單成長 87%」很模糊;「90% 來自西雅圖女性」就能行動。
- 人性化(Humanization):把資料轉成真人故事。客服等待從 10 分鐘降到 8 分鐘是「20% 改善」嗎?對掛在線上的憤怒客戶來說,仍是糟糕體驗。
- 用「人物誌(persona)」把資料具象成虛構但鮮活的人,「Wendy 會喜歡這個嗎?」比抽象統計更能驅動決策。
數字本身只是工具,分析的最終目標是回到真實人類體驗——這才能避免你優化指標時忘了客戶到底在想什麼。