為什麼商業實驗值得認真對待#

組織內實驗評估(即經濟學家所說的「田野實驗(field experiment)」)的興起,正在轉變決策方式——從產品設計、人力資源到公共政策都受其影響。投資隨機評估(randomized evaluation)的公司能取得改寫遊戲規則的優勢。

然而,作者在科技公司觀察到大量實驗做錯了。即使設計沒問題,實作階段也常出現可避免的錯誤,使許多組織無法享受到科學方法的真正好處。

本章整理出七個原則,協助你的實驗真正交付出可用的資料與洞察。

1. 找一個夠窄的問題#

廣告值得花錢嗎?」「該調高還調低年終獎金?」這類問題雖然抓到了核心目標,但不可能用一次實驗回答

把問題拆到可測試(testable)的層次:

  • 不好:廣告值得花錢嗎?
  • :在 Google AdWords 上投放品牌字廣告,每月銷售提升多少?

eBay 的研究人員就用這類窄問題的實驗發現:他們長年在 Google 上的品牌字廣告,對付費客戶造訪率根本沒有影響

2. 用「大鎚」(big hammer)出手#

公司做實驗是因為不確定什麼方法有效。在不確定下從小處著手聽起來保守,但你的目標其實是先確定某種版本的介入會不會帶來差異,這需要夠強的處理力道。

範例:在地小農標籤#

雜貨店想加上「主要來自在地小農」的標籤:

  • 建議:先用大字、貼在包裝正面
  • 如果用小標籤、貼在背面,且沒看到效果,主管會陷入兩難——
    • 是消費者根本沒注意到?(介入太弱)
    • 還是消費者真的不在乎?(沒有處理效果)
  • 用大鎚先打:若沒有效果,這條路就放棄;若有效果,再回頭微調尺寸與位置

3. 進行資料盤點(data audit)#

決定介入方式後,列出與目標結果相關的所有資料,並記下何時量測。

  • 包含你希望會改變希望不會改變的指標——後者用來偵測非預期副作用(unintended consequences)
  • 也納入外部資料以提供額外觀點

範例:化妝品包裝測試#

跨地區跑隨機對照試驗(randomized controlled trial)時:

  • 內部資料:回購率、客服回饋
  • 外部資料:Amazon 上的使用者評論、不同州別的差異

4. 選擇研究母體(study population)#

挑出與你想理解的客戶輪廓相符的子群體。

別貪圖方便就拿線上使用者代替全部客群——年輕的純電商使用者,行為可能跟年長的店面客戶完全不同。從前者推論到實體店策略可能會錯得很離譜。

5. 隨機化(randomize)#

把人隨機分配到處理組(treatment group)與對照組(control group)。

兩條鐵律:

  • 不能讓參與者自己決定屬於哪一組
  • 兩組之間除了被測試的變數外,不能有其他差異

第二條容易被違反。例:週日推一張優惠券、週一推另一張——即使每天的客流量一樣,週日購物者本身就可能與週一購物者系統性不同

6. 訂計畫,照計畫走#

開跑前要把以下細節寫下來:

  • 蒐集多少觀察值?
  • 實驗跑多久?
  • 收集與分析哪些變數?

紀錄方式可以是 Google 試算表,也可以是公開試驗註冊(trial registry)。透明度有助於避免實驗實作的常見陷阱。

開跑後別插手。實驗最忌諱的事情,是「跑到結果剛好符合假設就停」——心理學界的「重現危機(replication crisis)」就是這樣來的,會嚴重偏倚結果並降低洞察價值。

7. 讓資料自己說話#

呈現結果時報告多項指標

  • 有些可能沒變化、不起眼,甚至難以解釋
  • 比起選擇性忽略,透明攤開才是上策

接著問自己:「我真的找到結果背後的機制了嗎?」如果沒有,修正實驗設計、再跑一次

結尾:把實驗當成長期過程#

實驗早已是社會科學的核心,現在也快速成為組織的核心。設計良好的實驗能:

  • 戳破你的假設
  • 改變你的做法
  • 讓你領先競爭者

實驗是一個長期、累積、相互銜接的學習過程——每一次的結果,都成為下一次的起點。