倫斯斐的「未知的未知」#

2002 年,美國國防部長倫斯斐(Donald Rumsfeld)回應記者提問時說了一段被廣傳的話:

我們知道,有些事情我們知道我們知道(known knowns)。 我們也知道,有些事情我們知道我們不知道(known unknowns)。 但還有未知的未知(unknown unknowns)——我們連「自己不知道」這件事都不知道。

許多人把這視為廢話,但少數人領會到:知識本身有層次,**「不知自己無知」**才是最致命的。

隨機是對抗未知的武器#

對付「未知的未知」的方法看似不可能,但統計學提供了答案:隨機化(randomisation)

隨機之所以強大,正是因為它不依賴任何假設——而我們的無知,往往就藏在那些未經檢驗的假設裡。

費雪與隨機化的誕生#

英國統計學奠基者費雪(Ronald Aylmer Fisher)約一世紀前在農業研究站工作,面對土壤肥力等大量「未知的未知」。他在 1925 年的《Statistical Methods for Research Workers》中將「隨機化」確立為核心方法:

隨機化讓實驗者免於苦思「有多少看不見的因素正在干擾資料」。

案例:醫學中的隨機對照試驗#

14 世紀詩人佩脫拉克(Petrarch)就提議:找上百位「特徵相同」的病人,半數施藥、半數不施,比較結果。但「特徵相同」實務上不可能達成——人有生理、情緒、基因的差異。

隨機化登場#

不去試圖窮舉所有可能的干擾因素,改採:

  1. 召集足夠多的病患樣本
  2. 隨機分配到「治療組」與「對照組」
  3. 兩組都會包含未知因素,但機率上會被均勻分散

額外好處#

  • 統計分析更可靠:分析公式假設無系統性偏誤,隨機化正能達成
  • 化解倫理困境:研究者不能私心把較好的病患分給新藥,因為隨機由第三方執行

即使是研究者也常無法準確預測療法是否有效。 2008 年針對美國國家癌症研究所開展的 600+ RCT 分析顯示,僅 25–50% 的新療法最終被證實成功。

1947 年鏈黴素試驗#

英國醫學研究會用鏈黴素(streptomycin)治療肺結核做了開創性的試驗:

  • 約 100 名病患
  • 隨機分為:「臥床休息」 vs 「臥床休息 + 抗生素」
  • 醫生與病患皆盲化(blinded)
  • 半年後:抗生素組存活率約為對照組的 4 倍

從此「雙盲隨機對照試驗(RCT)」成為療效驗證的黃金標準。

RCT 在政策上的應用#

成功:墨西哥 Oportunidades 計畫#

提供現金給家庭,條件是孩子上學、定期健檢、營養支持。批評者認為「給錢交換」太天真,於是政府用 RCT 驗證:

  • 數百個村莊隨機分配「參加 vs 對照」
  • 兩年後評估,福祉與未來前景皆顯著提升
  • 2002 年擴展到都市,並被紐約市等地仿效

失敗:「Scared Straight」嚇阻方案#

讓青少年犯入監觀摩重刑犯生活,希望嚇阻犯罪。1978 年同名紀錄片曾廣受讚譽,許多政客主張推行——但 RCT 結果(2013 年分析)顯示:

參加者後續犯罪率反而高於未參加者。 此政策不只無效,根本是有害。

RCT 也有極限#

限制 1:樣本本身可能不具代表性#

  • 心理學研究中,超過 2/3 受試者來自美國
  • 其中又有 2/3 是心理系大學生
  • 加拿大研究者稱這些人為「WEIRD」族群(Western, Educated, Industrialised, Rich, Democratic),與多數人類差異極大

限制 2:發表偏誤(publication bias)#

  • 「無顯著結果」、「結論不明」的研究往往不被發表
  • 後續的整合分析(meta-analysis)會偏向過度樂觀
  • 藥廠被指控為股價考量「埋藏」負面結果

限制 3:研究者刻意設計#

  • 把新藥與「明顯無效」的對照藥比較(稻草人對照)
  • 即使隨機化,刻意設計的試驗仍能「製造」想要的結論

結語#

隨機化的「無秩序」正是它最有力之處——能戳破有意與無意的偏誤、扯掉粗糙手法的科學偽裝。 但若使用不當或片面,也能讓劣質研究披上「科學」外衣