數字光環下的危險#
新聞快訊:經濟正在大幅好轉。光是上個月,失業率就下降了 1%。
聽起來令人振奮,但這段論證其實用統計欺騙了你。
統計(statistics)是以數字呈現的證據。它看起來科學、精準,像「事實」 —— 但它經常說謊,或證明的不是它表面在證明的東西。
本章對應的關鍵問題:
這些統計是否在誤導?
第一招陷阱:無法得知與帶偏誤的統計#
最新標題:40% 的大學生患有憂鬱症!
這個數字讓人焦慮,但要問:這個數字是怎麼算出來的?
任何統計都假設了事件已被清楚定義並準確辨識。對許多現象,這兩件事都極為困難:
- 關鍵詞語意含糊(什麼是「憂鬱」?)。
- 難以辨認相關人或事件。
- 受訪者不願誠實作答。
- 事件未被報告。
- 物理上難以觀察。
因此許多統計只是有根據的猜測。
例:研究指出大學生憂鬱率落在 10% 到 40% 之間 —— 差了四倍。看到 40% 的標題前,得先問「他們怎麼定義、怎麼測?」
大數字常被精心呈現以製造警報感。看到驚人數字時,先警覺:作者是否想用「精確的大數字」嚇你?
第二招陷阱:「平均」三選一#
- 想快速賺大錢?去當 NFL 球員吧 —— 2010 年平均年薪 180 萬美元。
- 大學課業變輕鬆了 —— 學生平均一週只讀 12.8 小時,是 20 年前的一半。
「平均」其實有三種:
- 平均數(mean):所有值相加除以總數。
- 中位數(median):把所有值由大到小排,取正中間那個。
- 眾數(mode):出現次數最多的值。
NFL 例子:2010 年球員的平均薪資是 180 萬美元,但中位數只有 77 萬美元。少數明星(最高超過 1,500 萬)把平均拉到天花板。
想讓人覺得「薪水高」,用平均數;想讓人覺得「薪水普通」,用中位數或眾數。
讀到「平均」時,永遠問:這是哪一種?換另一種會不會結論不同?
不只要看「平均」,還要看「範圍」與「分布」#
醫師對 20 歲患者:你的癌症預後不佳,存活中位數是 10 個月。
聽起來像是死刑判決。但中位數只說:「一半的人在 10 個月內過世,另一半活更久」 —— 它沒告訴你另一半到底活了多久。可能其中許多人活到 80 歲。
- 範圍(range):最小到最大的差距。
- 分布(distribution):每個值出現的頻率。
看到平均時,補上這兩個訊息,才能判斷個別案例可能落在哪。
第三招陷阱:證明 A 卻聲稱證明了 B#
很多時候,數據確實能證明某件事 —— 但作者拿它去支持另一個結論。
例 1:
在我們市的地鐵,你的智慧手機很可能被偷。一份統計指出地鐵竊案中 70% 是電子產品。
這個數字證明的是「地鐵竊案的組成」(被偷的多半是電子產品),不是「搭地鐵被偷的機率有多高」。如果整體竊案非常少,70% 的「比例高」並不可怕。
例 2:
將近一半的美國人對另一半不忠。研究員在某商場訪問 75 人,36 人承認自己有朋友承認曾不忠。
數據實際證明的是:某個地點 75 名受訪者中,36 人說他們有朋友承認曾不忠。離「美國人有一半不忠」差得很遠。
兩個對策:
- 遮住作者的統計,先問自己:「證明這個結論需要什麼數據?」再對照作者實際給了什麼。
- 遮住作者的結論,看完統計後問自己:「這份數據支持的合理結論是什麼?」再對照作者下了什麼結論。
第四招陷阱:用省略訊息來誤導#
- 大企業正在摧毀我們的小鎮氛圍 —— 過去一年大企業數量增加 75%。
- 愛滋預防需要更多經費 —— 2009 年有 54,000 人罹患愛滋。
第一例:給了百分比卻沒給絕對數。如果是從 4 家增加到 7 家,遠不如從 12 變 21 來得驚人。
第二例:給了絕對數卻沒給百分比。54,000 ÷ 美國 3 億人口 ≈ 0.02%。並非不重要,但比例感變了。
- 看到只有百分比時,問:「絕對數字是多少?」
- 看到只有絕對數字時,問:「換成百分比是多少?」
- 看到驚人的單一數字時,問還有沒有可比基準:與過去比較、與其他類別比較。
評估統計的六項清單#
- 試圖了解統計是怎麼蒐集到的;對巨大的數字格外警覺。
- 釐清是哪一種「平均」;想想範圍與分布是否會改變整體判斷。
- 留意「結論一個樣,證明另一樣」。
- 遮住作者的數字,自問需要什麼數據。
- 遮住作者的結論,自問這些數據能推到哪。
- 找出省略了哪些資訊:誤導性的數字、缺少的比較基準。
寫作與發言的反向應用#
統計是強而有力的工具:能描繪趨勢、預測未來、加強論證。但同樣容易被讀者高估為「不可動搖的事實」。
寫作時的平衡:
- 主動說明統計是怎麼產生的、它的意涵、它的侷限。
- 用內文、註腳、附註或附錄都可以,視領域慣例而定。
- 這麼做能提升你的可信度,也鼓勵讀者成為強意義的批判性思考者,自己對數據下判斷 —— 而不是被你推著走向某個結論。