奧勒岡研究所:把心理學變成現實工具的所在#

1960 年,奧勒岡大學心理學教授 Paul Hoffman 拿到美國國家科學基金會 6 萬美元,在尤金(Eugene)城買下一棟舊一神論教堂,創立奧勒岡研究所(Oregon Research Institute, ORI)——一個世上獨一無二、純粹研究人類行為的私人機構。

這裡像個跨領域的雜貨間,接過各種奇怪委託:

  • 世貿中心晃動實驗室:建築師擔心 110 層樓的雙塔在風中搖晃會讓 99 樓的高薪租戶不安,問題其實是心理性的——多少幅度才會被感知?
  • ORI 在另一棟建築裡用伐木場用的液壓滾輪打造一個祕密的「搖晃房」,以「免費視力檢查」為幌子吸引受試者
  • 結果發現:人對搖晃的敏感度遠超工程師預期。建築師回紐約後說:「十億美元就要白白浪費了。」最終在每棟塔加裝了 11,000 個避震器
  • 這些避震器後來在 911 攻擊中讓建築多撐了一段時間,協助 14,000 人撤離

戈德伯格的恐怖發現:模型擊敗創造模型的人#

ORI 的研究者也共同關心 Paul Meehl 那本《臨床判斷 vs. 統計預測》(Clinical versus Statistical Prediction)——這本書是康納曼當年改造以色列軍隊面試流程的啟發來源。Lew Goldberg 接手探索:當專家做判斷時,他們的心智究竟在做什麼?

胃潰瘍 X 光研究#

  • 邀請奧勒岡大學的放射科醫師:他們從胃部 X 光判斷是否癌症時,看哪些「線索」(cues)?
  • 醫師列了 7 項:潰瘍大小、邊緣形狀、凹陷寬度等
  • ORI 把 96 個潰瘍個案,每個重複出現兩次(隨機混在 192 個樣本中),讓醫師打 1–7 分判斷惡性程度
  • 由 UCLA 的大型電腦做資料分析

結果讓 Goldberg 形容為「整體上相當駭人」:

  • 一個只是把七個線索等權重加總的簡單線性模型,幾乎完美預測了醫師的診斷
  • 醫師之間意見差異極大
  • 同一份 X 光,醫師自己對自己的判斷都不一致
  • 經驗多寡(從研究生到資深醫師)對預測準確度沒有顯著差異

模型擊敗醫師本人#

ORI 同事提出了一個瘋狂假設:「也許這個從醫師資料蒸餾出來的模型,其實比醫師本人更準?」事實證明——

簡單演算法不只勝過整體醫師,也勝過所有醫師中表現最好的那一位。Goldberg 的結論是:「這位臨床醫師擁有完整的人類學習與假設生成能力,卻缺乏機器的可靠性。他『有自己的某些日子』——疲勞、無聊、生病、人際分心都會讓他對同一刺激給出不同判斷。」

醫師們有一套自己的「該如何診斷」的理論。模型抓到了這套理論。但醫師在實作時並沒有依照自己的理論——所以被自己的模型打敗。

Meehl 30 年後寫到這個現象:「當你做了 90 多項研究、預測從足球比賽到肝病診斷,幾乎找不到半打研究顯示臨床判斷略勝統計時——是時候下一個實踐結論了。」

特沃斯基拜訪 Eugene#

1970 年夏天,特沃斯基準備到史丹佛任教一年,途中拜訪老友 Paul Slovic。在 Slovic 家車道上一邊投籃一邊聊天——特沃斯基的投籃姿勢被自己兒子描述為「四分之三速、無旋轉、從胸前推出像體操動作」。他向 Slovic 說:

  • 他和康納曼正在研究人類心智運作
  • 想找一個「能整天只跟對方說話、沒有大學干擾」的地方
  • 他們對「即使專家也會犯系統性錯誤」這件事有想法

Slovic 說:「我簡直被那些想法的振奮感震驚了。」

Eugene 的合著時光:共享一個心智#

1971–72 年,特沃斯基與康納曼齊聚奧勒岡:

  • 特沃斯基住在風景大窗的山崖屋,房東是裸體主義者
  • 康納曼一家也跟到,住在有草坪的房子裡——他無法想像自己除草
  • 兩人在 ORI 那棟前一神論教堂的辦公室裡日夜對話

合作風格極為獨特:

  • 康納曼一早分析前一天的學生問卷
  • 特沃斯基中午前後出現,一起到所有人都嫌棄的炸魚薯條店吃午飯
  • 接著一個下午與晚上都在說話,每天大笑不止
  • 兩人坐在打字機前緊挨著一起寫論文——密西根心理學家 Nisbett 說:「我無法想像,那感覺就像有人替我刷牙。」
  • 康納曼形容:「我們在共享一個心智。」

從不接受外人加入:Slovic 原本被特沃斯基隱約邀請過,但康納曼一到後 Slovic 立即明白「他們不要房間裡有別人」。

對於兩人的化學反應,康納曼說:「特沃斯基幾乎在跟我合作時暫停了懷疑——他對其他人不會這樣做。那就是合作的引擎。」當康納曼陷入「我沒有點子了」的低潮時,特沃斯基大笑說:「康納曼一分鐘的點子比 100 個人 100 年加起來都多。」

第一個啟發法:代表性(Representativeness)#

如果人不是統計學家,那他們在做什麼?兩人提出第一個答案——他們用啟發法(heuristics)取代機率法則。第一個被命名的啟發法是代表性

人們在做判斷時,會把眼前的事物與心中的某個「模型」比對。這個模型越近似目標群體(parent population),人們就越認為這事物屬於那個群體。

出生序的迷信#

問以色列高中生:在六個孩子的家庭裡,已知有 72 戶的出生順序是「女男女男男女」(GBGBBG),那「男女男男男男」(BGBBBB)出生順序的家庭可能有幾戶?

  • 兩種順序在數學上機率相同
  • 但學生普遍認為 BGBBBB 較少——因為它「五男一女」沒有反映人口的男女比例,代表性不足
  • 同樣,比較 BBBGGG 與 GBBGBG,學生壓倒性地選後者「比較常見」——因為它看起來「更隨機」

我們對「隨機」有一個刻板印象,這個刻板印象不像真正的隨機——它缺少叢集與規律。但真實的隨機過程經常會出現叢集。

二戰倫敦轟炸與生日悖論#

  • 二戰時倫敦人以為德國轟炸是「定點精準」,因為某些區域被反覆轟炸、其他區域完全倖免——統計學家後來證明那剛好是隨機轟炸該有的分佈
  • 一個 23 人房間中,至少兩人同生日的機率超過 50%——但人們會覺得「太巧了」

男女身高與基礎比率忽視#

美國成年男性平均身高 5'10"、女性 5'4",標準差皆約 2.5"。

  1. 隨機抽到一個身高 5'10" 的人——是男性還是女性的機率比為何?
  2. 隨機抽到 6 個人,平均身高 5'8"——機率比為何?
  • 受試者答案:第一題 8:1、第二題 2.5:1
  • 正確答案:第一題 16:1、第二題 29:1(樣本越大,資訊越多)
  • 受試者誤把「不太可能的命題」當成「比較可能的」——只因為 5'10" 「典型像個男人」
  • 對「典型男人」的刻板印象遮蔽了「我可能正面對一位高個子女性」這個事實

醫院出生男嬰比率#

大醫院每天出生 45 個嬰兒,小醫院每天 15 個,男嬰比例約 50% 但每天會有波動。一年下來,哪家醫院記錄到「超過 60% 男嬰」的天數較多?

  • 多數人答「差不多」
  • 正確答案是「小醫院」——樣本越小,越容易偏離整體比例

「我們並非說人不能理解樣本大小對抽樣變異的影響——人是可以被教會這個原則的。重點是:在沒有人提醒的情況下,人不會自動遵守這個原則。」

第二個啟發法:可得性(Availability)#

幾週後,他們發現代表性無法解釋全部,於是提出第二個啟發法——可得性

一個情境越容易被回想起來、越「可得」,人們就越覺得它可能發生。

字母 K 的位置#

在英文超過三個字母的單詞中,K 是當第一個字母還是第三個字母比較常見?

  • 多數人選「第一個字母」並估計約 2:1
  • 真實情況:K 出現在第三個字母的頻率是第一個字母的 兩倍
  • 同樣的錯誤也出現在 R、L、N、V

原因:K 開頭的字(kite, king, kitchen)容易回想;K 為第三字母(acknowledge, lake, ankle)很難立即想到。

名人名單實驗#

把 39 個男女名字念給學生聽:

  • 一個版本:男 19 人、女 20 人,但男生都是名人(如 Richard Nixon)
  • 另一個版本:女 20 人、男 19 人,但女生都是名人(如 Elisabeth Taylor)
  • 學生幾乎都判斷錯:以為名人較多的那一性別「人數較多」
  • 因為名人名字更容易被回想——可得性偏誤

真實情境的偏誤#

兩人也注意到自己的判斷會被新近、生動或常見的記憶扭曲:

  • 在高速公路上看見血淋淋的車禍後就會減速——主觀車禍機率剛被改動
  • 看完一部核戰電影後,會更擔心核戰真的發生

「在判斷一對夫妻離婚的可能性時,人會掃描記憶中是否有類似的夫妻——若可被檢索的個案中離婚很多,他就覺得離婚很可能。可得性啟發法導致系統性偏誤。」

第三個(半個)啟發法:錨定與調整(Anchoring and Adjustment)#

給高中生 5 秒猜出乘積:

  • A 組:8×7×6×5×4×3×2×1
  • B 組:1×2×3×4×5×6×7×8
  • A 組的中位數答案:2,250
  • B 組的中位數答案:512
  • 正確答案:40,320

兩組在做同樣的計算,只是順序不同——但起點數字不同就把估計拉到不同方向。

更誇張的實驗:

  • 受試者先轉一個 0–100 的命運轉盤
  • 然後估計聯合國裡非洲國家的比例
  • 轉到較大數字的人估出較高比例——錨定值「完全與題目無關」

兩人對「錨定」是不是一個獨立的啟發法沒有達成共識(特沃斯基認為是、康納曼認為不是),最後沒有為它寫專門的論文,只放在綜述中。「我們把它塞進去,因為結果太驚人——但這也讓我們對『何謂啟發法』的定義變得有點模糊。」

想像力的牢籠#

兩人指出:當機率無法客觀計算時(婚姻會不會結束?埃及會不會入侵以色列?),人會用故事代替機率——而這些故事被「可得性」嚴重扭曲。

「對未來的圖像被過去的經驗形塑。我們常認為某結果不可能發生,是因為我們無法想像會導致它發生的因果鏈條——缺陷常常在我們的想像力中。」

這把 Santayana 那句名言反過來——「忘記過去的人注定重蹈覆轍」——變成:對過去的記憶,會扭曲我們對未來的判斷。

「在衝突情境中尤其危險:自己的心情與計畫對自己更可得,但要採用對手對棋盤、對戰場的觀點,並不容易。」對 1939 年身在巴黎的猶太人而言,編一個「德軍會像 1919 年那樣行動」的故事,遠比編一個「他們會像 1941 年那樣行動」的故事容易——無論證據怎麼說。

偏誤是啟發法的腳印#

康納曼後來說:「很難解釋我們一開始在做什麼。我們沒有理解這些發現所需的概念工具。我們是在追查偏誤,還是在追查啟發法?是在追查錯誤本身,還是錯誤背後的機制?」

偏誤是啟發法的「腳印」。看見系統性的錯誤模式,就能逆推出心智用了哪個規則。每個偏誤都有自己的名字——近因偏誤(recency bias)、生動偏誤(vividness bias)等。但他們也碰到了一些「沒有可見路徑」的系統性錯誤,那些就只能先放著。

從錯誤反推心智規則——這成了他們此後一切研究的核心方法。