三位學者的啟發#

當薩勒(Richard Thaler)在 1970 年代末開始認真思考自我控制問題時,經濟學文獻幾乎無可參考。他從三位學者身上找到靈感——一位經濟學家、兩位心理學家。

斯特羅茨:時間不一致的數學分析#

**斯特羅茨(Robert Strotz)**是當時唯一一篇正面處理自我控制的經濟學論文作者。

  • 1955 年的論文中,他深入研究偏好需要滿足什麼數學性質,才能保證一個人定下計畫後不會反悔。
  • 結論:只有一種非常特殊的情況——指數折現(exponential discounting)——能保證時間一致。
  • 他援引荷馬史詩中的**奧德修斯(Odysseus)與賽蓮(Sirens)**故事,幾乎所有自我控制研究者都會繞回這個典故。

奧德修斯的兩段策略,正好對應人類處理自我控制的兩大工具:

  • 船員方案:用蠟塞住耳朵——移除誘惑線索(Out of sight, out of mind)。
  • 船長方案:把自己綁在桅杆上——承諾策略(commitment strategy),限制自己未來的選擇。

斯特羅茨本人也採用承諾策略:他要求學校把年薪分成 12 個月發放,而不是 9 個月——「儘管我本可以賺到那筆利息!」

米歇爾:棉花糖實驗#

**米歇爾(Walter Mischel)**在史丹佛附設幼兒園進行的延遲滿足實驗如今已家喻戶曉。

  • 四、五歲的小孩可以選擇現在拿一塊 Oreo,或等實驗者回來再拿三塊。
  • 如果獎品就放在小孩面前,平均只能撐一分多鐘
  • 如果獎品移出視線,平均可以撐到十一分鐘
  • 被引導去想「好玩的事」,也能撐更久。

十年後追蹤這些小孩,當年能撐多久竟能預測 SAT 分數、職涯成就、藥物濫用等重要人生結果——這格外令人驚訝,因為米歇爾自己過去的研究顯示人格特質很難預測行為

米歇爾留下一段珍貴影片:某個小孩面對三塊 Oreo 撐不住,但他不按鈴,而是小心地把每塊餅乾打開、舔光中間的奶油、再合上排好,希望別被發現。薩勒幻想這小孩長大會變成 Bernie Madoff。

安斯利:跨物種的雙曲折現#

**安斯利(George Ainslie)**是一位在退伍軍人醫院執業的精神科醫師,1975 年發表的論文總結了當時學界對自我控制的所有理解。

  • 他指出有大量文獻在研究老鼠、鴿子等動物的延遲滿足。
  • 透過調整延遲時間與獎勵大小,可估出動物的時間偏好——結果動物也呈現雙曲折現,也有自我控制問題
  • 對抗誘惑的策略包括承諾、提高屈服的成本(例如:把支票交給朋友,若被抓到抽菸就兌現)、與自己打**「私下賭注」(private side bet)**(例如:「不寫完報告就不准看球賽」)。

走向計畫者—執行者模型#

薩勒想回答的核心理論問題是:如果我知道自己未來會反悔,我什麼時候、為什麼會採取行動限制未來的自己?

關鍵在於:只有當你有充分理由相信「未來偏好改變是個錯誤」時,才會想要綁住自己。

社會科學家 Donald McIntosh 的一句話深深影響了薩勒的思考:

「自我控制這個概念本身是矛盾的,除非我們假設心靈包含不只一個能量系統,而這些系統之間有一定程度的獨立性。」

自我控制本質上是衝突,而衝突至少需要兩個人——所以薩勒需要一個雙自我模型

  • 在經濟學中,雙自我模型被視為激進。
  • 在心理學中,當時佛洛伊德的本我/自我/超我已過時,後來流行的雙系統觀也尚未成形。
  • 薩勒最終找到薛弗林(Hersh Shefrin)——一位數學經濟學家,他不認為這想法是瘋的,還會笑薩勒的笑話。

計畫者—執行者模型#

模型只是「彷彿(as if)」式的隱喻:在任何時刻,每個人都由兩個自我構成——有遠見、關心未來的計畫者(planner),與只活在當下、無所謂的執行者(doer)

Figure 6: 計畫者—執行者模型與意志力成本曲線

兩者如何互動?薩勒與薛弗林選用了組織理論中的委託—代理模型(principal-agent model)

  • 計畫者是委託人:完全利他,希望所有執行者的總效用最大化。
  • 執行者是代理人:一系列短命、自私的人,只在乎當下的快樂。
  • 計畫者無法直接控制執行者;只能透過**獎懲(多為心理上的)規則(承諾策略)**間接影響。

能量棒範例#

設想 Harry 被丟在偏遠木屋十天,被熊偷光食物,只剩十條能量棒。他的計畫者打算每天吃一條,讓十個執行者都享有同等效用。

  • 最理想方案:十個可設定時間開啟的保險箱,每天放一條——這就是 Kitchen Safe 那種承諾科技,徹底剝奪執行者的選擇。
  • 現實情況:能量棒就放櫃子裡。如果計畫者不介入,第一天的執行者會一口氣吃三條吃到飽足,第二天、第三天也一樣,到第四天就只剩一條,後面的執行者餓爆。

如果沒有承諾工具,計畫者剩下的唯一手段是罪惡感(guilt)——透過教養或社會化,讓執行者吃太多時感到難受。

罪惡感無法精準作用。它無法只在吃完第一條之後才啟動,而是會讓每一口都變得沒那麼好吃。換言之,動用意志力(willpower)本身是有代價的——它讓人生變得不那麼愉快。

規則 vs. 自由裁量#

如果能設下完美規則,生活會更好——這也是為什麼斯特羅茨選擇 12 個月領薪。但規則並非萬能

  • 外部強制規則不見得隨手可得(就算訂了健康晚餐,你還是可以加點披薩)。
  • 規則本身僵硬,缺乏彈性(12 個月領薪就難以趁冬天特價買割草機)。

組織也面臨同樣的兩難:太死的規則手冊讓基層代理人無法處理沒被預料到的合理情況。心理帳戶(裝錢的信封、玻璃罐、退休帳戶)正是個人版本的「組織會計」——而它之所以能運作,正是因為人類沒有把不同帳戶的錢當作可替代的

β–δ 模型:下一代的選擇#

計畫者—執行者並非腦中真的有兩個人。薩勒與薛弗林後來附註:可以把計畫者想成前額葉皮質(負責理性思考),把執行者想成邊緣系統;或對應到 Kahneman 的慢思考系統 2快思考系統 1

下一代行為經濟學家更偏愛 β–δ 模型,由**雷布森(David Laibson)**在 1997 年博士論文中提出,後由 拉賓(Matthew Rabin)歐唐納修(Ted O’Donoghue) 發展。

  • 它是對薩繆爾森模型最小幅度的修改,但能抓住自我控制的本質。
  • 直覺:足夠遙遠的未來不折現(δ = 1),但「現在」被特別放大,任何不在當下的事先打對折(β = 0.5)。
  • 這樣的偏好就是現時偏誤(present-biased),會導致時間不一致選擇。

自覺與否#

雷布森假設行為人是世故的(sophisticated):他們知道自己有現時偏誤。歐唐納修與拉賓則考慮更激進的天真型(naïve):行為人渾然不知自己的問題。

真實情況介於兩者之間——部分天真(partial naïveté)

  • 我們知道自己有自我控制問題,但低估嚴重程度
  • 這對應 Loewenstein 所稱的**「冷熱共情落差(hot-cold empathy gaps)」**。
  • 週日早午餐後盤算週三晚餐要吃清淡,覺得毫無難度;但週三晚上朋友邀去新開的精釀披薩店,你就會吃喝超量。
  • 解法:讓計畫者事先訂下規則(週間不去披薩啤酒局),並想辦法執行。