The Planner And The Doer

三位學者的啟發#

當薩勒（Richard Thaler）在 1970 年代末開始認真思考自我控制問題時，經濟學文獻幾乎無可參考。他從三位學者身上找到靈感——一位經濟學家、兩位心理學家。

斯特羅茨：時間不一致的數學分析#

**斯特羅茨（Robert Strotz）**是當時唯一一篇正面處理自我控制的經濟學論文作者。

1955 年的論文中，他深入研究偏好需要滿足什麼數學性質，才能保證一個人定下計畫後不會反悔。
結論：只有一種非常特殊的情況——指數折現（exponential discounting）——能保證時間一致。
他援引荷馬史詩中的**奧德修斯（Odysseus）與賽蓮（Sirens）**故事，幾乎所有自我控制研究者都會繞回這個典故。

奧德修斯的兩段策略，正好對應人類處理自我控制的兩大工具：

船員方案：用蠟塞住耳朵——移除誘惑線索（Out of sight, out of mind）。
船長方案：把自己綁在桅杆上——承諾策略（commitment strategy），限制自己未來的選擇。

斯特羅茨本人也採用承諾策略：他要求學校把年薪分成 12 個月發放，而不是 9 個月——「儘管我本可以賺到那筆利息！」

米歇爾：棉花糖實驗#

**米歇爾（Walter Mischel）**在史丹佛附設幼兒園進行的延遲滿足實驗如今已家喻戶曉。

四、五歲的小孩可以選擇現在拿一塊 Oreo，或等實驗者回來再拿三塊。
如果獎品就放在小孩面前，平均只能撐一分多鐘。
如果獎品移出視線，平均可以撐到十一分鐘。
被引導去想「好玩的事」，也能撐更久。

十年後追蹤這些小孩，當年能撐多久竟能預測 SAT 分數、職涯成就、藥物濫用等重要人生結果——這格外令人驚訝，因為米歇爾自己過去的研究顯示人格特質很難預測行為。

米歇爾留下一段珍貴影片：某個小孩面對三塊 Oreo 撐不住，但他不按鈴，而是小心地把每塊餅乾打開、舔光中間的奶油、再合上排好，希望別被發現。薩勒幻想這小孩長大會變成 Bernie Madoff。

安斯利：跨物種的雙曲折現#

**安斯利（George Ainslie）**是一位在退伍軍人醫院執業的精神科醫師，1975 年發表的論文總結了當時學界對自我控制的所有理解。

他指出有大量文獻在研究老鼠、鴿子等動物的延遲滿足。
透過調整延遲時間與獎勵大小，可估出動物的時間偏好——結果動物也呈現雙曲折現，也有自我控制問題！
對抗誘惑的策略包括承諾、提高屈服的成本（例如：把支票交給朋友，若被抓到抽菸就兌現）、與自己打**「私下賭注」（private side bet）**（例如：「不寫完報告就不准看球賽」）。

走向計畫者—執行者模型#

薩勒想回答的核心理論問題是：如果我知道自己未來會反悔，我什麼時候、為什麼會採取行動限制未來的自己？

關鍵在於：只有當你有充分理由相信「未來偏好改變是個錯誤」時，才會想要綁住自己。

社會科學家 Donald McIntosh 的一句話深深影響了薩勒的思考：

「自我控制這個概念本身是矛盾的，除非我們假設心靈包含不只一個能量系統，而這些系統之間有一定程度的獨立性。」

自我控制本質上是衝突，而衝突至少需要兩個人——所以薩勒需要一個雙自我模型。

在經濟學中，雙自我模型被視為激進。
在心理學中，當時佛洛伊德的本我/自我/超我已過時，後來流行的雙系統觀也尚未成形。
薩勒最終找到薛弗林（Hersh Shefrin）——一位數學經濟學家，他不認為這想法是瘋的，還會笑薩勒的笑話。

計畫者—執行者模型#

模型只是「彷彿（as if）」式的隱喻：在任何時刻，每個人都由兩個自我構成——有遠見、關心未來的計畫者（planner），與只活在當下、無所謂的執行者（doer）。

兩者如何互動？薩勒與薛弗林選用了組織理論中的委託—代理模型（principal-agent model）：

計畫者是委託人：完全利他，希望所有執行者的總效用最大化。
執行者是代理人：一系列短命、自私的人，只在乎當下的快樂。
計畫者無法直接控制執行者；只能透過**獎懲（多為心理上的）或規則（承諾策略）**間接影響。

能量棒範例#

設想 Harry 被丟在偏遠木屋十天，被熊偷光食物，只剩十條能量棒。他的計畫者打算每天吃一條，讓十個執行者都享有同等效用。

最理想方案：十個可設定時間開啟的保險箱，每天放一條——這就是 Kitchen Safe 那種承諾科技，徹底剝奪執行者的選擇。
現實情況：能量棒就放櫃子裡。如果計畫者不介入，第一天的執行者會一口氣吃三條吃到飽足，第二天、第三天也一樣，到第四天就只剩一條，後面的執行者餓爆。

如果沒有承諾工具，計畫者剩下的唯一手段是罪惡感（guilt）——透過教養或社會化，讓執行者吃太多時感到難受。

罪惡感無法精準作用。它無法只在吃完第一條之後才啟動，而是會讓每一口都變得沒那麼好吃。換言之，動用意志力（willpower）本身是有代價的——它讓人生變得不那麼愉快。

規則 vs. 自由裁量#

如果能設下完美規則，生活會更好——這也是為什麼斯特羅茨選擇 12 個月領薪。但規則並非萬能：

外部強制規則不見得隨手可得（就算訂了健康晚餐，你還是可以加點披薩）。
規則本身僵硬，缺乏彈性（12 個月領薪就難以趁冬天特價買割草機）。

組織也面臨同樣的兩難：太死的規則手冊讓基層代理人無法處理沒被預料到的合理情況。心理帳戶（裝錢的信封、玻璃罐、退休帳戶）正是個人版本的「組織會計」——而它之所以能運作，正是因為人類沒有把不同帳戶的錢當作可替代的。

β–δ 模型：下一代的選擇#

計畫者—執行者並非腦中真的有兩個人。薩勒與薛弗林後來附註：可以把計畫者想成前額葉皮質（負責理性思考），把執行者想成邊緣系統；或對應到 Kahneman 的慢思考系統 2 與快思考系統 1。

下一代行為經濟學家更偏愛 β–δ 模型，由**雷布森（David Laibson）**在 1997 年博士論文中提出，後由 拉賓（Matthew Rabin） 與 歐唐納修（Ted O’Donoghue） 發展。

它是對薩繆爾森模型最小幅度的修改，但能抓住自我控制的本質。
直覺：足夠遙遠的未來不折現（δ = 1），但「現在」被特別放大，任何不在當下的事先打對折（β = 0.5）。
這樣的偏好就是現時偏誤（present-biased），會導致時間不一致選擇。

自覺與否#

雷布森假設行為人是世故的（sophisticated）：他們知道自己有現時偏誤。歐唐納修與拉賓則考慮更激進的天真型（naïve）：行為人渾然不知自己的問題。

真實情況介於兩者之間——部分天真（partial naïveté）：

我們知道自己有自我控制問題，但低估嚴重程度。
這對應 Loewenstein 所稱的**「冷熱共情落差（hot-cold empathy gaps）」**。
週日早午餐後盤算週三晚餐要吃清淡，覺得毫無難度；但週三晚上朋友邀去新開的精釀披薩店，你就會吃喝超量。
解法：讓計畫者事先訂下規則（週間不去披薩啤酒局），並想辦法執行。

三位學者的啟發#

斯特羅茨：時間不一致的數學分析#

米歇爾：棉花糖實驗#

安斯利：跨物種的雙曲折現#

走向計畫者—執行者模型#

計畫者—執行者模型#

Figure 6: 計畫者—執行者模型與意志力成本曲線

能量棒範例#

規則 vs. 自由裁量#

β–δ 模型：下一代的選擇#

自覺與否#