開場故事:一場必須靠反射動作完成的腦部手術#

2011 年深秋,神經外科醫師麥克·伊伯索德(Mike Ebersold)被叫去急診室,看一位被人從威斯康辛玉米田裡抬進來的獵人。獵人後腦勺有血、腦組織外露——伊伯索德一眼認出那是槍傷,後來推斷大概是遠處走火的 12 號獵槍霰彈,飛了不知多遠後擊穿頭骨,嵌進腦組織約一英吋深。

子彈打中的位置下方有一條大型靜脈竇(venous sinus),負責排出腦腔內的血液。子彈和碎骨剛好把破口堵成「軟木塞」,否則獵人在原地兩三分鐘內就會死亡。

從「按表操作」到「反射動作」#

伊伯索德描述自己進手術房前的思考流程:

  • 預先檢查清單:可能需要輸血——備血。
  • 預演步驟:A、B、C、D 一步步走過。
  • 預先告知團隊:可能會遇到什麼狀況。

但當他取出子彈與碎骨的瞬間,靜脈如同潰堤——五分鐘內失血兩個單位。「這時候就不是想了,是反射、是機械動作。」

這條靜脈直徑約如成人小指,撕裂處長約一英吋半。它是扁平結構,普通縫合會把組織撕得更開、結紮處又會漏血。伊伯索德靠的是過去手術中自己發明、書上找不到的招式:

  • 從手術切口處取下兩小塊肌肉。
  • 縫到撕裂的靜脈兩端,當作「肉塞」。
  • 約 60 秒完成、再失血約 200cc,但出血止住了。

獵人一週後出院,僅損失部分週邊視野。

反思也是一種練習#

從這個故事我們學到什麼關於學習與記憶的事?神經外科——其實人生中絕大多數場合——都有一種透過「反思個人經驗」而來的關鍵學習。

伊伯索德描述自己的反思習慣:

  • 手術中遇到困難的部分,當晚回家會想:縫合可不可以更好?
  • 進針角度該大一點、小一點?針距該不該調?
  • 隔天上手術台再試試看新的方式。

反思包含幾種能強化學習的認知活動:從記憶中提取既有知識與訓練、把它們連到新經驗、並心裡演練下次該怎麼做。

讓新學到的內容在關鍵時刻能用得出來,伊伯索德的做法是:

  1. 背下清單:在某類情境下要注意的步驟 A、B、C、D。
  2. 反覆操練:直到不再需要思考、可以反射性地做出正確動作。

「除非你不斷回想這個動作,它就不會變成反射。」就像賽車手在險境中、四分衛被擒抱前的瞬間動作——你必須在來不及思考前就反射出正確反應,靠的是不斷提取、不斷練習。

測試效應(The Testing Effect)#

孩子用線串蔓越莓,沒打結就掛上樹——結果蔓越莓從另一頭全滑了下來。

**提取就是替記憶打結。**重複提取再多打一個圈,把結拉緊。

遺忘曲線#

自 1885 年起,心理學家就開始繪製「遺忘曲線」(forgetting curve):

  • 短時間內我們會遺忘剛聽到或讀到內容的約 70%。
  • 之後遺忘速度會放慢,剩下的 30% 流失較緩。
  • 學習的核心挑戰,就是找到方法打斷遺忘的進行。

提取作為學習工具#

提取作為學習工具的力量,心理學上稱為「測試效應(testing effect)」,又稱「提取練習效應(retrieval-practice effect)」。

這個現象並非新發現:

  • 亞里斯多德(Aristotle)在《論記憶》中即寫道:「反覆練習回想某事,能強化記憶。」
  • 培根(Francis Bacon)與心理學家威廉·詹姆斯(William James)也都有類似洞察。
  • 現代實證研究進一步確認:反覆提取使學習黏住的效果,遠勝於再次閱讀原文。

為了發揮最大效果,提取必須重複多次、間隔開來,使每次回想都需要一定的認知努力,而不是流於機械念誦。

大眾的誤解#

2010 年《紐約時報》報導了一項研究:讀完文章後接受測驗的學生,一週後比沒被測驗的學生多保留 50% 的內容。讀者的線上留言卻多半反彈:

  • 「又一個把『學習』和『回想資訊』搞混的作者。」
  • 「我寧願盡量避免測驗,尤其是會影響成績的。」
  • 「我們的孩子現在什麼都做不來,記憶力強不強根本不重要。」

把基礎知識的學習,和創造性思考的培育對立起來,是個假議題。沒有知識,創造力蓋的是危樓;沒有創造力,知識也成不了大事。

在實驗室研究測試效應#

測試效應在實證研究中歷史悠久:

1917 年(首次大規模研究)#

  • 三、五、六、八年級學生研讀名人傳記。
  • 一組花部分時間「闔上書本默念」剛讀過的內容,另一組則持續重讀。
  • 三到四小時後測驗:所有有默念的組合表現都比僅重讀的好,最佳結果是把約 60% 學習時間用於默念。

1939 年(愛荷華州六年級,三千多人)#

  • 學生讀 600 字短文,並在不同時間點接受測驗,最終測在兩個月後。
  • 結果:
    • 第一次測驗延後越久,遺忘越多。
    • 一旦進行過一次測驗,遺忘幾乎停止;後續成績下降很少。

1967 年的轉折#

研究發現,重複測試所帶來的學習效果,與重複學習相當——挑戰了「測試只是評量、不能用來學」的舊觀念,重新點燃研究興趣。

1978 年(集中讀書 vs. 提取練習)#

  • 集中讀書組(cramming):立即測驗成績較高,但兩天後遺忘 50%。
  • 提取練習組:兩天後僅遺忘 13%。

多次測試 vs. 單次測試#

  • 沒被測過:一週後僅回憶 28%。
  • 一次測驗:一週後回憶 39%。
  • 三次連續測驗:一週後回憶 53%——與「立即測驗的成績」相同。

多次測驗等於替學習者「接種疫苗」抵抗遺忘。

生成效應(generation effect)#

研究讓受試者學習詞對:

  • 直接看 foot-shoe 的人,後續回憶率較低。
  • foot-s_ _e 並自行補完的人,回憶率較高。

即使只是補上幾個字母的小努力,也能強化目標詞的記憶。而且若延後 20 個詞對才測,效果比立刻測更強——因為延後提取需要更多努力。

間隔提取練習(讓中間發生一些遺忘)比集中提取練習,帶來更強的長期保留。

把研究帶進真實課堂#

哥倫比亞中學的合作研究#

2005 年,作者群與伊利諾州哥倫比亞中學校長羅傑·張伯倫(Roger Chamberlain)合作,把測試效應從實驗室搬進教室。

校長的疑慮是:

  • 如果只是死背,他不感興趣——他要追求分析、綜合、應用等高層次學習。
  • 老師都很有熱情,他不希望干擾現有教學。

研究設計:

  • 不更動課程、課本、教學方法或考試。
  • 只在六年級社會課加入「不計分的小測驗」。
  • 每次小測由助理 Pooja Agarwal 主持,老師主動離開教室,避免知道哪些內容被測。

三種測驗時機:

  • 上課開始前:針對指定閱讀但尚未討論的內容。
  • 下課之前:針對當天教過的內容。
  • 單元考試前 24 小時:複習測驗。

為了排除「只是再多看一次」的解釋,部分未被測的內容會以「重述事實」(如「尼羅河有兩條主要支流:白尼羅河與藍尼羅河」)的方式呈現,只看不測

結果令人信服:被小測過的內容,期末成績比沒測的內容高出整整一個等級只重述但沒測的內容,成績和完全沒複習的內容差不多。

八年級科學課的後續研究#

題材換成遺傳、演化與解剖學,三學期下來:

  • 沒被測過的內容:平均 79%(C+)
  • 被測過的內容:平均 92%(A−)

八個月後的學年末考試仍可看到效應持續。學生對小測也漸漸接受:64% 表示小測降低了他們對大考的焦慮,89% 認為小測幫助學習。

幾位老師的延伸做法#

  • 派翠絲·貝恩(Patrice Bain):六年級社會課,研究結束多年後仍維持「課前測、課後測、單元考前複習測」的節奏。
  • 喬恩·韋倫伯格(Jon Wehrenberg):八年級歷史,把提取練習融入課堂——讀完奴隸制相關文章後,要學生寫下「十個我之前不知道的事實」。

提取練習不需要任何電子工具——閱讀理解課裡,學生輪流朗讀段落、卡頓時重來、再被點名解釋角色心境,就是「提取 + 精緻化」最樸素的形式。

更高年齡層也有效嗎?#

聖路易華盛頓大學的安卓·索貝爾(Andrew Sobel)教授開的國際政治經濟學課,每班 160–170 人。學期後半,缺課率從 10% 飆到 25–35%——許多教授把投影片公開,學生乾脆不來。

第一次嘗試:突擊小考(失敗)#

  • 把期中、期末改為九次「不預告」的小考,用以強迫出席。
  • 結果三分之一學生退選;教學評鑑被狂罵。
  • 「他們表現差就直接退課,不要拿到爛分數。」

第二次嘗試:預告的九次小考(成功)#

  • 取消期中期末,改為九次預告日期的小考
  • 修課人數不減反增。
  • 出席率提升、討論品質大幅進步。

索貝爾的反思:「我以前以為自己教得不錯,現在我意識到——我的教學只是學生學習的一部分,而我如何結構化它,影響可能更大。

進一步的研究細微差異#

提取 vs. 重讀#

大學生讀科學主題的散文,一組讀完馬上做一次回想測驗,另一組則繼續重讀:

  • 兩天後:測驗組 68% vs. 重讀組 54%。
  • 一週後:測驗組 56% vs. 重讀組 42%。
  • 另一研究:一週後重讀組遺忘 52%、測驗組僅遺忘 10%。

回饋與延遲回饋#

  • 給予正確答案的回饋,比單純測驗更能強化記憶。
  • 反直覺的是:短暫延後再給回饋,比立即回饋帶來更好的長期學習。

動作學習研究發現類似現象:立即回饋就像「腳踏車的輔助輪」,學習者會依賴它;延後回饋雖然當下笨拙,但建立的技能更穩定。

筆試也是類似情形:

  • 開書邊看邊答的學生,立即測驗最好;但長期保留輸給「先合書答完再對答案」的組別。
  • 延後回饋等同於把練習間隔拉開,提高長期保留(下一章會深入討論「間隔」)。

哪種測驗最有效?#

  • 需要自己生成答案的測驗(申論、簡答、單字卡)效果最佳。
  • 辨識型測驗(選擇題、是非題)效果略弱,但仍有顯著好處。
  • 越需要認知努力提取,效果越強。
  • 即使在課堂中只多加一次測驗,也能顯著提升期末成績;測驗次數越多,效益持續增加。

學生有多少人在用?#

  • 一份問卷:只有 11% 的大學生表示會自我測驗。
  • 而且多數人測自己只是為了「找出不會的內容好再讀一次」——卻不知道提取本身就是強化記憶的動作

是否只是死背的捷徑?#

研究指出,相較於重讀,測驗反而更能促進知識遷移到新情境、新問題,並讓「相關但未被直接測過」的內容也更容易被回想起來。

學生會抗拒嗎?#

  • 高風險的期中、期末確實令人抗拒。
  • 但所有有調查學生態度的研究都顯示:頻繁低風險小測的班級,學生對課程評價反而更高——因為他們不需要在考前抱佛腳。

測驗如何影響後續讀書?#

  • 測過之後,學生會花更多時間複習答錯的部分,學得也更深。
  • 只重讀、不自我測驗的學生,對自己的精熟程度過度自信。

接受過小測的學生有雙重優勢:對「會什麼、不會什麼」判斷更準,加上提取本身對記憶的強化。

額外的間接好處#

低風險課堂測驗還能:

  • 提升出席率(學生知道課堂上會被測)。
  • 提升課前準備、課中專注度。
  • 校正學生對自身掌握程度的判斷。
  • 戳破「重讀產生的流暢感 ≠ 精熟」的錯覺。
  • 透過分散後果到許多次小測,降低整體測試焦慮——沒有任何一次是生死攸關。
  • 讓老師看出學生的盲點,調整教學。

不論線上或實體課,這些好處都成立。

重點整理#

  • 練習從記憶中提取新知識或新技能,是促進學習與長期保留最強大的工具之一——不論是事實、概念、解題技巧,或運動技能皆然。
  • 越費力的提取,學得越深。學習越容易越好是一種誘惑,但研究結果剛好相反。
  • 延後再做提取練習,比立即做更有效——因為延後提取需要更多努力。
  • 重複提取不僅讓記憶更耐久,也讓知識能更靈活地在多種情境下被調用、應用到更多種問題上。
  • 抱佛腳雖能在當下測驗拿到較好分數,但其後遺忘速度遠快於提取練習,長期勝出的是後者。
  • 即使只是在課堂中多加一次測驗,也能顯著提升期末成績;測驗頻率越高,效益持續累積。
  • 測驗不必由教師主導——任何人都可以用單字卡、自我提問來練習提取。
  • 附帶矯正回饋能避免學生把錯誤答案記成正確。
  • 接受過低風險課堂小測的學生,最終會喜歡上這個做法

校長張伯倫研究結束後的回答:「我真正放心的是——孩子要能評估、綜合、把概念用到不同情境,當他們已經有了知識基礎與保留度時,會更有效率,不需要回頭去想『那個字是什麼意思』『那個概念是什麼』。這讓他們能往更高的層次走。