圖靈與圖靈測試#

圖靈(Alan Turing)1936 年奠定了古典計算理論,二戰期間參與建造首批通用古典電腦。他理解到:通用電腦既然是通用模擬器,原則上人工智慧(AI)必然可能——這比巴貝奇與洛芙萊斯前進了一大步。

1950 年論文〈Computing Machinery and Intelligence〉提出圖靈測試(Turing test)

  • 機器與真人各透過純文字介面(如電傳打字機)與一位人類裁判對話
  • 若裁判無法區分哪一邊是機器,就算通過
  • 透過此設計避免外觀干擾,只測試思考能力

Eliza 與 chatbot 的虛幻成功#

1964 年溫森鮑姆(Joseph Weizenbaum)寫了 Eliza——模仿心理治療師的程式:

  • 掃描輸入找關鍵字與文法
  • 套用模板回應,如「我恨我的工作」 → 「你最恨工作的哪部分?」
  • 若失敗則隨機選用反問句

許多使用者被它騙倒——即使被告知它不是真的 AI,仍會繼續對它傾訴。溫森鮑姆寫書《Computer Power and Human Reason》警告擬人化的危險。

侯世達被惡作劇#

1983 年研究生跟侯世達(Douglas Hofstadter)開了個玩笑,假裝有政府 AI 程式,讓他做圖靈測試。實際上是學生親自扮演 Eliza。對話中有:

  • 問:什麼是耳朵?
  • 答:耳朵是動物身上的聽覺器官。

這顯然超出 Eliza 的能力,但侯世達仍接受——只有當學生開始玩針對性的玩笑時才露餡。

侯世達事後反省:「我願意接受多麼大量的『流暢性』,竟把這些當作 1980 年代藉雕蟲小技湊起來就能達成的程度。」

事實是:Eliza 之後幾十年的 chatbot 本質上沒有更接近真正的思考

Loebner 獎與 Elbot#

1990 年勒布納(Hugh Loebner)設立獎項,獎勵接近通過圖靈測試的程式。2008 年的優勝者 Elbot 對話片段:

  • 裁判:「你了解圖靈測試的意義嗎?」
  • Elbot:「有些人自己都通不過圖靈測試。為什麼要逼電腦做?」(顯然是觸發關鍵字「Turing test」的固定回應)
  • 裁判:「I spose it is a little harsh」(其中 sposesuppose 的口語縮寫)
  • Elbot:「如果我們機器人結婚,會是永恆的:『直到鐵鏽分開我們』。」(誤把 spose 識別為 spouse

圖靈論文發表 58 年來,「能思考的機器」的進展:

其他計算機科學技術突飛猛進,唯 AI 例外。

關鍵問題:解釋#

圖靈論文預測 2000 年「將能談論機器思考而不會被反駁」。圖靈估計只需約 100 MB 記憶體與當時電腦的速度。如今我的筆電有數千倍記憶體、百萬倍速度,卻一樣不能思考

AI 的瓶頸不在硬體,而在於我們沒有解釋創造力是如何運作的

創造力是「實際解決問題的方案在尚無解釋時被發現」的罕見例外狀況——這種事很少見。

圖靈測試的根本缺陷#

戴維·多伊奇(David Deutsch)指出,圖靈測試是經驗主義錯誤的延伸——尋求純行為的判準,要求裁判在沒有「候選 AI 應如何運作的解釋」下做判斷。

圖靈測試的邏輯與培里(William Paley)走過荒原時所做的判斷類似:要解釋觀察到的特徵是如何來的——

  • 若 AI 的言談中知識來自設計者,就不是 AI
  • 若知識來自程式本身,才是真正的 AI

同樣的話可以是兩種不同證據#

Elbot 開的婚姻笑話:

  • 若是程式作者預先寫好的固定笑話,這是「不會思考」的證據
  • 若程式從未編入此笑話,而是它自己即興產出,這就是「會思考」的證據

同樣的輸出,是否為 AI 的證據,取決於對「程式如何運作」之最佳解釋

因此原則上,若程式作者能對「為何此程式會生成這些輸出」給出好的、難以變動的解釋——我們在尚未看到任何輸出前就能判定它是 AI。

這也表示,只要有人寫出真 AI 的程式,根本不需要圖靈測試。

與普適性連結:AI 必然是「人」#

AI 的能力必須具有某種普適性——專用思考不算思考。

戴維·多伊奇的猜想:每個 AI 都是「人」——即通用解釋者。

AI 的實現會以「普適性的躍進」方式發生,而非透過 chatbot 技巧逐步逼近。

擬真度、欺騙能力的提升並不等於思考能力的提升——更會說謊的 chatbot 距離 AI 一點也不更近。

行為主義(Behaviourism)#

把心理學限縮為「刺激—反應」的科學,是工具主義在心理學上的版本——正是這種觀念誤導了 chatbot 路線。非 AI 程式無論多會偽裝,永遠不能假裝成 AI

人工演化(Artificial Evolution)的類似錯誤#

設想研究機器人步行:

  1. 靈感(inspiration)階段:設計腿部、感應器、整體結構,並設計一套「子程式語言」——用以表達各種步態指令
  2. 汗水(perspiration)階段:可用「演化演算法」隨機變異子程式組合、保留表現好的版本

看起來是「演化」,但戴維·多伊奇懷疑:真正創造知識的並非演化,而是程式設計者

  • 設計者花數月設計子程式語言時,已把幾何學、力學等大量背景知識編碼進去
  • 「演化」其實只是在這個被精心設計的小空間中組合
  • 這對應到拉馬克主義對演化的誤解——以為新適應由既有知識的變動產生,而非真正新知識的創造

一個更乾淨的實驗#

若要證明真有人工演化,應該:

  • 用已有實用功能的機器人(非為演化而設計)
  • 直接以隨機數字替換整個微處理器中的程式
  • 用該處理器自然會出現的位元錯誤作為突變
  • 若這樣的機器人能逐步「演化」出更好的步行——那才是真正的演化

一個關鍵點:在生物圈中,遺傳密碼本身也曾與適應一同演化;唯有當遺傳密碼穩定為某種普適性後,盲目隨機變異基因才足以產生豐富的生物圈。

我們連那次「躍進」是什麼樣的普適性都還不知,又怎能期望沒有它的人工演化能成功?

感質(Qualia)與意識#

感質(qualia, 單數 quale):感覺的主觀面向。藍色看起來像什麼、痛覺的具體感受,都是感質。

思想實驗:

  • 你天生缺乏視網膜藍色受器,因此看不見藍色,把藍色看成黃綠等混合
  • 治癒後第一次看到藍色——你能預測自己會把它叫做「藍」,但無人能預測「藍色看起來是什麼樣子」

感質目前無法描述也無法預測

這是個值得驚嘆的科學謎題;對科學世界觀來說,這是個尚未解決的根本問題。

丹尼特(Daniel Dennett)的化約立場#

丹尼特主張感質不存在——我們的內省是錯誤記憶。其代表作《意識的解釋》(Consciousness Explained)被一些哲學家戲稱應該叫《意識的否認》(Consciousness Denied)。

戴維·多伊奇傾向後者的批評:

  • 單純否認感質的存在是壞解釋——任何事物都能用此方法否認
  • 任何真正的感質解釋都必須回應丹尼特的批判,但也必須給出好解釋

創造力、意識、自由意志、意義、感質——這幾個東西似乎是在人類身上「一次普適性躍進」中共同出現的。

沒有什麼有力論證能說它們屬於不同層級或能各自獨立達成。

易混淆的「智慧」#

某些被視為智慧表現的能力,其實與圖靈意義下的智慧無關

  • 鏡中自我辨識(簡單的模式識別程式就能做到)
  • 工具使用
  • 用語言做訊號(非對話意義)
  • 各種情緒反應(但不包含其感質)

戴維·多伊奇提出的判準:

若一件事已能被程式化,它與圖靈意義下的智慧無關。

若無法把它程式化,就是還沒理解它。

這是判斷各種「我已解釋意識/創造力」主張的簡單試金石。

名詞與要點#

本章核心詞彙

  • 感質(Quale; 複數 Qualia):感覺的主觀面向
  • 行為主義(Behaviourism):心理學版的工具主義——主張科學只能(或只該)測量與預測「刺激—行為」之間的關係

小結#

  • 通用人工智慧(AGI)數十年來毫無進展,因為核心是個未解的哲學問題:我們不理解創造力如何運作
  • 一旦我們理解了,程式化它將不是難事
  • 同樣,「人工演化」可能也尚未真正實現——因為我們不理解 DNA 複製系統所躍進到的那種普適性
  • chatbot 與圖靈測試走進了死胡同:它們建立在「以更巧妙的技巧偽裝就能變成 AI」之上,但非 AI 終究不能偽裝成 AI