人工創造力 • 無窮的開始：徹底改變世界的解釋

圖靈與圖靈測試#

圖靈（Alan Turing）1936 年奠定了古典計算理論，二戰期間參與建造首批通用古典電腦。他理解到：通用電腦既然是通用模擬器，原則上人工智慧（AI）必然可能——這比巴貝奇與洛芙萊斯前進了一大步。

1950 年論文〈Computing Machinery and Intelligence〉提出圖靈測試（Turing test）：

機器與真人各透過純文字介面（如電傳打字機）與一位人類裁判對話
若裁判無法區分哪一邊是機器，就算通過
透過此設計避免外觀干擾，只測試思考能力

Eliza 與 chatbot 的虛幻成功#

1964 年溫森鮑姆（Joseph Weizenbaum）寫了 Eliza——模仿心理治療師的程式：

掃描輸入找關鍵字與文法
套用模板回應，如「我恨我的工作」 → 「你最恨工作的哪部分？」
若失敗則隨機選用反問句

許多使用者被它騙倒——即使被告知它不是真的 AI，仍會繼續對它傾訴。溫森鮑姆寫書《Computer Power and Human Reason》警告擬人化的危險。

侯世達被惡作劇#

1983 年研究生跟侯世達（Douglas Hofstadter）開了個玩笑，假裝有政府 AI 程式，讓他做圖靈測試。實際上是學生親自扮演 Eliza。對話中有：

問：什麼是耳朵？
答：耳朵是動物身上的聽覺器官。

這顯然超出 Eliza 的能力，但侯世達仍接受——只有當學生開始玩針對性的玩笑時才露餡。
侯世達事後反省：「我願意接受多麼大量的『流暢性』，竟把這些當作 1980 年代藉雕蟲小技湊起來就能達成的程度。」

事實是：Eliza 之後幾十年的 chatbot 本質上沒有更接近真正的思考。

Loebner 獎與 Elbot#

1990 年勒布納（Hugh Loebner）設立獎項，獎勵接近通過圖靈測試的程式。2008 年的優勝者 Elbot 對話片段：

裁判：「你了解圖靈測試的意義嗎？」
Elbot：「有些人自己都通不過圖靈測試。為什麼要逼電腦做？」（顯然是觸發關鍵字「Turing test」的固定回應）
裁判：「I spose it is a little harsh」（其中 spose 是 suppose 的口語縮寫）
Elbot：「如果我們機器人結婚，會是永恆的：『直到鐵鏽分開我們』。」（誤把 spose 識別為 spouse）

圖靈論文發表 58 年來，「能思考的機器」的進展：零。
其他計算機科學技術突飛猛進，唯 AI 例外。

關鍵問題：解釋#

圖靈論文預測 2000 年「將能談論機器思考而不會被反駁」。圖靈估計只需約 100 MB 記憶體與當時電腦的速度。如今我的筆電有數千倍記憶體、百萬倍速度，卻一樣不能思考。

AI 的瓶頸不在硬體，而在於我們沒有解釋創造力是如何運作的。
創造力是「實際解決問題的方案在尚無解釋時被發現」的罕見例外狀況——這種事很少見。

圖靈測試的根本缺陷#

戴維·多伊奇（David Deutsch）指出，圖靈測試是經驗主義錯誤的延伸——尋求純行為的判準，要求裁判在沒有「候選 AI 應如何運作的解釋」下做判斷。

圖靈測試的邏輯與培里（William Paley）走過荒原時所做的判斷類似：要解釋觀察到的特徵是如何來的——
若 AI 的言談中知識來自設計者，就不是 AI
若知識來自程式本身，才是真正的 AI

同樣的話可以是兩種不同證據#

Elbot 開的婚姻笑話：

若是程式作者預先寫好的固定笑話，這是「不會思考」的證據
若程式從未編入此笑話，而是它自己即興產出，這就是「會思考」的證據

同樣的輸出，是否為 AI 的證據，取決於對「程式如何運作」之最佳解釋。
因此原則上，若程式作者能對「為何此程式會生成這些輸出」給出好的、難以變動的解釋——我們在尚未看到任何輸出前就能判定它是 AI。
這也表示，只要有人寫出真 AI 的程式，根本不需要圖靈測試。

與普適性連結：AI 必然是「人」#

AI 的能力必須具有某種普適性——專用思考不算思考。
戴維·多伊奇的猜想：每個 AI 都是「人」——即通用解釋者。
AI 的實現會以「普適性的躍進」方式發生，而非透過 chatbot 技巧逐步逼近。

擬真度、欺騙能力的提升並不等於思考能力的提升——更會說謊的 chatbot 距離 AI 一點也不更近。

行為主義（Behaviourism）#

把心理學限縮為「刺激—反應」的科學，是工具主義在心理學上的版本——正是這種觀念誤導了 chatbot 路線。非 AI 程式無論多會偽裝，永遠不能假裝成 AI。

人工演化（Artificial Evolution）的類似錯誤#

設想研究機器人步行：

靈感（inspiration）階段：設計腿部、感應器、整體結構，並設計一套「子程式語言」——用以表達各種步態指令
汗水（perspiration）階段：可用「演化演算法」隨機變異子程式組合、保留表現好的版本

看起來是「演化」，但戴維·多伊奇懷疑：真正創造知識的並非演化，而是程式設計者。
設計者花數月設計子程式語言時，已把幾何學、力學等大量背景知識編碼進去
「演化」其實只是在這個被精心設計的小空間中組合
這對應到拉馬克主義對演化的誤解——以為新適應由既有知識的變動產生，而非真正新知識的創造

一個更乾淨的實驗#

若要證明真有人工演化，應該：

用已有實用功能的機器人（非為演化而設計）
直接以隨機數字替換整個微處理器中的程式
用該處理器自然會出現的位元錯誤作為突變
若這樣的機器人能逐步「演化」出更好的步行——那才是真正的演化

一個關鍵點：在生物圈中，遺傳密碼本身也曾與適應一同演化；唯有當遺傳密碼穩定為某種普適性後，盲目隨機變異基因才足以產生豐富的生物圈。
我們連那次「躍進」是什麼樣的普適性都還不知，又怎能期望沒有它的人工演化能成功？

感質（Qualia）與意識#

感質（qualia, 單數 quale）：感覺的主觀面向。藍色看起來像什麼、痛覺的具體感受，都是感質。

思想實驗：

你天生缺乏視網膜藍色受器，因此看不見藍色，把藍色看成黃綠等混合
治癒後第一次看到藍色——你能預測自己會把它叫做「藍」，但無人能預測「藍色看起來是什麼樣子」

感質目前無法描述也無法預測。
這是個值得驚嘆的科學謎題；對科學世界觀來說，這是個尚未解決的根本問題。

丹尼特（Daniel Dennett）的化約立場#

丹尼特主張感質不存在——我們的內省是錯誤記憶。其代表作《意識的解釋》（Consciousness Explained）被一些哲學家戲稱應該叫《意識的否認》（Consciousness Denied）。

戴維·多伊奇傾向後者的批評：

單純否認感質的存在是壞解釋——任何事物都能用此方法否認
任何真正的感質解釋都必須回應丹尼特的批判，但也必須給出好解釋

創造力、意識、自由意志、意義、感質——這幾個東西似乎是在人類身上「一次普適性躍進」中共同出現的。
沒有什麼有力論證能說它們屬於不同層級或能各自獨立達成。

易混淆的「智慧」#

某些被視為智慧表現的能力，其實與圖靈意義下的智慧無關：

鏡中自我辨識（簡單的模式識別程式就能做到）
工具使用
用語言做訊號（非對話意義）
各種情緒反應（但不包含其感質）

戴維·多伊奇提出的判準：

若一件事已能被程式化，它與圖靈意義下的智慧無關。
若無法把它程式化，就是還沒理解它。

這是判斷各種「我已解釋意識/創造力」主張的簡單試金石。

名詞與要點#

本章核心詞彙
感質（Quale; 複數 Qualia）：感覺的主觀面向
行為主義（Behaviourism）：心理學版的工具主義——主張科學只能（或只該）測量與預測「刺激—行為」之間的關係

小結#

通用人工智慧（AGI）數十年來毫無進展，因為核心是個未解的哲學問題：我們不理解創造力如何運作
一旦我們理解了，程式化它將不是難事
同樣，「人工演化」可能也尚未真正實現——因為我們不理解 DNA 複製系統所躍進到的那種普適性
chatbot 與圖靈測試走進了死胡同：它們建立在「以更巧妙的技巧偽裝就能變成 AI」之上，但非 AI 終究不能偽裝成 AI