圖靈與圖靈測試#
圖靈(Alan Turing)1936 年奠定了古典計算理論,二戰期間參與建造首批通用古典電腦。他理解到:通用電腦既然是通用模擬器,原則上人工智慧(AI)必然可能——這比巴貝奇與洛芙萊斯前進了一大步。
1950 年論文〈Computing Machinery and Intelligence〉提出圖靈測試(Turing test):
- 機器與真人各透過純文字介面(如電傳打字機)與一位人類裁判對話
- 若裁判無法區分哪一邊是機器,就算通過
- 透過此設計避免外觀干擾,只測試思考能力
Eliza 與 chatbot 的虛幻成功#
1964 年溫森鮑姆(Joseph Weizenbaum)寫了 Eliza——模仿心理治療師的程式:
- 掃描輸入找關鍵字與文法
- 套用模板回應,如「我恨我的工作」 → 「你最恨工作的哪部分?」
- 若失敗則隨機選用反問句
許多使用者被它騙倒——即使被告知它不是真的 AI,仍會繼續對它傾訴。溫森鮑姆寫書《Computer Power and Human Reason》警告擬人化的危險。
侯世達被惡作劇#
1983 年研究生跟侯世達(Douglas Hofstadter)開了個玩笑,假裝有政府 AI 程式,讓他做圖靈測試。實際上是學生親自扮演 Eliza。對話中有:
- 問:什麼是耳朵?
- 答:耳朵是動物身上的聽覺器官。
這顯然超出 Eliza 的能力,但侯世達仍接受——只有當學生開始玩針對性的玩笑時才露餡。
侯世達事後反省:「我願意接受多麼大量的『流暢性』,竟把這些當作 1980 年代藉雕蟲小技湊起來就能達成的程度。」
事實是:Eliza 之後幾十年的 chatbot 本質上沒有更接近真正的思考。
Loebner 獎與 Elbot#
1990 年勒布納(Hugh Loebner)設立獎項,獎勵接近通過圖靈測試的程式。2008 年的優勝者 Elbot 對話片段:
- 裁判:「你了解圖靈測試的意義嗎?」
- Elbot:「有些人自己都通不過圖靈測試。為什麼要逼電腦做?」(顯然是觸發關鍵字「Turing test」的固定回應)
- 裁判:「I spose it is a little harsh」(其中
spose是suppose的口語縮寫) - Elbot:「如果我們機器人結婚,會是永恆的:『直到鐵鏽分開我們』。」(誤把
spose識別為spouse)
圖靈論文發表 58 年來,「能思考的機器」的進展:零。
其他計算機科學技術突飛猛進,唯 AI 例外。
關鍵問題:解釋#
圖靈論文預測 2000 年「將能談論機器思考而不會被反駁」。圖靈估計只需約 100 MB 記憶體與當時電腦的速度。如今我的筆電有數千倍記憶體、百萬倍速度,卻一樣不能思考。
AI 的瓶頸不在硬體,而在於我們沒有解釋創造力是如何運作的。
創造力是「實際解決問題的方案在尚無解釋時被發現」的罕見例外狀況——這種事很少見。
圖靈測試的根本缺陷#
戴維·多伊奇(David Deutsch)指出,圖靈測試是經驗主義錯誤的延伸——尋求純行為的判準,要求裁判在沒有「候選 AI 應如何運作的解釋」下做判斷。
圖靈測試的邏輯與培里(William Paley)走過荒原時所做的判斷類似:要解釋觀察到的特徵是如何來的——
- 若 AI 的言談中知識來自設計者,就不是 AI
- 若知識來自程式本身,才是真正的 AI
同樣的話可以是兩種不同證據#
Elbot 開的婚姻笑話:
- 若是程式作者預先寫好的固定笑話,這是「不會思考」的證據
- 若程式從未編入此笑話,而是它自己即興產出,這就是「會思考」的證據
同樣的輸出,是否為 AI 的證據,取決於對「程式如何運作」之最佳解釋。
因此原則上,若程式作者能對「為何此程式會生成這些輸出」給出好的、難以變動的解釋——我們在尚未看到任何輸出前就能判定它是 AI。
這也表示,只要有人寫出真 AI 的程式,根本不需要圖靈測試。
與普適性連結:AI 必然是「人」#
AI 的能力必須具有某種普適性——專用思考不算思考。
戴維·多伊奇的猜想:每個 AI 都是「人」——即通用解釋者。
AI 的實現會以「普適性的躍進」方式發生,而非透過 chatbot 技巧逐步逼近。
擬真度、欺騙能力的提升並不等於思考能力的提升——更會說謊的 chatbot 距離 AI 一點也不更近。
行為主義(Behaviourism)#
把心理學限縮為「刺激—反應」的科學,是工具主義在心理學上的版本——正是這種觀念誤導了 chatbot 路線。非 AI 程式無論多會偽裝,永遠不能假裝成 AI。
人工演化(Artificial Evolution)的類似錯誤#
設想研究機器人步行:
- 靈感(inspiration)階段:設計腿部、感應器、整體結構,並設計一套「子程式語言」——用以表達各種步態指令
- 汗水(perspiration)階段:可用「演化演算法」隨機變異子程式組合、保留表現好的版本
看起來是「演化」,但戴維·多伊奇懷疑:真正創造知識的並非演化,而是程式設計者。
- 設計者花數月設計子程式語言時,已把幾何學、力學等大量背景知識編碼進去
- 「演化」其實只是在這個被精心設計的小空間中組合
- 這對應到拉馬克主義對演化的誤解——以為新適應由既有知識的變動產生,而非真正新知識的創造
一個更乾淨的實驗#
若要證明真有人工演化,應該:
- 用已有實用功能的機器人(非為演化而設計)
- 直接以隨機數字替換整個微處理器中的程式
- 用該處理器自然會出現的位元錯誤作為突變
- 若這樣的機器人能逐步「演化」出更好的步行——那才是真正的演化
一個關鍵點:在生物圈中,遺傳密碼本身也曾與適應一同演化;唯有當遺傳密碼穩定為某種普適性後,盲目隨機變異基因才足以產生豐富的生物圈。
我們連那次「躍進」是什麼樣的普適性都還不知,又怎能期望沒有它的人工演化能成功?
感質(Qualia)與意識#
感質(qualia, 單數 quale):感覺的主觀面向。藍色看起來像什麼、痛覺的具體感受,都是感質。
思想實驗:
- 你天生缺乏視網膜藍色受器,因此看不見藍色,把藍色看成黃綠等混合
- 治癒後第一次看到藍色——你能預測自己會把它叫做「藍」,但無人能預測「藍色看起來是什麼樣子」
感質目前無法描述也無法預測。
這是個值得驚嘆的科學謎題;對科學世界觀來說,這是個尚未解決的根本問題。
丹尼特(Daniel Dennett)的化約立場#
丹尼特主張感質不存在——我們的內省是錯誤記憶。其代表作《意識的解釋》(Consciousness Explained)被一些哲學家戲稱應該叫《意識的否認》(Consciousness Denied)。
戴維·多伊奇傾向後者的批評:
- 單純否認感質的存在是壞解釋——任何事物都能用此方法否認
- 任何真正的感質解釋都必須回應丹尼特的批判,但也必須給出好解釋
創造力、意識、自由意志、意義、感質——這幾個東西似乎是在人類身上「一次普適性躍進」中共同出現的。
沒有什麼有力論證能說它們屬於不同層級或能各自獨立達成。
易混淆的「智慧」#
某些被視為智慧表現的能力,其實與圖靈意義下的智慧無關:
- 鏡中自我辨識(簡單的模式識別程式就能做到)
- 工具使用
- 用語言做訊號(非對話意義)
- 各種情緒反應(但不包含其感質)
戴維·多伊奇提出的判準:
若一件事已能被程式化,它與圖靈意義下的智慧無關。
若無法把它程式化,就是還沒理解它。
這是判斷各種「我已解釋意識/創造力」主張的簡單試金石。
名詞與要點#
本章核心詞彙
- 感質(Quale; 複數 Qualia):感覺的主觀面向
- 行為主義(Behaviourism):心理學版的工具主義——主張科學只能(或只該)測量與預測「刺激—行為」之間的關係
小結#
- 通用人工智慧(AGI)數十年來毫無進展,因為核心是個未解的哲學問題:我們不理解創造力如何運作
- 一旦我們理解了,程式化它將不是難事
- 同樣,「人工演化」可能也尚未真正實現——因為我們不理解 DNA 複製系統所躍進到的那種普適性
- chatbot 與圖靈測試走進了死胡同:它們建立在「以更巧妙的技巧偽裝就能變成 AI」之上,但非 AI 終究不能偽裝成 AI