Self Awareness In The Age Of Machines • 認識你自己：自我意識的科學

當機器接手，自我意識去了哪裡#

2009 年 6 月，一架法國航空 Airbus A330 從里約飛往巴黎，在大西洋上空墜毀。當夜雲層中的冰造成感測器失靈，自動駕駛斷開，副駕駛接手後因不熟練的操作讓飛機失速。

諷刺的是：飛機愈先進，駕駛員愈少有機會親手操作；當需要他們接手時，許多基本技能已經生疏。自動化的代價，往往是人類自我意識的退場。

蘇格拉底在《費德羅篇》中借由古埃及王 Thamus 對「文字」這項新發明的擔憂，提醒我們類似的風險：「人們將顯得無所不知，實際上一無所知；他們將擁有智慧的形式，而沒有智慧的實質。」

文字最終並未帶來這樣的災難。但 AI 與機器學習可能不同——因為它們不像書本那樣透明。

AI 的不透明性#

過往的工具雖會擴增能力，但都是透明系統：印刷版每次印出同樣的書、按 Enter 鍵就換行、計算機按 2+2 永遠等於 4。

機器學習系統不一樣：

它們在某種意義上「有自己的心智」——但這個心智無法解釋自己
為何拒絕貸款申請？演算法本身往往說不清楚
為何會在某些罕見情境中誤判？訓練者也未必能事先預知
它們的能力遠超人類，但它們的自我覺察幾近於零

AI 的智慧能力與自我意識能力正在分道揚鑣。我們可能進入一個機器愈來愈聰明、卻愈來愈無法說明自己的世界——而我們則愈來愈被迫盲目信任它們。

兩種未來：兩條路徑#

作者提出兩條因應路徑：

路徑 A：把自我意識設計進機器——讓 AI 自身具備某種後設認知
路徑 B：讓機器保持「聰明但不自我覺察」，但人機介面設計成能放大人類的自我意識，讓人類能精確監督機器

兩者都有根據，也各有風險。

為說明這些概念，書中以一台名為 Val 的玩具車為例——前方裝攝影機與兩盞顏色不同的燈，作為討論機器知覺與後設認知的縮影。

Val：書中用以討論機器自我意識的玩具車示意。© Stephen M. Fleming

路徑 A：能反思的機器#

要為機器加入後設認知，可以從追蹤不確定性開始：

Dropout 技術：跑多份略為不同架構的網絡，預測的分歧度即代表不確定性
自駕車或無人機可以根據這個訊號主動避開信心低的決策
一個訓練成功的「自省無人機」（introspective drone）能在密林中即時判斷某個動作會不會撞機而放棄

這還只是初步。更進階的後設認知，需要對自己「為何」不確定有一個解釋——例如：「光線改變了？」「遇到沒見過的物體？」這已朝著「自我敘事」逼近。

哲學家 Andy Clark 與心理學家 Annette Karmiloff-Smith 在 1993 年就指出：

神經網絡的知識「在」系統中（in the system），而非「為」系統而存在（for the system）。
它能解問題，但不知道自己是怎麼解的
知識儲存於權重之中，無法被另一個系統讀取或被擁有者言說
必須加入「表徵的再描述」（representational redescription）——把學到的知識抽象化，才能進一步反思與分享

科學界已開始建構帶有「後設認知層」的網絡：

Yeung、Cohen、Botvinick（2004）的研究：在 Stroop 任務上加一個簡單的「衝突偵測」單元，就能模擬人類錯誤偵測的諸多現象
Cleeremans 團隊：訓練第二層網絡監控第一層的輸入輸出，並能成功模擬盲視——切斷兩層的連結即可重現患者的行為模式

自我意識作為通用模型#

人類後設認知的一大優勢是抽象與遷移：

我對「自己」的認識，跨越所有情境通用
我相信自己擅長語言、不擅長運動——這個信念能引導我做出更好的選擇
在陌生城市使用地鐵時，我能用過去的「地鐵抽象模型」快速適應

機器若能內建這類「自我抽象」，就能：

知道自己擅長什麼、不擅長什麼
在陌生情境中保留必要的不確定性
不過度自信，也不過度保守

想像一個未來：自駕車根據自己的信心水準發出不同顏色的光——藍色代表「我很有把握」，黃色代表「我不太確定」。
兩台 AI 車相遇於路口時，能據此互相讓行
人類乘客也能據此判斷何時該介入
機器與機器、人與機器之間的「集體後設認知」由此誕生

路徑 B：與機器共腦#

第二條路是把人類的後設認知與機器的能力緊密耦合。

腦機介面（Brain-Computer Interface, BCI）的進展令人驚奇：

1980 年代起，研究者已能解碼運動皮質的訊號預測手部方向
四肢癱瘓的 Matt Nagle 在 2002 年透過植入裝置，靠思考移動電腦游標、轉換電視頻道
馬斯克（Elon Musk）的 Neuralink 等公司正積極開發精細植入技術
非侵入性的 EEG 結合機器學習，也可達到相似效果

多數現有 BCI 研究專注於「用大腦控制裝置」。但同樣的原理可以反過來——讓大腦監控自動裝置。
我們不需要懂引擎內部如何運作，就能在開車時感覺「不對勁」並停下；同樣地，未來機器可以由我們的後設認知監控，無需我們閱讀「使用說明書」即能即時介入。

兩種選擇背後的價值問題#

我們想活在哪一種世界？

選擇路徑 A：自我意識的機器將擁有某種道德地位——它們能犯錯、能知錯，這引發新的責任歸屬問題
選擇路徑 B：保留人類為「最後解釋者」——機器再聰明，也由人類負責賦予敘事與意義

「可解釋 AI」（Explainable AI）的常見方案是把機器內部「畫出來」給使用者看。但這就像給你一張 fMRI 腦造影圖，要你解釋自己為何選了某個三明治——那不是法律或社會意義上的解釋。
真正有意義的「為什麼」，需要後設認知層級的敘事——而這目前只有人腦能做。

結語：知己 + 知機#

歷史學家 Yuval Noah Harari 說：「我們投入到提升人工智慧的每一塊錢與每一分鐘，也應該等量投入到提升人類意識上。」
自我意識的科學提醒我們：在追求機器更聰明的同時，必須讓人類更清楚自己——以及更清楚自己與機器之間的關係。

未來的世界，可能不只是「認識你自己」（know thyself），而是同時要**「認識你的機器」**（know thy machine）。

下一章，我們將回到一個古老問題：認識自己這件事，能不能透過訓練變得更好？

當機器接手，自我意識去了哪裡#

AI 的不透明性#

兩種未來：兩條路徑#

Val：書中用以討論機器自我意識的玩具車示意。© Stephen M. Fleming

路徑 A：能反思的機器#

人工神經網絡的多層結構示意。圖：Glosser.ca，CC-BY-SA-3.0

自我意識作為通用模型#

路徑 B：與機器共腦#

兩種選擇背後的價值問題#

結語：知己 + 知機#