信任炸彈 • AI來了，你還不開始準備嗎？

信任：民主最重要的貨幣#

我們對政府、對社會制度、對彼此的信任，正處於歷史新低。信任是任何社會最重要的貨幣；對同胞集體智慧的信任，是民主的地基。

AI 在三個維度上同時對民主造成威脅：

信任：深偽（deepfake）與大規模假訊息將動搖選舉與公共討論。
安全與隱私：詐騙與駭客變得更容易，政府的無能會進一步侵蝕對民主的信心。
自由與平等：AI 可能讓系統性歧視固化，並用偽客觀的外衣掩飾偏見——這是最隱蔽、最少被討論的危險。

三者交織會讓本就病重的資訊生態系陷入末期：當沒人知道該相信什麼，人們便退縮到熟人圈、變得犬儒、自私、偏執與虛無，社群感被瓦解，最終引發無人能修補的危機。

如果你付得起，請享用人類#

一個潛在災難性的階級分化正在 AI 時代成形：
付得起的人：擁有真人銀行專員、旅行顧問、家教、私人助理。
付不起的人：只能與 chatbot、App 對話。

幾個正在發生的對照：

富人有專屬旅行顧問可面談；其他人只能在手機 App 上自助。
富人有真人客服與隨叫隨到的家教；其他人在客服機器人或菲律賓客服中心無止境等候。
第 4 章已說明：白領菁英將被 AI Copilot 強化、保有自主；藍領與服務業勞工卻被「賽博格化」，每個工時都被嚴苛的 AI 主管支配。

「人的能動性將成為奢侈品」。在民主裡，這種日常經驗的階級差距特別腐蝕：被分到 AI 那邊的人會更怨懟、更不信任菁英；社會被切成「分而不平等」的兩個世界。

不平等的正義#

AI 在執法上的應用，是「偏見被偽客觀掩飾」最危險的場域之一。

風險評估與假釋#

廣泛販售給法官與假釋委員會的「風險評分（risk-based）」演算法被發現：對犯下類似罪行的人，白人較常獲提前釋放、黑人較常被高估再犯率。
「犯罪熱點」預測工具讓黑人與少數族裔社區出現不成比例的逮捕，因為訓練資料多源自過去帶系統性偏見的執法行為（如 stop-and-frisk）。
「我們一開始就用了壞資料，再用工具讓它變得更糟。」——研究演算法偏見的 Katy Washington（CU Boulder）。

人臉辨識#

多數系統對深膚色、特別是黑人女性的準確度較差。
Clearview 透過爬取社群網站建立資料庫，被多州指違反條款與州法（如伊利諾州）；但仍被各地警局廣泛採用，缺乏獨立驗證。

政策方向#

歐盟 AI Act 已禁止執法機關使用即時人臉辨識，並把所有執法用 AI 列為「高風險」，須通過嚴格的偏見評估與緩解程序。
真要做對：必須把「平等」與「預測準確度」共同設為目標——這代表系統會主動「降權」對有色族群的某些犯罪預測。雖會挑戰純色盲式正義的直覺，但這是修正歷史偏見唯一可行的方式。

也有支持 AI 的證據：ACLU 對紐澤西 2017 年導入的 risk-assessment 工具的研究，顯示能讓未審判被羈押人數減少 20%——但前提是設計與導入都做對。
肯塔基的研究則發現工具設計沒問題，是法官對分數的解讀不一致。

Eliza 創造者 Weizenbaum 的提醒值得重申：即使 AI 真的更客觀，也應該禁止它做影響個人自由的決定。對人生影響如此重大的判決，應由「知道何謂活著」的人做出。
「我只是照演算法執行」不應成為新的「我只是奉命行事」。

不平等的機會：金融與醫療#

醫療#

2019 年里程碑研究：一個被用於評估超過 1 億美國人健康需求的 AI 風險評估工具，對黑人病患帶有偏見——同樣風險分數下，黑人病情比白人嚴重得多。
若公平，獲得加碼照護的黑人比例本該從 18% 升至 47%。
黑人佔美國臨床試驗受試者不到 5%；醫師長年因錯誤的種族痛覺差異信念而對少數族裔疼痛治療不足。
但反過來，若 AI 被刻意設計來修正歷史偏見，也能成為糾偏的有力工具。

金融#

美國放貸需避免「差別衝擊（disparate impact）」原則。但 AI 可用看似中立的代理變數——
- 一份歐洲研究發現，5 個資料點比 credit score 更能預測還款：裝置品牌（Mac vs PC）、裝置類型（手機/平板/PC）、申請時段、Email 網域（Gmail vs Hotmail）、Email 是否含部分姓名。
- 但每一項都與受保護階級高度相關（白人較常用 Mac），這些代理可能違反美國放貸法。
法律設下「若移除某資料點會降低準確度即可豁免」這個漏洞，太容易被業者操弄。

反向使用 AI 可以擴大金融可及性：美國最大型信用合作社之一 VyStar Credit Union 採用新創 Zest AI 的 AI 信用評分後，信用卡核准率提升超過 20%（少數族裔與弱勢族群提升尤其明顯），且違約率不變。「這代表多了上千人本來連信用卡都拿不到。」

偏見的放大器#

生成式 AI 不只重現偏見，更可能放大偏見。

Apple 與 Swarthmore 研究：給 LLM「醫師打給護士因為她遲到」這類含模糊代名詞的句子，LLM 把「她」指向「護士」的機率是「醫師」的 7 倍；男性代名詞被指向傳統男性職業的機率為 3.8 倍——性別偏見被擴大。
第 8 章提過：Midjourney 被要求畫「一名黑人非洲醫師照顧白人受苦兒童」99% 的時候反向產出（白人醫師照顧黑人孩子）。
文字生圖也傾向把高薪職業畫成男性、淺膚色，低薪則相反。

解法：精細策展訓練資料、刻意過取樣稀少例子、使用合成資料補洞。但科技公司目前並未刻意這麼做。
政策方向：
歐盟 AI Act 風險分級可能成為事實全球標準（凡有歐洲客戶或員工皆適用）。
美國應強制基礎模型的偏見測試；FTC 可主導通用 AI 系統執法，醫院 AI（第 9 章）由 FDA 等機構負責；金融與保險偏見則由 Fed、SEC、各州保險主管監督。
有時最佳做法是「不急著用 LLM」——較小的 AI 模型較易分析與控制。

詐騙與駭客的盛宴#

AI 是繼網際網路後給詐騙者最大的禮物。

不再有破綻的詐騙#

過去英文文法錯誤是「奈及利亞詐騙」的破綻；現在非英語母語者也能用 LLM 寫出近乎完美的釣魚信。
「姪子哭著打電話說被綁架」——可能是用聲音複製 AI 偽造的；甚至有犯罪集團讓「女兒」在電話中哀號、被刀劃傷以增加恐慌付贖。
即時換臉的 deepfake 也讓 Zoom 上的「執行長」可能不是本人——已有公司被詐騙 2500 萬美元。

LLM 與駭客攻擊#

Check Point 證明 ChatGPT 能協助駭客完成所有攻擊環節：寫釣魚信、寫可執行 malware、把 malware 嵌入郵件附件。
微軟與 OpenAI 在 2024 年初表示，已偵測並關閉與俄、中、伊朗、北韓駭客相關的 ChatGPT 帳號。
暗網上出現 FraudGPT、WormGPT 等專門訓練於釣魚與惡意軟體的 LLM。
LLM 也可被用於分析目標系統程式碼、自動找漏洞。

AI 對抗 AI#

雖然 AI 賦能攻擊者，但長期而言對防守者更有利：

資安團隊可同樣自動掃漏洞，並用 chatbot 進行「紅隊（red team）」測試。
AI 助手能填補資安人才缺口（Google 已訓練資安專版 PaLM 2；Darktrace、Palo Alto Networks 提供 AI 即時偵測與緩解）。
防守者擁有對自家網路與程式碼的優勢：「生成式 AI 對攻擊方是戰術優勢，但對防守方是戰略優勢」（Check Point Maya Horowitz）。

但生成式 AI 開了新的攻擊面：

Prompt injection：以特定文字或影像提示誘騙 chatbot 違反規則回答。已發生 chatbot 洩漏敏感資料的案例。
開源 LLM 風險更高：研究者證實，攻擊者拿到模型權重後，可以自動產生繞過所有護欄的 prompt（看似亂碼字串），目前無人知如何徹底防禦。
資料毒害（data poisoning）：在訓練資料中悄悄植入毒例。研究者已能用少數例子讓軟體把烏龜誤判為步槍——這對軍用無人機影像分類 AI 是巨大威脅。網路爬取式訓練讓「藏毒於明處」變得可行。

拜登政府已發起紅隊演習以測試最強通用 AI 模型；聯邦政府也在制定 AI 安全規範。
SEC 主席 Gary Gensler 警告：若不立即行動防範金融市場的 AI 漏洞，未來十年內金融災難幾乎不可避免。
醫療資料若被竊或操控，後果同樣災難——但比直接資產損失更嚴重的是：民眾對政府保護能力的信心崩塌。

謊言的水柱#

從 GAN 到 Midjourney#

2017 年首批未經同意的名人 deepfake 色情影片出現於 Reddit，使用「生成對抗網路（GAN）」技術，需要大量影音資料。
同年 University of Washington 研究員用 14 小時 Obama 影音做出可信的 deepfake 影片，警示風險。
如今：
- Midjourney 一秒就能由文字生出可信的名人 deepfake 圖（川普被警察扭打、教宗穿白色羽絨衣等病毒圖即此類產出，皆非刻意造假者）。
- Runway 由文字生影片並能換臉。
- ElevenLabs 只要幾秒音訊就能複製任何人的聲音。

政治化的合理化#

2020 年印度 Delhi 市長候選人公開用 deepfake 假裝會說某印地語方言以爭取選票。
2023 年美國共和黨在 Biden 宣布連任後立刻釋出 deepfake 攻擊廣告，描繪「假設 Biden 連任後的末日美國」。

「迦納門」情境模擬#

想像 2024 年大選前數週：一段現任民主黨總統與億萬富翁密會、收賄並安排武器轉售迦納的「錄音」在右翼社群媒體爆紅。記者證實確實有那場會面、富翁也確實後來捐款，但音檔本身無從驗證。否認也壓不下去——共和黨稱之為「Ghanagate」、要求國會調查；主流媒體被迫跟進報導。總統在搖擺州民調下滑。
deepfake 音檔有沒有翻轉了選舉？這是當前 AI 與政治環境下完全可能發生的劇本。

實例已出現：

2023 年芝加哥市長選舉前夕，X 上出現候選人 Paul Vallas 對警察不當行為發表煽動言論的偽造音檔，雖被快速揭穿，仍被數千人轉傳。
斯洛伐克 2023 年國會大選：deepfake 音檔可能首次在西方民主國家影響全國選舉結果。

火柱戰術（Firehose of Falsehood）#

RAND Corporation 將俄羅斯的策略命名為「謊言的水柱（firehose of falsehood）」：以海量謊言與半真半假淹沒受眾，不在乎被相信，只在乎讓人混亂、摧毀對體制的信任。
AI 又進一步啟動了「騙子紅利（liar’s dividend）」——在大量假內容流通的環境，政客可以更輕易把真實的指控否定為「假新聞」。

數位浮水印與其極限#

自願承諾與各國立場#

部分公司自願在 AI 圖片加上數位浮水印：
- 三星 Galaxy 智慧型手機在 AI 編輯後加可見浮水印與 metadata 標記。
- 但美國目前未立法強制；歐盟 AI Act 要求對 AI 內容透明（事實上會走向浮水印）；中國已強制標記。

浮水印不是萬靈丹：
只能管商用 AI；國家級惡意行為者可自製模型或剝離浮水印。
研究顯示，文字與圖像的浮水印都可被適當提示或微調繞過。
三星浮水印推出沒幾天就被使用者用同一套 AI 工具去掉。

反向認證：Content Credentials#

Adobe、微軟、Leica 等推「Content Credentials」metadata：認證影像為合法並標記任何數位修改。但這需要使用者主動採用、且要全球普及可能要許多年；既有未經認證的合法圖片也仍是漏洞。

立法方向#

法國 2018 年通過法律，賦予政府移除假訊息與選前透明披露贊助廣告的權力。
歐盟《數位服務法（DSA）》要求社群平台強化對假訊息、恐怖宣傳、仇恨言論的處置（同時平衡言論自由）。
在美國，全面禁止假訊息可能違反第一修正案，但仍可從改革 1996 年《通訊禮儀法》第 230 條著手——它把平台對使用者內容的責任豁免，被許多人視為打開了訊息洪流的閘門。
美國也應全面禁止政治選舉使用 AI 生成內容。

草根偽造的肥料：Astroturfing#

deepfake 受到最多注目，但 AI 也會強化「人造草根（astroturf）」運動——企業遊說團體假裝成草根支持。

2017 年 FCC 「網路中立性」公開意見階段，被注入超過 800 萬筆支持取消管制的留言；當時失敗是因為 90% 留言一字不差，容易被察覺。
今日的 LLM 能為每一封留言改寫不同句式，看起來都像不同個人寫的，且尚無工具能自動辨別。

Speech by Crowd 的願景與風險#

IBM 研究員 Noam Slonim 開發 Speech by Crowd（2018 年公開），能分析數千篇人寫評論的支持/反對立場與摘要。
願景：未來政府可用它取代日益不準的民調，更細膩地理解民意。
但前提是評論的真實性可被擔保——AI 能輕易偽造留言意味著這個願景需要強化的反機器人防線（CAPTCHA、雙因素驗證），社群平台也應加強假帳號清掃。

結語：把 AI 拉回更高尚的軌道#

在合適政策下，AI 可以強化民主與信任；但在現狀路徑下，它將：
進一步打擊已經破爛的資訊生態。
削弱社群感與民主程序。
把菁英與大眾的鴻溝撕得更開，挑戰民主政府所依賴的公平與機會平等預期。
我們必須做好心理準備，並採取一切可能的手段，把 AI 的發展導向更開明、更高尚的方向。