信任:民主最重要的貨幣#

我們對政府、對社會制度、對彼此的信任,正處於歷史新低。信任是任何社會最重要的貨幣;對同胞集體智慧的信任,是民主的地基。

AI 在三個維度上同時對民主造成威脅:

  • 信任:深偽(deepfake)與大規模假訊息將動搖選舉與公共討論。
  • 安全與隱私:詐騙與駭客變得更容易,政府的無能會進一步侵蝕對民主的信心。
  • 自由與平等:AI 可能讓系統性歧視固化,並用偽客觀的外衣掩飾偏見——這是最隱蔽、最少被討論的危險。

三者交織會讓本就病重的資訊生態系陷入末期:當沒人知道該相信什麼,人們便退縮到熟人圈、變得犬儒、自私、偏執與虛無,社群感被瓦解,最終引發無人能修補的危機。

如果你付得起,請享用人類#

一個潛在災難性的階級分化正在 AI 時代成形:

  • 付得起的人:擁有真人銀行專員、旅行顧問、家教、私人助理。
  • 付不起的人:只能與 chatbot、App 對話。

幾個正在發生的對照:

  • 富人有專屬旅行顧問可面談;其他人只能在手機 App 上自助。
  • 富人有真人客服與隨叫隨到的家教;其他人在客服機器人或菲律賓客服中心無止境等候。
  • 第 4 章已說明:白領菁英將被 AI Copilot 強化、保有自主;藍領與服務業勞工卻被「賽博格化」,每個工時都被嚴苛的 AI 主管支配。

人的能動性將成為奢侈品」。在民主裡,這種日常經驗的階級差距特別腐蝕:被分到 AI 那邊的人會更怨懟、更不信任菁英;社會被切成「分而不平等」的兩個世界。

不平等的正義#

AI 在執法上的應用,是「偏見被偽客觀掩飾」最危險的場域之一。

風險評估與假釋#

  • 廣泛販售給法官與假釋委員會的「風險評分(risk-based)」演算法被發現:對犯下類似罪行的人,白人較常獲提前釋放、黑人較常被高估再犯率
  • 犯罪熱點」預測工具讓黑人與少數族裔社區出現不成比例的逮捕,因為訓練資料多源自過去帶系統性偏見的執法行為(如 stop-and-frisk)。
  • 「我們一開始就用了壞資料,再用工具讓它變得更糟。」——研究演算法偏見的 Katy Washington(CU Boulder)。

人臉辨識#

  • 多數系統對深膚色、特別是黑人女性的準確度較差。
  • Clearview 透過爬取社群網站建立資料庫,被多州指違反條款與州法(如伊利諾州);但仍被各地警局廣泛採用,缺乏獨立驗證。

政策方向#

歐盟 AI Act 已禁止執法機關使用即時人臉辨識,並把所有執法用 AI 列為「高風險」,須通過嚴格的偏見評估與緩解程序。

真要做對:必須把「平等」與「預測準確度」共同設為目標——這代表系統會主動「降權」對有色族群的某些犯罪預測。雖會挑戰純色盲式正義的直覺,但這是修正歷史偏見唯一可行的方式。

也有支持 AI 的證據:ACLU 對紐澤西 2017 年導入的 risk-assessment 工具的研究,顯示能讓未審判被羈押人數減少 20%——但前提是設計與導入都做對。

肯塔基的研究則發現工具設計沒問題,是法官對分數的解讀不一致。

Eliza 創造者 Weizenbaum 的提醒值得重申:即使 AI 真的更客觀,也應該禁止它做影響個人自由的決定。對人生影響如此重大的判決,應由「知道何謂活著」的人做出。

我只是照演算法執行」不應成為新的「我只是奉命行事」。

不平等的機會:金融與醫療#

醫療#

  • 2019 年里程碑研究:一個被用於評估超過 1 億美國人健康需求的 AI 風險評估工具,對黑人病患帶有偏見——同樣風險分數下,黑人病情比白人嚴重得多。
  • 若公平,獲得加碼照護的黑人比例本該從 18% 升至 47%。
  • 黑人佔美國臨床試驗受試者不到 5%;醫師長年因錯誤的種族痛覺差異信念而對少數族裔疼痛治療不足。
  • 但反過來,若 AI 被刻意設計來修正歷史偏見,也能成為糾偏的有力工具。

金融#

  • 美國放貸需避免「差別衝擊(disparate impact)」原則。但 AI 可用看似中立的代理變數——
    • 一份歐洲研究發現,5 個資料點比 credit score 更能預測還款:裝置品牌(Mac vs PC)、裝置類型(手機/平板/PC)、申請時段、Email 網域(Gmail vs Hotmail)、Email 是否含部分姓名。
    • 但每一項都與受保護階級高度相關(白人較常用 Mac),這些代理可能違反美國放貸法。
  • 法律設下「若移除某資料點會降低準確度即可豁免」這個漏洞,太容易被業者操弄。

反向使用 AI 可以擴大金融可及性:美國最大型信用合作社之一 VyStar Credit Union 採用新創 Zest AI 的 AI 信用評分後,信用卡核准率提升超過 20%(少數族裔與弱勢族群提升尤其明顯),且違約率不變。「這代表多了上千人本來連信用卡都拿不到。」

偏見的放大器#

生成式 AI 不只重現偏見,更可能放大偏見。

  • Apple 與 Swarthmore 研究:給 LLM「醫師打給護士因為她遲到」這類含模糊代名詞的句子,LLM 把「她」指向「護士」的機率是「醫師」的 7 倍;男性代名詞被指向傳統男性職業的機率為 3.8 倍——性別偏見被擴大
  • 第 8 章提過:Midjourney 被要求畫「一名黑人非洲醫師照顧白人受苦兒童」99% 的時候反向產出(白人醫師照顧黑人孩子)。
  • 文字生圖也傾向把高薪職業畫成男性、淺膚色,低薪則相反。

解法:精細策展訓練資料、刻意過取樣稀少例子、使用合成資料補洞。但科技公司目前並未刻意這麼做。

政策方向:

  • 歐盟 AI Act 風險分級可能成為事實全球標準(凡有歐洲客戶或員工皆適用)。
  • 美國應強制基礎模型的偏見測試;FTC 可主導通用 AI 系統執法,醫院 AI(第 9 章)由 FDA 等機構負責;金融與保險偏見則由 Fed、SEC、各州保險主管監督。
  • 有時最佳做法是「不急著用 LLM」——較小的 AI 模型較易分析與控制。

詐騙與駭客的盛宴#

AI 是繼網際網路後給詐騙者最大的禮物。

不再有破綻的詐騙#

  • 過去英文文法錯誤是「奈及利亞詐騙」的破綻;現在非英語母語者也能用 LLM 寫出近乎完美的釣魚信。
  • 「姪子哭著打電話說被綁架」——可能是用聲音複製 AI 偽造的;甚至有犯罪集團讓「女兒」在電話中哀號、被刀劃傷以增加恐慌付贖。
  • 即時換臉的 deepfake 也讓 Zoom 上的「執行長」可能不是本人——已有公司被詐騙 2500 萬美元

LLM 與駭客攻擊#

  • Check Point 證明 ChatGPT 能協助駭客完成所有攻擊環節:寫釣魚信、寫可執行 malware、把 malware 嵌入郵件附件。
  • 微軟與 OpenAI 在 2024 年初表示,已偵測並關閉與俄、中、伊朗、北韓駭客相關的 ChatGPT 帳號。
  • 暗網上出現 FraudGPT、WormGPT 等專門訓練於釣魚與惡意軟體的 LLM。
  • LLM 也可被用於分析目標系統程式碼、自動找漏洞。

AI 對抗 AI#

雖然 AI 賦能攻擊者,但長期而言對防守者更有利

  • 資安團隊可同樣自動掃漏洞,並用 chatbot 進行「紅隊(red team)」測試。
  • AI 助手能填補資安人才缺口(Google 已訓練資安專版 PaLM 2;Darktrace、Palo Alto Networks 提供 AI 即時偵測與緩解)。
  • 防守者擁有對自家網路與程式碼的優勢:「生成式 AI 對攻擊方是戰術優勢,但對防守方是戰略優勢」(Check Point Maya Horowitz)。

但生成式 AI 開了新的攻擊面

  • Prompt injection:以特定文字或影像提示誘騙 chatbot 違反規則回答。已發生 chatbot 洩漏敏感資料的案例。
  • 開源 LLM 風險更高:研究者證實,攻擊者拿到模型權重後,可以自動產生繞過所有護欄的 prompt(看似亂碼字串),目前無人知如何徹底防禦。
  • 資料毒害(data poisoning):在訓練資料中悄悄植入毒例。研究者已能用少數例子讓軟體把烏龜誤判為步槍——這對軍用無人機影像分類 AI 是巨大威脅。網路爬取式訓練讓「藏毒於明處」變得可行。

拜登政府已發起紅隊演習以測試最強通用 AI 模型;聯邦政府也在制定 AI 安全規範。

SEC 主席 Gary Gensler 警告:若不立即行動防範金融市場的 AI 漏洞,未來十年內金融災難幾乎不可避免

醫療資料若被竊或操控,後果同樣災難——但比直接資產損失更嚴重的是:民眾對政府保護能力的信心崩塌

謊言的水柱#

從 GAN 到 Midjourney#

  • 2017 年首批未經同意的名人 deepfake 色情影片出現於 Reddit,使用「生成對抗網路(GAN)」技術,需要大量影音資料。
  • 同年 University of Washington 研究員用 14 小時 Obama 影音做出可信的 deepfake 影片,警示風險。
  • 如今:
    • Midjourney 一秒就能由文字生出可信的名人 deepfake 圖(川普被警察扭打、教宗穿白色羽絨衣等病毒圖即此類產出,皆非刻意造假者)。
    • Runway 由文字生影片並能換臉。
    • ElevenLabs 只要幾秒音訊就能複製任何人的聲音。

政治化的合理化#

  • 2020 年印度 Delhi 市長候選人公開用 deepfake 假裝會說某印地語方言以爭取選票。
  • 2023 年美國共和黨在 Biden 宣布連任後立刻釋出 deepfake 攻擊廣告,描繪「假設 Biden 連任後的末日美國」。

「迦納門」情境模擬#

想像 2024 年大選前數週:一段現任民主黨總統與億萬富翁密會、收賄並安排武器轉售迦納的「錄音」在右翼社群媒體爆紅。記者證實確實有那場會面、富翁也確實後來捐款,但音檔本身無從驗證。否認也壓不下去——共和黨稱之為「Ghanagate」、要求國會調查;主流媒體被迫跟進報導。總統在搖擺州民調下滑。

deepfake 音檔有沒有翻轉了選舉?這是當前 AI 與政治環境下完全可能發生的劇本。

實例已出現:

  • 2023 年芝加哥市長選舉前夕,X 上出現候選人 Paul Vallas 對警察不當行為發表煽動言論的偽造音檔,雖被快速揭穿,仍被數千人轉傳。
  • 斯洛伐克 2023 年國會大選:deepfake 音檔可能首次在西方民主國家影響全國選舉結果。

火柱戰術(Firehose of Falsehood)#

RAND Corporation 將俄羅斯的策略命名為「謊言的水柱(firehose of falsehood)」:以海量謊言與半真半假淹沒受眾,不在乎被相信,只在乎讓人混亂、摧毀對體制的信任。

AI 又進一步啟動了「騙子紅利(liar’s dividend)」——在大量假內容流通的環境,政客可以更輕易把真實的指控否定為「假新聞」。

數位浮水印與其極限#

自願承諾與各國立場#

  • 部分公司自願在 AI 圖片加上數位浮水印
    • 三星 Galaxy 智慧型手機在 AI 編輯後加可見浮水印與 metadata 標記。
    • 美國目前未立法強制;歐盟 AI Act 要求對 AI 內容透明(事實上會走向浮水印);中國已強制標記。

浮水印不是萬靈丹:

  • 只能管商用 AI;國家級惡意行為者可自製模型或剝離浮水印。
  • 研究顯示,文字與圖像的浮水印都可被適當提示或微調繞過。
  • 三星浮水印推出沒幾天就被使用者用同一套 AI 工具去掉。

反向認證:Content Credentials#

Adobe、微軟、Leica 等推「Content Credentials」metadata:認證影像為合法並標記任何數位修改。但這需要使用者主動採用、且要全球普及可能要許多年;既有未經認證的合法圖片也仍是漏洞。

立法方向#

  • 法國 2018 年通過法律,賦予政府移除假訊息與選前透明披露贊助廣告的權力。
  • 歐盟《數位服務法(DSA)》要求社群平台強化對假訊息、恐怖宣傳、仇恨言論的處置(同時平衡言論自由)。
  • 在美國,全面禁止假訊息可能違反第一修正案,但仍可從改革 1996 年《通訊禮儀法》第 230 條著手——它把平台對使用者內容的責任豁免,被許多人視為打開了訊息洪流的閘門。
  • 美國也應全面禁止政治選舉使用 AI 生成內容

草根偽造的肥料:Astroturfing#

deepfake 受到最多注目,但 AI 也會強化「人造草根(astroturf)」運動——企業遊說團體假裝成草根支持。

  • 2017 年 FCC 「網路中立性」公開意見階段,被注入超過 800 萬筆支持取消管制的留言;當時失敗是因為 90% 留言一字不差,容易被察覺。
  • 今日的 LLM 能為每一封留言改寫不同句式,看起來都像不同個人寫的,且尚無工具能自動辨別。

Speech by Crowd 的願景與風險#

  • IBM 研究員 Noam Slonim 開發 Speech by Crowd(2018 年公開),能分析數千篇人寫評論的支持/反對立場與摘要。
  • 願景:未來政府可用它取代日益不準的民調,更細膩地理解民意。
  • 但前提是評論的真實性可被擔保——AI 能輕易偽造留言意味著這個願景需要強化的反機器人防線(CAPTCHA、雙因素驗證),社群平台也應加強假帳號清掃。

結語:把 AI 拉回更高尚的軌道#

在合適政策下,AI 可以強化民主與信任;但在現狀路徑下,它將:

  • 進一步打擊已經破爛的資訊生態。
  • 削弱社群感與民主程序。
  • 把菁英與大眾的鴻溝撕得更開,挑戰民主政府所依賴的公平與機會平等預期。

我們必須做好心理準備,並採取一切可能的手段,把 AI 的發展導向更開明、更高尚的方向。