資料的顯微鏡 • AI來了，你還不開始準備嗎？

AI 是科學的下一台望遠鏡與顯微鏡#

在所有 AI 的衝擊中，沒有哪一個比 AI 對科學、醫學與健康的影響更壓倒性地正向。
AI 之於科學，正如望遠鏡與顯微鏡之於人類——讓我們看見過去因為太遠或太細微而看不見的事物，這次是看見資料中過於複雜或微妙、人腦無法察覺的模式。

過去十年，新型科學儀器（基因定序、合成孔徑雷達、高能粒子加速器）讓研究者收集到空前龐大的資料量；多到不靠 AI 根本無法解析。

論文洪流也是：

PubMed 每年新增超過 100 萬篇生醫論文，平均每兩秒一篇。
各學科每年累計上千萬篇。
弔詭的是：論文越多，但重大突破的速度反而變慢。AI 成為唯一能整合、摘要、跨學科找連結的工具。

AI 將協助發現新電池材料、提升作物產量而不需毒化學品、解鎖疾病新療法；結合穿戴裝置與血液檢驗，更能讓醫療前所未有地個人化。

正在發生的多元應用：

從相機陷阱與無人機影像中盤點瀕危動物
解讀抹香鯨的鳴叫意義
在宇宙中尋找黑洞、控制核融合反應爐
解讀古文字與已風化的卷軸
搜尋亞馬遜叢林中失落的城市
醫療影像判讀、基因組與生物標記輔助治療
神經元活動的解讀，讓 AI「讀心」變得可能

風險仍在：資料雖多但有缺口（歷史偏見讓某些族群、女性人數不足；儀器本身有極限）。AI 不是魔杖，洞見可能是海市蜃樓；同樣的方法也能被濫用設計生物武器。
但沒有其他領域，AI 的天平像在科學上這樣傾向進步。

蛋白質摺疊：AlphaFold 的突破#

從 AlphaGo 到 AlphaFold#

2016 年首爾，AlphaGo 擊敗世界冠軍李世乭（Lee Sedol）後的某個寒夜，DeepMind 創辦人 Demis Hassabis 與 AlphaGo 主導者 David Silver 漫步首爾街頭。Hassabis 對 Silver 說：「我跟你說，我們可以解決蛋白質摺疊。」

蛋白質摺疊有多難？

1960 年代物理學家 Cyrus Levinthal 證明：若隨機嘗試所有可能形狀，得花比宇宙年齡更久才能找到正確結構。
蛋白質是生命之積木：以胺基酸長鏈構成，依物理原理摺疊成複雜形狀，形狀決定功能。
鐮刀型貧血、囊腫纖維化、Marfan 症候群皆源自摺疊異常；阿茲海默、帕金森、亨丁頓舞蹈症、漸凍症（Lou Gehrig）也與摺疊錯誤的蛋白質有關。
多數藥物都是與蛋白質表面「口袋」結合的小分子；理解結構就能加速新藥研發。

1972 年化學家 Christian Anfinsen 在諾貝爾受獎演說中提出：蛋白質的 DNA 應完全決定它的形狀——當時甚至還沒有任何基因組被測序。這啟動了「計算生物學」整個子領域。
但接下來近 50 年進展緩慢：2016 年，最佳計算方法只有 30% 的時候能高準確度給出結構。蛋白質結構的金標準仍是耗時昂貴的 X 光晶體繞射或 CryoEM。當時數億蛋白質中只有約 11 萬個有結構解，每年新增不到 1 萬個。

AlphaFold 的成績單#

2020 年 11 月，DeepMind 發表 AlphaFold：給它 DNA 序列，9 成情況下能預測結構到原子寬度的精度，並附信心分數。
一年內為人體所有蛋白質做出結構預測（之前只有 17% 已知），免費上線供查詢。
同時釋出 20 種重要生物（如瘧原蟲、實驗鼠）的所有蛋白結構。
2022 年再進一步：發布全部 2 億個已知蛋白質的結構預測。

諾貝爾獎得主、Francis Crick Institute 執行長 Paul Nurse 形容：AlphaFold 開啟了蛋白質研究的「系統取徑（systems approach）」——研究者第一次能跨物種、跨基因組比較結構，理解不同生物功能如何演化。

AlphaFold 已被應用於：

新抗生素獵索
製藥公司忽略的熱帶疾病新療法
提升蜜蜂群體對疾病的抗性
尋找能分解塑膠的蛋白質

科學的萬用工具#

從電池到天文#

微軟 + Pacific Northwest 國家實驗室：用 AI 從 3200 萬種化學組合中篩出 50 萬、再到 800 種，最終找到一種前所未見、自然界不存在、能讓電池減少 70% 鋰用量的化合物。整個過程僅 9 個月。
DeepMind + 瑞士物理學家：用 AI 控制甜甜圈狀的 tokamak 核融合反應爐中超高溫等離子的磁場——可能加速乾淨能源的突破。
AI 在天文（更清晰的黑洞影像）、生態（剛果熱帶雨林、非洲莽原瀕危物種計數）、考古（衛星影像找失落城市、解讀脆弱卷軸）、神經科學（繪製神經元集群、可能讓 AI 從腦掃描或植入物「讀心」）都展現實效。

Jumper 的觀點：給人類「狹窄領域裡的超能力」#

DeepMind 蛋白質摺疊團隊負責人 John Jumper：AI for science 不是要打造萬能的「AI 科學家」，而是讓人類研究者在特定狹窄領域擁有超人能力。
「人類不擅長預測蛋白質結構，不擅長解讀基因組——所以為什麼不讓 AI 做那些我們做不到的事？」

解決「資料不夠美」的問題#

最大限制是「美麗的資料來源太少」——夠大、結構正確、能訓練模型的資料集。但 AI 本身會解決這個問題：
計數與分類過去無法數的事物（血液中的游離 DNA、遠星系的星體）。
生成式 AI 模擬無法直接觀測的現象，提供新資料庫——AlphaFold 就是一例。

LLM 進入文獻、社會科學#

美國非營利 Ought 開發的 Elicit 用 LLM 加速文獻回顧、檢索與摘要。
新加坡學者證實 ChatGPT 可準確判別人格類型；Igor Grossmann（Waterloo 大學）讓 LLM 扮演特定人格回答問卷，與真實受測者高度吻合。
卡達與芬蘭學者建議：以 LLM 模擬大樣本人群，取代部分問卷與市調；甚至可在行為經濟、博弈論、國際關係的「戰爭遊戲」中模擬世界領袖或 NGO 的行為。

開放與資源不平等#

DeepMind 開放 AlphaFold 與所有預測；Meta 也釋出許多科學模型。但並非所有公司都會這麼做，科學主導權正逐漸從大學流向追求利潤的公司。
美國等政府已開始興建「國家 AI 研究雲」——擁有數千 GPU 的公共資料中心，供學術研究使用。這是維持公共科學競爭力的關鍵。

假說的休止：邁向「無假說」科學？#

神經網路是黑盒子#

我們從小被教的科學方法以假說為核心；但 AlphaFold 與許多新藥研究方法不再需要研究者先有假說。神經網路權重中藏著某種對「這段 DNA 會做什麼」的直覺，它無法解釋，也無法被解釋。
這把科學從理論推回純經驗主義（pure empiricism），打開了「無假說科學」的可能性——「相關不等於因果」依然成立，但有了夠多資料與強力分析工具，相關往往就足夠。

解釋重要嗎？情境決定#

診斷：醫師通常不信任無解釋的預測。NYU 的 Sumit Chopra 訓練 AI 用更少資料的 MRI 偵測癌症，但因為不再產出醫師可看的 2D 影像，醫師不願使用。
治療：醫師反而能接受「有效但說不清為什麼」的療法，他們有時戲稱為「巫術醫療」。阿斯匹靈用了一個世紀才在近年解開作用機制。

工具主義 vs 實在論#

工具主義者（instrumentalist）：科學的目的是準確預測；理論只是預測工具。能準就好。Jumper 屬此派：「科學的核心是什麼？預測會發生什麼，再驗證預測對不對。」
實在論者（realist）：科學是要理解世界的底層真實。Noam Chomsky 是代表，他批評純統計預測：「你也可以蒐集蝴蝶、做很多觀察。如果你喜歡蝴蝶，那很好；但這不能與探究『解釋原則』的研究相混淆。」

Jonathan Zittrain 的「智識債」#

法學者 Jonathan Zittrain 指出：每次我們用一個有預測力但我們不理解的模型，就是在累積「智識債（intellectual debt）」。我們最終要以解釋理論還清這筆債，否則終將陷入麻煩。
「一個有知識卻沒有理解的世界，會變成一個沒有可辨因果的世界——我們只能依賴數位門房告訴我們該做什麼、何時該做。」

但理論可能因 AI 而再起#

2021 年 12 月，DeepMind 與雪梨、牛津的數學家合作：訓練 AI 找出輸入到輸出的數學函數後，再分析模型權重，由人類提出新的解釋理論。
在排列與多項式相關的猜想上，AI 助攻數學家給出了困擾學界數十年的新公式。
DeepMind 的 AI for Science 主管 Pushmeet Kohli 預期：AI 可建構天氣、生態等複雜全球現象的模型，由人類繼續提出機制假說。
歷史上經驗與理論交替推進：克卜勒（Kepler）的行星觀測先於牛頓的引力與運動定律；倫琴（Röntgen）發現 X 光先於電磁輻射理論。

此時此刻，AI 把經驗知識推得比理論還快，但沒有理由相信理論不會追上。

思考速度的醫學#

Profluent AI 與 ProGen#

在加州柏克萊一座前藝術博物館的地下室，Profluent AI 的機械臂同時執行 96 項酵素實驗。
創辦人 Ali Madani（機器學習博士）發現「蛋白質有它自己的語言」——序列決定結構、結構決定功能，類似自然語言中文法決定意義。
ProGen 模型訓練於 2.8 億蛋白質資料：在《Nature Biotechnology》研究中，它設計的 100 個人工溶菌酶（lysozymes）有 73% 對細菌細胞壁產生反應（自然蛋白為 59%），部分甚至比天然中最佳之一（雞蛋白裡的 lysozyme）更強。

命中率的躍進#

蛋白質設計的關鍵指標是「hit rate」——多少候選蛋白在實驗中達最低功能。
傳統方法：0.01%–0.14%，需製造數百萬個蛋白才找出可能藥物候選。
Profluent 的 AI 流程：接近 50%。
Madani 期望透過「2–3 輪 AI 生成 → 實驗 → AI 微調 → 再實驗」就能交給大藥廠進入臨床試驗。新藥從「至少 10 年、超過 10 億美元」的時程被大幅壓縮，最終讓藥更便宜。

LabGenius 的 HER2 抗體#

倫敦新創 LabGenius 同樣以 AI 設計蛋白藥；它做出一款結構迥異於既有 T-cell engager 抗體的 HER2 抗體。
選擇性比 Runimotamab 高約 400 倍——大幅降低傷害健康細胞的風險。

對抗超級細菌#

2019 年起，AI 已協助發現至少兩種新抗生素：halicin 與 abaucin，對日益常見的「超級細菌」有效。
也將為癌症新療法、製藥公司忽視的罕病帶來機會。

個人化健康照護#

正在發生的應用#

放射科腫瘤、肺炎判讀。
Johns Hopkins Hospital：以 AI 演算法預測敗血症發病，使每年死亡 25 萬人的病症死亡率降低 20%。
Moorfields Eye Hospital（倫敦）的 RETFound：從視網膜掃描不只能診斷糖尿病視網膜病變、青光眼，還能預測整體健康、心衰、中風與帕金森氏症風險。
AI 協助手術規劃、出血預估，醫療專用 LLM 也將讓電子病歷成為更強的診斷工具。

未來幾年的場景#

二十多歲的 Marcia 正開車上班，總覺得焦躁、思緒太快。手機響了，是醫師：「你的智慧手錶傳來異常資料，心率變異與活動模式對應到雙相情緒障礙急性發作前的特徵。雖然你尚未被診斷，但鑑於家族病史與基因檔案，請今天回診做更完整評估，我們可以開藥幫助你穩定。」
早期介入讓她得以維持心理健康。

完整圖像#

結合普及的基因定序，醫師與病人能更掌握個人風險與療法選擇。
規律以血液與尿液監測癌症 DNA 碎片將成為篩檢日常。
智慧手錶、體內植入感測器（如連續血糖儀）會持續監測；資料納入電子病歷，由 AI 協助醫師看出疾病訊號。

給某些人更好的醫學，給另一些人苦藥#

訓練資料的偏差#

Google DeepMind 與美國退伍軍人 (VA) 醫院共同開發的急性腎損傷偵測演算法，因 VA 病人多為男性，對女性病人準確率明顯偏低。
同一模型在訓練醫院之外常常失效。

2020 年研究 232 個 COVID-19 診斷與預後 AI：沒有一個適合臨床用，僅兩個值得進一步測試。
415 個從 X 光與 CT 偵測 COVID-19 的工具研究中：沒有一個臨床有效。
基因組研究黑人與拉丁裔受試者占比不到 3%；臨床試驗白人受試者占 86%。

監管制度跟不上#

美國 AI 軟體公司多半不必證明對多元族群有效就能賣給醫院；許多「決策輔助」工具甚至不需 FDA 核准。
申請者多走 FDA 510(k) 加速程序——只需證明「實質上等效（substantially equivalent）」既有軟體。
2023 年 12 月止，FDA 已核准超過 700 個 AI 模型（多為放射與心臟），幾乎沒有任何一個經過隨機對照試驗驗證能改善病人結果。
FDA 採用平均效能指標——但若漏判 5% 的肺癌剛好都是最具侵襲性的，95% 的準確率就極具誤導性。
醫院內部訂製、僅供內部使用的 AI 模型則完全不受監管。

結果是：富裕者最先享受個人化醫療紅利，AI 又一次成為加深不平等的力量。除非政府主動干預，否則「最終所有人都活得更久更健康」的承諾將遠在天邊。

AI 也能成為恐怖工具#

同一套讓藥物加速問世的方法，也能被用來設計生物武器。LLM 能寫蛋白質配方，自然也能寫致命病毒或產生神經毒素的細菌；加上 CRISPR 與低價、桌面型 DNA 印表機，恐怖組織、末日邪教或流氓政權都可能製造出威脅全人類的病原體。

但也有積極面：

AI 可強化新興病原體的監測系統。
一旦發生生物攻擊，AI 也能加速疫苗與療法的研發。

政府應採取合理措施抑制生物武器擴散，即使會增加合法新創與學術研究的成本與摩擦：
嚴格管制 DNA 印表機的銷售與出口（至少比照放射性物質與致命化學品的標準）。
對基因組與蛋白 LLM 的營運者實施特定許可制度，並在全球協作下追蹤監測。
生物恐攻的陰影令人寒慄，但相對於 AI 對科學、健康、氣候、永續、宇宙與歷史的指數級貢獻，這份升高的風險，是值得付出的代價。