AI 是科學的下一台望遠鏡與顯微鏡#

在所有 AI 的衝擊中,沒有哪一個比 AI 對科學、醫學與健康的影響更壓倒性地正向。

AI 之於科學,正如望遠鏡與顯微鏡之於人類——讓我們看見過去因為太遠或太細微而看不見的事物,這次是看見資料中過於複雜或微妙、人腦無法察覺的模式

過去十年,新型科學儀器(基因定序、合成孔徑雷達、高能粒子加速器)讓研究者收集到空前龐大的資料量;多到不靠 AI 根本無法解析。

論文洪流也是:

  • PubMed 每年新增超過 100 萬篇生醫論文,平均每兩秒一篇。
  • 各學科每年累計上千萬篇。
  • 弔詭的是:論文越多,但重大突破的速度反而變慢。AI 成為唯一能整合、摘要、跨學科找連結的工具。

AI 將協助發現新電池材料、提升作物產量而不需毒化學品、解鎖疾病新療法;結合穿戴裝置與血液檢驗,更能讓醫療前所未有地個人化

正在發生的多元應用:

  • 從相機陷阱與無人機影像中盤點瀕危動物
  • 解讀抹香鯨的鳴叫意義
  • 在宇宙中尋找黑洞、控制核融合反應爐
  • 解讀古文字與已風化的卷軸
  • 搜尋亞馬遜叢林中失落的城市
  • 醫療影像判讀、基因組與生物標記輔助治療
  • 神經元活動的解讀,讓 AI「讀心」變得可能

風險仍在:資料雖多但有缺口(歷史偏見讓某些族群、女性人數不足;儀器本身有極限)。AI 不是魔杖,洞見可能是海市蜃樓;同樣的方法也能被濫用設計生物武器。

沒有其他領域,AI 的天平像在科學上這樣傾向進步

蛋白質摺疊:AlphaFold 的突破#

從 AlphaGo 到 AlphaFold#

2016 年首爾,AlphaGo 擊敗世界冠軍李世乭(Lee Sedol)後的某個寒夜,DeepMind 創辦人 Demis Hassabis 與 AlphaGo 主導者 David Silver 漫步首爾街頭。Hassabis 對 Silver 說:「我跟你說,我們可以解決蛋白質摺疊。

蛋白質摺疊有多難?

  • 1960 年代物理學家 Cyrus Levinthal 證明:若隨機嘗試所有可能形狀,得花比宇宙年齡更久才能找到正確結構。
  • 蛋白質是生命之積木:以胺基酸長鏈構成,依物理原理摺疊成複雜形狀,形狀決定功能。
  • 鐮刀型貧血、囊腫纖維化、Marfan 症候群皆源自摺疊異常;阿茲海默、帕金森、亨丁頓舞蹈症、漸凍症(Lou Gehrig)也與摺疊錯誤的蛋白質有關。
  • 多數藥物都是與蛋白質表面「口袋」結合的小分子;理解結構就能加速新藥研發。

1972 年化學家 Christian Anfinsen 在諾貝爾受獎演說中提出:蛋白質的 DNA 應完全決定它的形狀——當時甚至還沒有任何基因組被測序。這啟動了「計算生物學」整個子領域。

但接下來近 50 年進展緩慢:2016 年,最佳計算方法只有 30% 的時候能高準確度給出結構。蛋白質結構的金標準仍是耗時昂貴的 X 光晶體繞射或 CryoEM。當時數億蛋白質中只有約 11 萬個有結構解,每年新增不到 1 萬個。

AlphaFold 的成績單#

  • 2020 年 11 月,DeepMind 發表 AlphaFold:給它 DNA 序列,9 成情況下能預測結構到原子寬度的精度,並附信心分數。
  • 一年內為人體所有蛋白質做出結構預測(之前只有 17% 已知),免費上線供查詢。
  • 同時釋出 20 種重要生物(如瘧原蟲、實驗鼠)的所有蛋白結構。
  • 2022 年再進一步:發布全部 2 億個已知蛋白質的結構預測。

諾貝爾獎得主、Francis Crick Institute 執行長 Paul Nurse 形容:AlphaFold 開啟了蛋白質研究的「系統取徑(systems approach)」——研究者第一次能跨物種、跨基因組比較結構,理解不同生物功能如何演化。

AlphaFold 已被應用於:

  • 新抗生素獵索
  • 製藥公司忽略的熱帶疾病新療法
  • 提升蜜蜂群體對疾病的抗性
  • 尋找能分解塑膠的蛋白質

科學的萬用工具#

從電池到天文#

  • 微軟 + Pacific Northwest 國家實驗室:用 AI 從 3200 萬種化學組合中篩出 50 萬、再到 800 種,最終找到一種前所未見、自然界不存在、能讓電池減少 70% 鋰用量的化合物。整個過程僅 9 個月。
  • DeepMind + 瑞士物理學家:用 AI 控制甜甜圈狀的 tokamak 核融合反應爐中超高溫等離子的磁場——可能加速乾淨能源的突破。
  • AI 在天文(更清晰的黑洞影像)、生態(剛果熱帶雨林、非洲莽原瀕危物種計數)、考古(衛星影像找失落城市、解讀脆弱卷軸)、神經科學(繪製神經元集群、可能讓 AI 從腦掃描或植入物「讀心」)都展現實效。

Jumper 的觀點:給人類「狹窄領域裡的超能力#

DeepMind 蛋白質摺疊團隊負責人 John Jumper:AI for science 不是要打造萬能的「AI 科學家」,而是讓人類研究者在特定狹窄領域擁有超人能力。

「人類不擅長預測蛋白質結構,不擅長解讀基因組——所以為什麼不讓 AI 做那些我們做不到的事?」

解決「資料不夠美」的問題#

最大限制是「美麗的資料來源太少」——夠大、結構正確、能訓練模型的資料集。但 AI 本身會解決這個問題:

  • 計數與分類過去無法數的事物(血液中的游離 DNA、遠星系的星體)。
  • 生成式 AI 模擬無法直接觀測的現象,提供新資料庫——AlphaFold 就是一例。

LLM 進入文獻、社會科學#

  • 美國非營利 Ought 開發的 Elicit 用 LLM 加速文獻回顧、檢索與摘要。
  • 新加坡學者證實 ChatGPT 可準確判別人格類型;Igor Grossmann(Waterloo 大學)讓 LLM 扮演特定人格回答問卷,與真實受測者高度吻合。
  • 卡達與芬蘭學者建議:以 LLM 模擬大樣本人群,取代部分問卷與市調;甚至可在行為經濟、博弈論、國際關係的「戰爭遊戲」中模擬世界領袖或 NGO 的行為。

開放與資源不平等#

DeepMind 開放 AlphaFold 與所有預測;Meta 也釋出許多科學模型。但並非所有公司都會這麼做,科學主導權正逐漸從大學流向追求利潤的公司

美國等政府已開始興建「國家 AI 研究雲」——擁有數千 GPU 的公共資料中心,供學術研究使用。這是維持公共科學競爭力的關鍵。

假說的休止:邁向「無假說」科學?#

神經網路是黑盒子#

我們從小被教的科學方法以假說為核心;但 AlphaFold 與許多新藥研究方法不再需要研究者先有假說。神經網路權重中藏著某種對「這段 DNA 會做什麼」的直覺,它無法解釋,也無法被解釋

這把科學從理論推回純經驗主義(pure empiricism),打開了「無假說科學」的可能性——「相關不等於因果」依然成立,但有了夠多資料與強力分析工具,相關往往就足夠

解釋重要嗎?情境決定#

  • 診斷:醫師通常不信任無解釋的預測。NYU 的 Sumit Chopra 訓練 AI 用更少資料的 MRI 偵測癌症,但因為不再產出醫師可看的 2D 影像,醫師不願使用。
  • 治療:醫師反而能接受「有效但說不清為什麼」的療法,他們有時戲稱為「巫術醫療」。阿斯匹靈用了一個世紀才在近年解開作用機制。

工具主義 vs 實在論#

  • 工具主義者(instrumentalist):科學的目的是準確預測;理論只是預測工具。能準就好。Jumper 屬此派:「科學的核心是什麼?預測會發生什麼,再驗證預測對不對。」
  • 實在論者(realist):科學是要理解世界的底層真實。Noam Chomsky 是代表,他批評純統計預測:「你也可以蒐集蝴蝶、做很多觀察。如果你喜歡蝴蝶,那很好;但這不能與探究『解釋原則』的研究相混淆。」

Jonathan Zittrain 的「智識債#

法學者 Jonathan Zittrain 指出:每次我們用一個有預測力但我們不理解的模型,就是在累積「智識債(intellectual debt)」。我們最終要以解釋理論還清這筆債,否則終將陷入麻煩。

「一個有知識卻沒有理解的世界,會變成一個沒有可辨因果的世界——我們只能依賴數位門房告訴我們該做什麼、何時該做。」

但理論可能因 AI 而再起#

  • 2021 年 12 月,DeepMind 與雪梨、牛津的數學家合作:訓練 AI 找出輸入到輸出的數學函數後,再分析模型權重,由人類提出新的解釋理論。
  • 在排列與多項式相關的猜想上,AI 助攻數學家給出了困擾學界數十年的新公式
  • DeepMind 的 AI for Science 主管 Pushmeet Kohli 預期:AI 可建構天氣、生態等複雜全球現象的模型,由人類繼續提出機制假說。
  • 歷史上經驗與理論交替推進:克卜勒(Kepler)的行星觀測先於牛頓的引力與運動定律;倫琴(Röntgen)發現 X 光先於電磁輻射理論。

此時此刻,AI 把經驗知識推得比理論還快,但沒有理由相信理論不會追上。

思考速度的醫學#

Profluent AI 與 ProGen#

  • 在加州柏克萊一座前藝術博物館的地下室,Profluent AI 的機械臂同時執行 96 項酵素實驗。
  • 創辦人 Ali Madani(機器學習博士)發現「蛋白質有它自己的語言」——序列決定結構、結構決定功能,類似自然語言中文法決定意義。
  • ProGen 模型訓練於 2.8 億蛋白質資料:在《Nature Biotechnology》研究中,它設計的 100 個人工溶菌酶(lysozymes)有 73% 對細菌細胞壁產生反應(自然蛋白為 59%),部分甚至比天然中最佳之一(雞蛋白裡的 lysozyme)更強。

命中率的躍進#

蛋白質設計的關鍵指標是「hit rate」——多少候選蛋白在實驗中達最低功能。

  • 傳統方法:0.01%–0.14%,需製造數百萬個蛋白才找出可能藥物候選。
  • Profluent 的 AI 流程:接近 50%

Madani 期望透過「2–3 輪 AI 生成 → 實驗 → AI 微調 → 再實驗」就能交給大藥廠進入臨床試驗。新藥從「至少 10 年、超過 10 億美元」的時程被大幅壓縮,最終讓藥更便宜。

LabGenius 的 HER2 抗體#

  • 倫敦新創 LabGenius 同樣以 AI 設計蛋白藥;它做出一款結構迥異於既有 T-cell engager 抗體的 HER2 抗體。
  • 選擇性比 Runimotamab 高約 400 倍——大幅降低傷害健康細胞的風險。

對抗超級細菌#

  • 2019 年起,AI 已協助發現至少兩種新抗生素:halicinabaucin,對日益常見的「超級細菌」有效。
  • 也將為癌症新療法、製藥公司忽視的罕病帶來機會。

個人化健康照護#

正在發生的應用#

  • 放射科腫瘤、肺炎判讀。
  • Johns Hopkins Hospital:以 AI 演算法預測敗血症發病,使每年死亡 25 萬人的病症死亡率降低 20%
  • Moorfields Eye Hospital(倫敦)的 RETFound:從視網膜掃描不只能診斷糖尿病視網膜病變、青光眼,還能預測整體健康、心衰、中風與帕金森氏症風險。
  • AI 協助手術規劃、出血預估,醫療專用 LLM 也將讓電子病歷成為更強的診斷工具。

未來幾年的場景#

二十多歲的 Marcia 正開車上班,總覺得焦躁、思緒太快。手機響了,是醫師:「你的智慧手錶傳來異常資料,心率變異與活動模式對應到雙相情緒障礙急性發作前的特徵。雖然你尚未被診斷,但鑑於家族病史與基因檔案,請今天回診做更完整評估,我們可以開藥幫助你穩定。」

早期介入讓她得以維持心理健康。

完整圖像#

  • 結合普及的基因定序,醫師與病人能更掌握個人風險與療法選擇。
  • 規律以血液與尿液監測癌症 DNA 碎片將成為篩檢日常。
  • 智慧手錶、體內植入感測器(如連續血糖儀)會持續監測;資料納入電子病歷,由 AI 協助醫師看出疾病訊號。

給某些人更好的醫學,給另一些人苦藥#

訓練資料的偏差#

Google DeepMind 與美國退伍軍人 (VA) 醫院共同開發的急性腎損傷偵測演算法,因 VA 病人多為男性,對女性病人準確率明顯偏低

同一模型在訓練醫院之外常常失效。

  • 2020 年研究 232 個 COVID-19 診斷與預後 AI:沒有一個適合臨床用,僅兩個值得進一步測試。
  • 415 個從 X 光與 CT 偵測 COVID-19 的工具研究中:沒有一個臨床有效
  • 基因組研究黑人與拉丁裔受試者占比不到 3%;臨床試驗白人受試者占 86%。

監管制度跟不上#

  • 美國 AI 軟體公司多半不必證明對多元族群有效就能賣給醫院;許多「決策輔助」工具甚至不需 FDA 核准。
  • 申請者多走 FDA 510(k) 加速程序——只需證明「實質上等效(substantially equivalent)」既有軟體。
  • 2023 年 12 月止,FDA 已核准超過 700 個 AI 模型(多為放射與心臟),幾乎沒有任何一個經過隨機對照試驗驗證能改善病人結果
  • FDA 採用平均效能指標——但若漏判 5% 的肺癌剛好都是最具侵襲性的,95% 的準確率就極具誤導性。
  • 醫院內部訂製、僅供內部使用的 AI 模型則完全不受監管。

結果是:富裕者最先享受個人化醫療紅利,AI 又一次成為加深不平等的力量。除非政府主動干預,否則「最終所有人都活得更久更健康」的承諾將遠在天邊。

AI 也能成為恐怖工具#

同一套讓藥物加速問世的方法,也能被用來設計生物武器。LLM 能寫蛋白質配方,自然也能寫致命病毒或產生神經毒素的細菌;加上 CRISPR 與低價、桌面型 DNA 印表機,恐怖組織、末日邪教或流氓政權都可能製造出威脅全人類的病原體

但也有積極面:

  • AI 可強化新興病原體的監測系統。
  • 一旦發生生物攻擊,AI 也能加速疫苗與療法的研發。

政府應採取合理措施抑制生物武器擴散,即使會增加合法新創與學術研究的成本與摩擦:

  • 嚴格管制 DNA 印表機的銷售與出口(至少比照放射性物質與致命化學品的標準)。
  • 對基因組與蛋白 LLM 的營運者實施特定許可制度,並在全球協作下追蹤監測。

生物恐攻的陰影令人寒慄,但相對於 AI 對科學、健康、氣候、永續、宇宙與歷史的指數級貢獻,這份升高的風險,是值得付出的代價