AI 是科學的下一台望遠鏡與顯微鏡#
在所有 AI 的衝擊中,沒有哪一個比 AI 對科學、醫學與健康的影響更壓倒性地正向。
AI 之於科學,正如望遠鏡與顯微鏡之於人類——讓我們看見過去因為太遠或太細微而看不見的事物,這次是看見資料中過於複雜或微妙、人腦無法察覺的模式。
過去十年,新型科學儀器(基因定序、合成孔徑雷達、高能粒子加速器)讓研究者收集到空前龐大的資料量;多到不靠 AI 根本無法解析。
論文洪流也是:
- PubMed 每年新增超過 100 萬篇生醫論文,平均每兩秒一篇。
- 各學科每年累計上千萬篇。
- 弔詭的是:論文越多,但重大突破的速度反而變慢。AI 成為唯一能整合、摘要、跨學科找連結的工具。
AI 將協助發現新電池材料、提升作物產量而不需毒化學品、解鎖疾病新療法;結合穿戴裝置與血液檢驗,更能讓醫療前所未有地個人化。
正在發生的多元應用:
- 從相機陷阱與無人機影像中盤點瀕危動物
- 解讀抹香鯨的鳴叫意義
- 在宇宙中尋找黑洞、控制核融合反應爐
- 解讀古文字與已風化的卷軸
- 搜尋亞馬遜叢林中失落的城市
- 醫療影像判讀、基因組與生物標記輔助治療
- 神經元活動的解讀,讓 AI「讀心」變得可能
風險仍在:資料雖多但有缺口(歷史偏見讓某些族群、女性人數不足;儀器本身有極限)。AI 不是魔杖,洞見可能是海市蜃樓;同樣的方法也能被濫用設計生物武器。
但沒有其他領域,AI 的天平像在科學上這樣傾向進步。
蛋白質摺疊:AlphaFold 的突破#
從 AlphaGo 到 AlphaFold#
2016 年首爾,AlphaGo 擊敗世界冠軍李世乭(Lee Sedol)後的某個寒夜,DeepMind 創辦人 Demis Hassabis 與 AlphaGo 主導者 David Silver 漫步首爾街頭。Hassabis 對 Silver 說:「我跟你說,我們可以解決蛋白質摺疊。」
蛋白質摺疊有多難?
- 1960 年代物理學家 Cyrus Levinthal 證明:若隨機嘗試所有可能形狀,得花比宇宙年齡更久才能找到正確結構。
- 蛋白質是生命之積木:以胺基酸長鏈構成,依物理原理摺疊成複雜形狀,形狀決定功能。
- 鐮刀型貧血、囊腫纖維化、Marfan 症候群皆源自摺疊異常;阿茲海默、帕金森、亨丁頓舞蹈症、漸凍症(Lou Gehrig)也與摺疊錯誤的蛋白質有關。
- 多數藥物都是與蛋白質表面「口袋」結合的小分子;理解結構就能加速新藥研發。
1972 年化學家 Christian Anfinsen 在諾貝爾受獎演說中提出:蛋白質的 DNA 應完全決定它的形狀——當時甚至還沒有任何基因組被測序。這啟動了「計算生物學」整個子領域。
但接下來近 50 年進展緩慢:2016 年,最佳計算方法只有 30% 的時候能高準確度給出結構。蛋白質結構的金標準仍是耗時昂貴的 X 光晶體繞射或 CryoEM。當時數億蛋白質中只有約 11 萬個有結構解,每年新增不到 1 萬個。
AlphaFold 的成績單#
- 2020 年 11 月,DeepMind 發表 AlphaFold:給它 DNA 序列,9 成情況下能預測結構到原子寬度的精度,並附信心分數。
- 一年內為人體所有蛋白質做出結構預測(之前只有 17% 已知),免費上線供查詢。
- 同時釋出 20 種重要生物(如瘧原蟲、實驗鼠)的所有蛋白結構。
- 2022 年再進一步:發布全部 2 億個已知蛋白質的結構預測。
諾貝爾獎得主、Francis Crick Institute 執行長 Paul Nurse 形容:AlphaFold 開啟了蛋白質研究的「系統取徑(systems approach)」——研究者第一次能跨物種、跨基因組比較結構,理解不同生物功能如何演化。
AlphaFold 已被應用於:
- 新抗生素獵索
- 製藥公司忽略的熱帶疾病新療法
- 提升蜜蜂群體對疾病的抗性
- 尋找能分解塑膠的蛋白質
科學的萬用工具#
從電池到天文#
- 微軟 + Pacific Northwest 國家實驗室:用 AI 從 3200 萬種化學組合中篩出 50 萬、再到 800 種,最終找到一種前所未見、自然界不存在、能讓電池減少 70% 鋰用量的化合物。整個過程僅 9 個月。
- DeepMind + 瑞士物理學家:用 AI 控制甜甜圈狀的 tokamak 核融合反應爐中超高溫等離子的磁場——可能加速乾淨能源的突破。
- AI 在天文(更清晰的黑洞影像)、生態(剛果熱帶雨林、非洲莽原瀕危物種計數)、考古(衛星影像找失落城市、解讀脆弱卷軸)、神經科學(繪製神經元集群、可能讓 AI 從腦掃描或植入物「讀心」)都展現實效。
Jumper 的觀點:給人類「狹窄領域裡的超能力」#
DeepMind 蛋白質摺疊團隊負責人 John Jumper:AI for science 不是要打造萬能的「AI 科學家」,而是讓人類研究者在特定狹窄領域擁有超人能力。
「人類不擅長預測蛋白質結構,不擅長解讀基因組——所以為什麼不讓 AI 做那些我們做不到的事?」
解決「資料不夠美」的問題#
最大限制是「美麗的資料來源太少」——夠大、結構正確、能訓練模型的資料集。但 AI 本身會解決這個問題:
- 計數與分類過去無法數的事物(血液中的游離 DNA、遠星系的星體)。
- 生成式 AI 模擬無法直接觀測的現象,提供新資料庫——AlphaFold 就是一例。
LLM 進入文獻、社會科學#
- 美國非營利 Ought 開發的 Elicit 用 LLM 加速文獻回顧、檢索與摘要。
- 新加坡學者證實 ChatGPT 可準確判別人格類型;Igor Grossmann(Waterloo 大學)讓 LLM 扮演特定人格回答問卷,與真實受測者高度吻合。
- 卡達與芬蘭學者建議:以 LLM 模擬大樣本人群,取代部分問卷與市調;甚至可在行為經濟、博弈論、國際關係的「戰爭遊戲」中模擬世界領袖或 NGO 的行為。
開放與資源不平等#
DeepMind 開放 AlphaFold 與所有預測;Meta 也釋出許多科學模型。但並非所有公司都會這麼做,科學主導權正逐漸從大學流向追求利潤的公司。
美國等政府已開始興建「國家 AI 研究雲」——擁有數千 GPU 的公共資料中心,供學術研究使用。這是維持公共科學競爭力的關鍵。
假說的休止:邁向「無假說」科學?#
神經網路是黑盒子#
我們從小被教的科學方法以假說為核心;但 AlphaFold 與許多新藥研究方法不再需要研究者先有假說。神經網路權重中藏著某種對「這段 DNA 會做什麼」的直覺,它無法解釋,也無法被解釋。
這把科學從理論推回純經驗主義(pure empiricism),打開了「無假說科學」的可能性——「相關不等於因果」依然成立,但有了夠多資料與強力分析工具,相關往往就足夠。
解釋重要嗎?情境決定#
- 診斷:醫師通常不信任無解釋的預測。NYU 的 Sumit Chopra 訓練 AI 用更少資料的 MRI 偵測癌症,但因為不再產出醫師可看的 2D 影像,醫師不願使用。
- 治療:醫師反而能接受「有效但說不清為什麼」的療法,他們有時戲稱為「巫術醫療」。阿斯匹靈用了一個世紀才在近年解開作用機制。
工具主義 vs 實在論#
- 工具主義者(instrumentalist):科學的目的是準確預測;理論只是預測工具。能準就好。Jumper 屬此派:「科學的核心是什麼?預測會發生什麼,再驗證預測對不對。」
- 實在論者(realist):科學是要理解世界的底層真實。Noam Chomsky 是代表,他批評純統計預測:「你也可以蒐集蝴蝶、做很多觀察。如果你喜歡蝴蝶,那很好;但這不能與探究『解釋原則』的研究相混淆。」
Jonathan Zittrain 的「智識債」#
法學者 Jonathan Zittrain 指出:每次我們用一個有預測力但我們不理解的模型,就是在累積「智識債(intellectual debt)」。我們最終要以解釋理論還清這筆債,否則終將陷入麻煩。
「一個有知識卻沒有理解的世界,會變成一個沒有可辨因果的世界——我們只能依賴數位門房告訴我們該做什麼、何時該做。」
但理論可能因 AI 而再起#
- 2021 年 12 月,DeepMind 與雪梨、牛津的數學家合作:訓練 AI 找出輸入到輸出的數學函數後,再分析模型權重,由人類提出新的解釋理論。
- 在排列與多項式相關的猜想上,AI 助攻數學家給出了困擾學界數十年的新公式。
- DeepMind 的 AI for Science 主管 Pushmeet Kohli 預期:AI 可建構天氣、生態等複雜全球現象的模型,由人類繼續提出機制假說。
- 歷史上經驗與理論交替推進:克卜勒(Kepler)的行星觀測先於牛頓的引力與運動定律;倫琴(Röntgen)發現 X 光先於電磁輻射理論。
此時此刻,AI 把經驗知識推得比理論還快,但沒有理由相信理論不會追上。
思考速度的醫學#
Profluent AI 與 ProGen#
- 在加州柏克萊一座前藝術博物館的地下室,Profluent AI 的機械臂同時執行 96 項酵素實驗。
- 創辦人 Ali Madani(機器學習博士)發現「蛋白質有它自己的語言」——序列決定結構、結構決定功能,類似自然語言中文法決定意義。
- ProGen 模型訓練於 2.8 億蛋白質資料:在《Nature Biotechnology》研究中,它設計的 100 個人工溶菌酶(lysozymes)有 73% 對細菌細胞壁產生反應(自然蛋白為 59%),部分甚至比天然中最佳之一(雞蛋白裡的 lysozyme)更強。
命中率的躍進#
蛋白質設計的關鍵指標是「hit rate」——多少候選蛋白在實驗中達最低功能。
- 傳統方法:0.01%–0.14%,需製造數百萬個蛋白才找出可能藥物候選。
- Profluent 的 AI 流程:接近 50%。
Madani 期望透過「2–3 輪 AI 生成 → 實驗 → AI 微調 → 再實驗」就能交給大藥廠進入臨床試驗。新藥從「至少 10 年、超過 10 億美元」的時程被大幅壓縮,最終讓藥更便宜。
LabGenius 的 HER2 抗體#
- 倫敦新創 LabGenius 同樣以 AI 設計蛋白藥;它做出一款結構迥異於既有 T-cell engager 抗體的 HER2 抗體。
- 選擇性比 Runimotamab 高約 400 倍——大幅降低傷害健康細胞的風險。
對抗超級細菌#
- 2019 年起,AI 已協助發現至少兩種新抗生素:halicin 與 abaucin,對日益常見的「超級細菌」有效。
- 也將為癌症新療法、製藥公司忽視的罕病帶來機會。
個人化健康照護#
正在發生的應用#
- 放射科腫瘤、肺炎判讀。
- Johns Hopkins Hospital:以 AI 演算法預測敗血症發病,使每年死亡 25 萬人的病症死亡率降低 20%。
- Moorfields Eye Hospital(倫敦)的 RETFound:從視網膜掃描不只能診斷糖尿病視網膜病變、青光眼,還能預測整體健康、心衰、中風與帕金森氏症風險。
- AI 協助手術規劃、出血預估,醫療專用 LLM 也將讓電子病歷成為更強的診斷工具。
未來幾年的場景#
二十多歲的 Marcia 正開車上班,總覺得焦躁、思緒太快。手機響了,是醫師:「你的智慧手錶傳來異常資料,心率變異與活動模式對應到雙相情緒障礙急性發作前的特徵。雖然你尚未被診斷,但鑑於家族病史與基因檔案,請今天回診做更完整評估,我們可以開藥幫助你穩定。」
早期介入讓她得以維持心理健康。
完整圖像#
- 結合普及的基因定序,醫師與病人能更掌握個人風險與療法選擇。
- 規律以血液與尿液監測癌症 DNA 碎片將成為篩檢日常。
- 智慧手錶、體內植入感測器(如連續血糖儀)會持續監測;資料納入電子病歷,由 AI 協助醫師看出疾病訊號。
給某些人更好的醫學,給另一些人苦藥#
訓練資料的偏差#
Google DeepMind 與美國退伍軍人 (VA) 醫院共同開發的急性腎損傷偵測演算法,因 VA 病人多為男性,對女性病人準確率明顯偏低。
同一模型在訓練醫院之外常常失效。
- 2020 年研究 232 個 COVID-19 診斷與預後 AI:沒有一個適合臨床用,僅兩個值得進一步測試。
- 415 個從 X 光與 CT 偵測 COVID-19 的工具研究中:沒有一個臨床有效。
- 基因組研究黑人與拉丁裔受試者占比不到 3%;臨床試驗白人受試者占 86%。
監管制度跟不上#
- 美國 AI 軟體公司多半不必證明對多元族群有效就能賣給醫院;許多「決策輔助」工具甚至不需 FDA 核准。
- 申請者多走 FDA 510(k) 加速程序——只需證明「實質上等效(substantially equivalent)」既有軟體。
- 2023 年 12 月止,FDA 已核准超過 700 個 AI 模型(多為放射與心臟),幾乎沒有任何一個經過隨機對照試驗驗證能改善病人結果。
- FDA 採用平均效能指標——但若漏判 5% 的肺癌剛好都是最具侵襲性的,95% 的準確率就極具誤導性。
- 醫院內部訂製、僅供內部使用的 AI 模型則完全不受監管。
結果是:富裕者最先享受個人化醫療紅利,AI 又一次成為加深不平等的力量。除非政府主動干預,否則「最終所有人都活得更久更健康」的承諾將遠在天邊。
AI 也能成為恐怖工具#
同一套讓藥物加速問世的方法,也能被用來設計生物武器。LLM 能寫蛋白質配方,自然也能寫致命病毒或產生神經毒素的細菌;加上 CRISPR 與低價、桌面型 DNA 印表機,恐怖組織、末日邪教或流氓政權都可能製造出威脅全人類的病原體。
但也有積極面:
- AI 可強化新興病原體的監測系統。
- 一旦發生生物攻擊,AI 也能加速疫苗與療法的研發。
政府應採取合理措施抑制生物武器擴散,即使會增加合法新創與學術研究的成本與摩擦:
- 嚴格管制 DNA 印表機的銷售與出口(至少比照放射性物質與致命化學品的標準)。
- 對基因組與蛋白 LLM 的營運者實施特定許可制度,並在全球協作下追蹤監測。
生物恐攻的陰影令人寒慄,但相對於 AI 對科學、健康、氣候、永續、宇宙與歷史的指數級貢獻,這份升高的風險,是值得付出的代價。