生醫基礎模型崛起趨勢

Nature Biotechnology · 2026.04

生醫基礎模型崛起趨勢

220 個 Biomedical Foundation Models 全景分析

作者 Chang, Cheng, Modi, Wang, Xu & Ma
原文 → doi.org/10.1038/s41587-026-03135-y

01 · Background

何謂生醫基礎模型

→大規模機器學習模型 (large-scale ML)，訓練於多元生醫與臨床資料

→資料涵蓋: 基因序列、分子剖析 (molecular profiling)、生醫影像、電子病歷 (EHR)

→學習通用表徵 (generalizable representations) 以支援下游發現與臨床應用

→調查涵蓋 4 大領域: 自然語言、影像訊號、組學 (omics)、分子序列

本研究排除 ChatGPT、Gemini、Claude 等通用 LLM，聚焦 220 個生醫專屬模型，發展時間跨度 4 年。

02 · Big picture

從單模態走向多模態

220

Curated models

過去 4 年累積

53.6%

Multimodal

118 個整合 ≥2 種模態

Modalities

資料模態總類

Domains

語言/影像/組學/序列

關鍵觀察: 自然語言 (natural language) 最常與其他模態配對，逐漸成為跨資料類型的「連接介面 (connective interface)」。

03 · Architecture

編碼器架構占主導

Encoder-based 編碼器114 · 51.8%

Mixed 混合架構67 · 30.5%

Decoder-based 解碼器31 · 14.1%

Non-Transformer (e.g. Mamba)3.6%

解碼器較少的原因: 文字生成任務需高品質 image–text 標註配對，在生醫領域取得困難。

04 · Evaluation gap

評估方式仍偏單一

Classification 分類50.9%

Report generation 報告生成10.9%

Question answering 問答8.6%

Segmentation 分割7.3%

! 評估缺口

缺乏多任務基準 (multitask benchmarks)、人在迴路評估 (human-in-the-loop) 與資料品質、可解釋性、轉譯相關性的綜合考量。

05 · Citation leaders

各領域引用王者

Natural language

BioBERT 6,925 · MultiMedQA 3,707 · PubMedBERT 2,278

Imaging & signals

UNI 1,141 · ConVIRT* 1,003 · MedCLIP* 794

Omics 組學

scGPT 846 · Geneformer 836 · scBERT 509

Molecular sequences

ESM-1b 2,807 · ProtTrans 1,207 · DNABERT 1,051

* 標示為多模態模型。應用對應臨床知識萃取、藥物發現、數位病理等高影響領域。

06 · Post-2025 risers

2025 後新興引用領跑者

模型	領域	引用
BiomedCLIP*	影像 + 語言	498
Quilt-1M*	病理 + 語言	216
ESM3	蛋白質序列	201
Evo-2	DNA / RNA	197
Borzoi	分子序列	190
MedGemma-27B	自然語言	165
Nicheformer*	組學 omics	81
OmiCLIP*	影像 + 組學	58

* 多模態。新興引用增長明顯由「整合異質資料模態」的模型推動，而非單一資料類型專家。

07 · Underexplored

尚未充分發展的整合方向

+ 機制可解釋性潛力

自然語言 ↔ 分子序列、自然語言 ↔ 組學: 用語言介面協助 scRNA-seq 註解、通路富集 (pathway enrichment)、空間轉錄體 (spatial transcriptomics)。

+ 治療標的發現

影像 ↔ 組學整合 (尤其 H&E 病理 ↔ omics) 仍偏弱，但連結組織形態與分子機制潛力大。

+ 跨調控層次

DNA / RNA / 蛋白質 / 表觀基因組 (epigenomic) 連結度有限，尤其蛋白質與其他模態。

x 主要瓶頸

非概念缺乏，而是: 配對資料稀少、預處理/標註標準不一、缺乏標準化多模態基準。

08 · Outlook

高採用因素與未來展望

+對應高影響應用: 臨床語言處理、蛋白質建模、數位病理

+評估嚴謹度: 多元下游任務測試提升信任與重用

+可近用性: 公開預訓練權重、程式碼、易用介面

+新關鍵: 與 agent-based AI 工作流整合相容性

! 待解難題

資料品質、世代多樣性 (cohort diversity)、批次效應 (batch effects)、隱私安全、幻覺 (hallucination)、對抗穩健性 (adversarial robustness) 仍限制真實場景部署。

建議: 跨領域協作 (生物學家 × 臨床醫師 × 模型開發者) + 高效微調強預訓練骨幹 (efficient adaptation) 取代從頭訓練。