Nature Biotechnology · 2026.04

生醫基礎模型崛起趨勢

220 個 Biomedical Foundation Models 全景分析
作者 Chang, Cheng, Modi, Wang, Xu & Ma
原文 → doi.org/10.1038/s41587-026-03135-y
01 · Background

何謂生醫基礎模型

大規模機器學習模型 (large-scale ML),訓練於多元生醫與臨床資料
資料涵蓋: 基因序列、分子剖析 (molecular profiling)、生醫影像、電子病歷 (EHR)
學習通用表徵 (generalizable representations) 以支援下游發現與臨床應用
調查涵蓋 4 大領域: 自然語言、影像訊號、組學 (omics)、分子序列
本研究排除 ChatGPT、Gemini、Claude 等通用 LLM,聚焦 220 個生醫專屬模型,發展時間跨度 4 年。
02 · Big picture

從單模態走向多模態

220
Curated models
過去 4 年累積
53.6%
Multimodal
118 個整合 ≥2 種模態
17
Modalities
資料模態總類
4
Domains
語言/影像/組學/序列
關鍵觀察: 自然語言 (natural language) 最常與其他模態配對,逐漸成為跨資料類型的「連接介面 (connective interface)」。
03 · Architecture

編碼器架構占主導

Encoder-based 編碼器114 · 51.8%
Mixed 混合架構67 · 30.5%
Decoder-based 解碼器31 · 14.1%
Non-Transformer (e.g. Mamba)3.6%
解碼器較少的原因: 文字生成任務需高品質 image–text 標註配對,在生醫領域取得困難。
04 · Evaluation gap

評估方式仍偏單一

Classification 分類50.9%
Report generation 報告生成10.9%
Question answering 問答8.6%
Segmentation 分割7.3%
! 評估缺口
缺乏多任務基準 (multitask benchmarks)、人在迴路評估 (human-in-the-loop) 與資料品質、可解釋性、轉譯相關性的綜合考量。
05 · Citation leaders

各領域引用王者

Natural language
BioBERT 6,925 · MultiMedQA 3,707 · PubMedBERT 2,278
Imaging & signals
UNI 1,141 · ConVIRT* 1,003 · MedCLIP* 794
Omics 組學
scGPT 846 · Geneformer 836 · scBERT 509
Molecular sequences
ESM-1b 2,807 · ProtTrans 1,207 · DNABERT 1,051
* 標示為多模態模型。應用對應臨床知識萃取、藥物發現、數位病理等高影響領域。
06 · Post-2025 risers

2025 後新興引用領跑者

模型領域引用
BiomedCLIP*影像 + 語言498
Quilt-1M*病理 + 語言216
ESM3蛋白質序列201
Evo-2DNA / RNA197
Borzoi分子序列190
MedGemma-27B自然語言165
Nicheformer*組學 omics81
OmiCLIP*影像 + 組學58
* 多模態。新興引用增長明顯由「整合異質資料模態」的模型推動,而非單一資料類型專家。
07 · Underexplored

尚未充分發展的整合方向

+ 機制可解釋性潛力
自然語言 ↔ 分子序列、自然語言 ↔ 組學: 用語言介面協助 scRNA-seq 註解、通路富集 (pathway enrichment)、空間轉錄體 (spatial transcriptomics)。
+ 治療標的發現
影像 ↔ 組學整合 (尤其 H&E 病理 ↔ omics) 仍偏弱,但連結組織形態與分子機制潛力大。
+ 跨調控層次
DNA / RNA / 蛋白質 / 表觀基因組 (epigenomic) 連結度有限,尤其蛋白質與其他模態。
x 主要瓶頸
非概念缺乏,而是: 配對資料稀少、預處理/標註標準不一、缺乏標準化多模態基準。
08 · Outlook

高採用因素與未來展望

+對應高影響應用: 臨床語言處理、蛋白質建模、數位病理
+評估嚴謹度: 多元下游任務測試提升信任與重用
+可近用性: 公開預訓練權重、程式碼、易用介面
+新關鍵: 與 agent-based AI 工作流整合相容性
! 待解難題
資料品質、世代多樣性 (cohort diversity)、批次效應 (batch effects)、隱私安全、幻覺 (hallucination)、對抗穩健性 (adversarial robustness) 仍限制真實場景部署。
建議: 跨領域協作 (生物學家 × 臨床醫師 × 模型開發者) + 高效微調強預訓練骨幹 (efficient adaptation) 取代從頭訓練。