A-
A+
Nature Biotechnology · 2026.04
生醫基礎模型崛起趨勢
220 個 Biomedical Foundation Models 全景分析
作者 Chang, Cheng, Modi, Wang, Xu & Ma
原文 →
doi.org/10.1038/s41587-026-03135-y
01 · Background
何謂生醫基礎模型
→
大規模機器學習模型 (large-scale ML),訓練於多元生醫與臨床資料
→
資料涵蓋: 基因序列、分子剖析 (molecular profiling)、生醫影像、電子病歷 (EHR)
→
學習通用表徵 (generalizable representations) 以支援下游發現與臨床應用
→
調查涵蓋 4 大領域: 自然語言、影像訊號、組學 (omics)、分子序列
本研究排除 ChatGPT、Gemini、Claude 等通用 LLM,聚焦 220 個生醫專屬模型,發展時間跨度 4 年。
02 · Big picture
從單模態走向多模態
220
Curated models
過去 4 年累積
53.6%
Multimodal
118 個整合 ≥2 種模態
17
Modalities
資料模態總類
4
Domains
語言/影像/組學/序列
關鍵觀察: 自然語言 (natural language) 最常與其他模態配對,逐漸成為跨資料類型的「連接介面 (connective interface)」。
03 · Architecture
編碼器架構占主導
Encoder-based 編碼器
114 · 51.8%
Mixed 混合架構
67 · 30.5%
Decoder-based 解碼器
31 · 14.1%
Non-Transformer (e.g. Mamba)
3.6%
解碼器較少的原因: 文字生成任務需高品質 image–text 標註配對,在生醫領域取得困難。
04 · Evaluation gap
評估方式仍偏單一
Classification 分類
50.9%
Report generation 報告生成
10.9%
Question answering 問答
8.6%
Segmentation 分割
7.3%
! 評估缺口
缺乏多任務基準 (multitask benchmarks)、人在迴路評估 (human-in-the-loop) 與資料品質、可解釋性、轉譯相關性的綜合考量。
05 · Citation leaders
各領域引用王者
Natural language
BioBERT
6,925
· MultiMedQA
3,707
· PubMedBERT
2,278
Imaging & signals
UNI
1,141
· ConVIRT*
1,003
· MedCLIP*
794
Omics 組學
scGPT
846
· Geneformer
836
· scBERT
509
Molecular sequences
ESM-1b
2,807
· ProtTrans
1,207
· DNABERT
1,051
* 標示為多模態模型。應用對應臨床知識萃取、藥物發現、數位病理等高影響領域。
06 · Post-2025 risers
2025 後新興引用領跑者
模型
領域
引用
BiomedCLIP*
影像 + 語言
498
Quilt-1M*
病理 + 語言
216
ESM3
蛋白質序列
201
Evo-2
DNA / RNA
197
Borzoi
分子序列
190
MedGemma-27B
自然語言
165
Nicheformer*
組學 omics
81
OmiCLIP*
影像 + 組學
58
* 多模態。新興引用增長明顯由「整合異質資料模態」的模型推動,而非單一資料類型專家。
07 · Underexplored
尚未充分發展的整合方向
+ 機制可解釋性潛力
自然語言 ↔ 分子序列、自然語言 ↔ 組學: 用語言介面協助 scRNA-seq 註解、通路富集 (pathway enrichment)、空間轉錄體 (spatial transcriptomics)。
+ 治療標的發現
影像 ↔ 組學整合 (尤其 H&E 病理 ↔ omics) 仍偏弱,但連結組織形態與分子機制潛力大。
+ 跨調控層次
DNA / RNA / 蛋白質 / 表觀基因組 (epigenomic) 連結度有限,尤其蛋白質與其他模態。
x 主要瓶頸
非概念缺乏,而是: 配對資料稀少、預處理/標註標準不一、缺乏標準化多模態基準。
08 · Outlook
高採用因素與未來展望
+
對應高影響應用
: 臨床語言處理、蛋白質建模、數位病理
+
評估嚴謹度
: 多元下游任務測試提升信任與重用
+
可近用性
: 公開預訓練權重、程式碼、易用介面
+
新關鍵
: 與 agent-based AI 工作流整合相容性
! 待解難題
資料品質、世代多樣性 (cohort diversity)、批次效應 (batch effects)、隱私安全、幻覺 (hallucination)、對抗穩健性 (adversarial robustness) 仍限制真實場景部署。
建議: 跨領域協作 (生物學家 × 臨床醫師 × 模型開發者) + 高效微調強預訓練骨幹 (efficient adaptation) 取代從頭訓練。