AI 老藥新用自動化系統:
以鐮刀型紅血球症 (SCD) 為例

#AI製藥 #DualRAG #DrugRepurposing #SCD
核心流程概述

從疾病輸入到最終實驗室指南,透過雙軌 AI 與物理模擬,在限定的「已核准老藥資料庫」中尋找最佳處方,並具備自動修正的容錯機制。本流程的核心在於透過已知安全性的藥物,尋找治療新疾病的捷徑。

解決目前的研發痛點

1. 研發成本與時間的無底洞

傳統新藥開發需耗時 10-15 年、動輒數十億美金,且失敗率超過 90%。本系統鎖定老藥,將研發時程壓縮至 2-3 年,開發成本大幅降低。

2. 安全性與毒性的不確定性

許多新藥在進入臨床一期後才發現對人體有毒。老藥具備數十年的安全性數據,讓系統能直接跨過「試毒」風險,直奔治療目標。

3. 天價藥物的可及性問題

如基因療法等頂尖技術雖然強大,但昂貴的價格與嚴苛的移植條件讓病患看得到吃不到。系統藉由老藥組合,提供成本極低且易於配送的解方。

4. 隱藏機轉的發現盲區

醫學知識過於龐大碎片化,人類科學家難以連結不同疾病間的跨界隱藏關係。系統透過雙軌 AI 引擎,自動挖掘原本沒人發現的「脫靶」治療捷徑。


階段 1:精準標靶定義與初步藥物映射 (Target identification)

graph TD
    A["疾病輸入: SCD"] --> B["深度解析: 疾病 4 階段病理"]
    B --> C["戰術放棄: 基因療法"]
    B --> D["鎖定三大防禦標靶:
HbF / HbS / P-選擇素"] C & D --> E["Graph RAG: 大量檢索 FDA 專利與老藥"] E --> F["建構標靶候選池 (Target Cluster)"] F --> G["多維度初步過濾:
1.臨床證據 2.毒性"] G --> H["傳遞精篩候選數據至階段 2"] style A fill:#000,stroke:#39ff14,color:#fff style C fill:#221111,stroke:#ff5555,color:#ff5555,stroke-dasharray: 5 5 style F fill:#112211,stroke:#a0ff8a,color:#a0ff8a style G fill:#112211,stroke:#a0ff8a,color:#a0ff8a style H fill:#000,stroke:#39ff14,color:#fff,stroke-dasharray: 5 5

目標:明確疾病核心標靶,並初步劃定屬性相符的老藥範圍,為後續的過濾漏斗提供原始清單。

  • 1. 疾病輸入與深度解析:
    • 系統接收目標疾病,如「鐮刀型紅血球症 (SCD)」。
  • 2. 尋找「治病關鍵點」:
    • AI 透過醫學文獻追查,確認源頭為 HBB 基因突變影響血紅素聚合。
    核心校正策略

    系統判定目前的技術環境下,修改 DNA 本身(基因編輯)風險過高且昂貴。因此 AI 將目標轉向「瑕疵血紅素蛋白質」以及引發血管發炎的下游蛋白質(如 P-選擇素),將其定為主要攻擊標靶。

  • 3. 基於標靶檢索 FDA 藥庫:
    • Graph RAG 介入: 系統利用知識圖譜,針對鎖定的三大標靶(HbF、HbS、P-選擇素),在 FDA 核准老藥庫中尋找所有能對這三個標靶產生作用的老藥。這確保了後續篩選的「原材料」兼具科學性與安全性。
  • 4. 建立標靶候選池 (Target Cluster) 與初步評分:
    • AI 動作: GraphRAG 將撈出的藥物放進「候選池」中。此步驟的核心在於「窮舉並精選」:利用 AI 算力在秒級內篩出所有具備潛力、可用且臨床有效的藥物,並立即根據以下兩大指標進行內部打分與初步淘汰:
    💡 1. 現實證據權重 (Real-World Evidence Weight)

    AI 考量: 這款藥提升標靶的效果,是只有在「老鼠細胞」上看到,還是已經有 20 年的「人體真實病歷」支持?
    實戰判斷: 羥基脲 (Hydroxyurea) 擁有超過 30 年的 SCD 臨床數據,證據力滿分;而某些化療老藥可能只是在論文中被提到「具有潛力」,證據力就會被 AI 扣分。

    ☠️ 2. 安全性與毒性邊界 (Toxicity Tolerance)

    AI 考量: 為了達到刺激 HbF 的有效濃度,這款藥的副作用會不會先殺死病人?
    實戰判斷: 地西他濱 (Decitabine) 雖能強效提升 HbF,但本質是治療骨髓增生不良症候群的強烈藥物,具高骨髓抑制毒性。AI 會因其毒性過高而降低推薦順位。

疾病病理 4 階段拆解與 AI 立體防禦佈局

什麼是「標靶 (Molecular Target)」?

指的是為了解決疾病現象,藥物必須精準結合的那個「具體分子或蛋白質」。

階段 (面臨的問題) 🔬 具體的「生物標靶」(Target) 💊 解決此標靶的對應藥物
1. 基因寫錯了 (源頭突變 - 成本太高,直接戰術性放棄) HBB 基因 (DNA 層級) Casgevy (基因編輯)
2. 壞蛋白質太多 (濃度問題) HbF (胎兒血紅素生成路徑) 羥基脲 (Hydroxyurea)
3. 蛋白質結塊變硬 (物理聚合) HbS 蛋白質的黏性斑塊 Voxelotor (小分子標靶藥)
4. 血管沾黏發炎 (微血管阻塞) P-選擇素 (P-selectin) 等發炎蛋白 AI 找出的「心血管老藥」
病理階段 1:源頭設計圖錯誤 (DNA 基因層級)

面臨問題: HBB 基因突變,導致身體只會製造帶有黏性斑塊的瑕疵血紅素 (HbS)。
治療策略: 【釜底抽薪】直接修改基因,換一份正確的設計圖 (如 Casgevy 或 Lyfgenia/BB305)。
💡 AI 戰略 (戰術放棄): 這階段的療法動輒數百萬美金且無法口服。我們的「老藥新用引擎」會刻意避開這個昂貴的戰場。

病理階段 2:零件製造期 (蛋白質表現層級)

面臨問題: 既然無法修改基因,能不能讓身體「重啟」另一套備用基因,稀釋掉壞的血紅素?
治療策略: 【備用替換】喚醒人體嬰兒時期的「胎兒血紅素 (HbF)」,降低血液中 HbS 黏性斑塊的濃度。
💊 代表藥物: 羥基脲 (Hydroxyurea)。這是一款具備奇效的老字號化療藥,目前為 SCD 的一線用藥。

病理階段 3:物理聚合反應 (分子結構層級)

面臨問題: 瑕疵血紅素 (HbS) 在缺氧時會互相結合變成堅硬的長條纖維,準備撐破細胞。
治療策略: 【源頭防結塊】派出小分子藥物,像蓋子一樣死死卡住 HbS 的「怕水黏性斑塊」,不讓它們結塊。
🎯 代表藥物: Voxelotor (本系統 3D 分子對接階段完美示範的標靶藥物)。

病理階段 4:骨牌倒塌的終點 (細胞與血管層級)

面臨問題: 鐮刀細胞已經形成,並把血管刮傷發炎,引發大量 P-選擇素 等黏著蛋白,導致微血管大塞車與劇痛。
治療策略: 【疏通與抗發炎】在血管壁塗一層潤滑油(抑制黏著蛋白),強力壓制發炎反應,不引發塞車。
🤖 標靶目標: Crizanlizumab,或是 AI 的 GraphRAG 系統即將找出的「強效心血管/抗發炎老藥」。

為何單一藥物很難治好 SCD? (AI 聯合用藥的價值)
  • 如果只吃 「階段 4:抗發炎藥」,病人雖然不痛了,但紅血球還是鐮刀狀,依然會提早破裂導致貧血(治標不治本)。
  • 如果只吃 「階段 2:羥基脲」,有些病人的胎兒血紅素濃度就是拉不高,依然會發病。
🏆 AI 的「黃金組合」立體防禦 本系統的真正價值,在於利用 GraphRAG 與多智能體辯論,自動配對出:
病理階段 2 (羥基脲)  +  病理階段 3 (Voxelotor)  +  病理階段 4 (AI 找出的黑馬老藥)
在多個骨牌節點上同時設立防線,這就是不可被攻破的立體防禦,也是我們將數據送入階段 2 進行「4 大漏斗過濾」的核心動機。

階段 2:AI 聯合用藥 4 大過濾漏斗 (Combination Discovery)

graph TD
    A["接收疾病標靶 (來自階段 1)"] --> B["第一層:機制互補過濾"]
    B --> C["第二層:代謝避險過濾"]
    C --> D["第三層:圖譜協同預測"]
    D --> E["第四層:LLM 語意推理評分"]
    E --> F["輸出: Top 10 黃金組合候選人"]
    F --> G["進入階段 3 (物理驗證)"]

    style A fill:#000,stroke:#39ff14,color:#fff
    style E fill:#09090b,stroke:#ffb86c,color:#ffb86c
    style F fill:#000,stroke:#39ff14,color:#fff
                    

目標:運用四層遞進式過濾,從數百萬種藥物組合中精確鎖定具備強力協同作用且低毒性的「黃金配方」。

第一層:機制互補 (Mechanistic Complementarity)

邏輯: 如果兩款藥都是「消炎藥」,把它們加在一起只是徒增肝臟負擔,不如直接把其中一款的劑量加倍。AI 在挑選時,會嚴格要求 A 藥與 B 藥必須攻擊不同的生物機制。

SCD 實戰: AI 會拿一款「阻止血紅素結塊的藥」去配對一款「防止血管壁沾黏的藥 (如 P-選擇素抑制劑)」。這叫立體防禦

第二層:代謝避險 (Metabolic Avoidance)

邏輯: 絕對不共用「同一條高速公路」。如果 A 藥跟 B 藥都需經過 CYP3A4 收費站,就會導致交互作用 (DDI) 毒性。

AI 動作: 在計算任何療效前,AI 會先秒速掃描這 450 萬種組合的「代謝路徑」。只要發現共用同一個主要酵素,直接淘汰。

第三層:圖譜協同預測 (Graph-based Synergy Prediction)

這是 GraphRAG 真正發威的地方。 AI 透過知識圖譜觀察 A 藥與 B 藥的「下游影響蛋白質」。

AI 動作: 如果圖譜顯示,A 藥的某個微小副作用,剛好能「放大」B 藥的吸收率,或者它們在生物網狀通路中形成了包圍網,AI 就會給這個組合極高的「潛在協同分數」。

第四層:LLM 語意推理評分 (Internal Reasoning Process)
核心精神: LLM 在這裡扮演「虛擬醫學評審委員會」,根據硬數據寫出具有說服力的藥理推論,確保決策具備可解釋性 (Explainability)
graph TD
    A["候選組合 (數百種)"] --> B["步驟 1: RAG 數據封裝
(Data Grounding)"] B --> C["步驟 2: 思維鏈推演
(Chain of Thought)"] C --> D["步驟 3: 多智能體辯論
(Multi-Agent Debate)"] D --> D1["正方: 尋找協同潛力"] D --> D2["反方: 專抓毒性與漏洞"] D1 & D2 --> E["步驟 4: 權重結算與防呆"] E --> F{"邏輯自洽?"} F -->|否| G["剔除組合"] F -->|是| H["給出最終 Synergy Score"] H --> I["輸出 Top 10 黃金名單"] style D1 fill:#112211,stroke:#39ff14,color:#fff style D2 fill:#221111,stroke:#ff5555,color:#fff style I fill:#000,stroke:#39ff14,color:#fff
步驟 1 & 2:數據封裝與 CoT

將圖譜路徑、代謝清單、FDA 文獻打包成 Prompt。強制 LLM 在給分前必須先回答 A/B 藥物對疾病網路的影響力,防止 AI 產生醫學幻覺。

步驟 3 & 4:紅藍軍對抗與結算

正方 (研發專家) 負責看好協同效果;反方 (毒理專家) 負責挑剔邏輯漏洞。透過對抗確保高分結果並非 AI 盲目樂觀。

⭐ 企劃亮點:這 10 組「黃金候選人」將被送往階段 3 進行高算力 3D 驗證。

階段 3:物理驗證與安全性篩選 (避開地雷)

graph TD
    A[推薦療法組合] --> B[3D 分子對接]
    B --> C{結合力檢驗}
    C -->|不合格| D[淘汰]
    C -->|及格| E[PK/PD 模擬]
    E --> F{吸收與劑量風險}
    F -->|超標/無效| D
    F -->|安全有效| G[通過篩選]
    
    style G fill:#000,stroke:#39ff14,color:#fafafa
    style D fill:#000,stroke:#ff5555,color:#ff5555
    style C fill:#09090b,stroke:#ffb86c,color:#ffb86c
    style F fill:#09090b,stroke:#ffb86c,color:#ffb86c
                    

目標:透過 3D 模擬確認藥物與標靶的物理契合度,並排除因劑量或吸收問題而無效的藥物。

  • 1. 3D 分子對接測試 (Molecular Docking):
    • 結構獲取:PDB (Protein Data Bank) 獲取標靶蛋白質結構,或使用 AlphaFold2 進行預測,並定義「活性口袋 (Binding Site)」。
    • 物理模擬: 使用 AutoDock VinaSchrödinger 等工業級工具,模擬藥物分子在口袋中的數千種轉與對接姿勢。
    • 數據篩選: 計算 結合能 (Binding Energy),數值越低(通常低於 -7.0 kcal/mol)代表藥物與標靶結合力越強、潛在療效越高。
  • 2. 藥代動力學與毒性測試 (ADMET):
    • 吸收路徑 (Absorption): 模擬藥物穿透 Caco-2 細胞壁的能力,確保口服有效性。
    • 代謝與排泄 (M/E): 評估是否會抑制 CYP450 酵素(可能導致與其他藥物衝突)或具有過短的半衰期。
    • 毒性預測 (Toxicity): 使用 ProTox-III 或 ADMETlab 預測是否具有 hERG (心臟毒性)、Ames (致突變性) 或 DILI (藥物誘發性肝損傷) 風險。
成本分析:極低 (Low Cost)

相較於傳統濕實驗室(買藥、請人、進實驗室),本階段僅消耗 GPU/CPU 算力。單次藥物模擬的成本僅為實體實驗的 1/1000 甚至更低。

戰略價值:極高 (High Value)

核心目標是「Fail Fast, Fail Cheap」。在進入昂貴的實驗階段前過濾掉 90% 的無效候選藥物,是精準醫療節流的關鍵。

比賽演示策略:模擬數據應用 (MVP Mock Data Strategy)

考慮到比賽現場的運算時空限制與穩定性,本系統在 階段 3 採用「預運算模擬資料庫」。Agent 會模擬調用對接引擎,並從資料庫中檢索該藥物歷史上的對接表現,以確保演示過程流暢且邏輯閉環。

{ "drug_id": "DRUG_0812", "name": "Voxelotor", "target": "HbS", "status": "PASS", "metrics": { "binding_energy": "-8.4 kcal/mol", "herg_toxicity": "Low", "lipinski_rule": "Verified", "absorption": "High (92%)" }, "simulation_source": "Pre-computed Vina Database" }
執行本階段所需資源 (Infrastructure Requirements):
  • 運算硬體: 高性能 CPU (如 32-core+) 或 GPU 節點 (A100/H100) 用於平行對接。
  • 軟體套件: AutoDock Vina (開源)、Openbabel、RDKit 或是專業的 Schrödinger 套件。
  • 關鍵數據: PDB 蛋白質結構檔 (或 AlphaFold 預測模型)、藥物分子 SMILES 代碼。
  • 專業技術: 具備計算化學 (Computational Chemistry) 或生物資訊背景的 AI 工程師。

階段 4:AI 的自動應變與轉彎機制

graph TD
    A{"是否全數淘汰?"} -->|否| B["進入最終階段"]
    A -->|是| C["啟動自動應變"]
    C --> D["劑型改良建議: 奈米膠囊"]
    C --> E["目標降級: 緩解痛苦"]
    D --> F["重回驗證流程"]
    E --> F
    
    style C fill:#221111,stroke:#ff5555,color:#fff
    style A fill:#09090b,stroke:#ffb86c,color:#ffb86c
                    

目標:若現有藥物清單全數淘汰,AI 會自動啟動替代方案,不會讓研發中斷。

  • 門檻檢查與修正程序:
    • 劑型改良建議: 若藥物因吸收問題被剔除,AI 會提出改進建議,例如將藥物包覆於奈米膠囊中以繞過胃部。
    • 目標降級: 若無法完全治本,AI 將自動調整搜尋目標為「最大化緩解病患血管痛楚」,優先改善生活品質。

階段 5:最終報告與具體實驗指南

graph TD
    A["通過篩選藥物"] --> B["整合數據"]
    B --> C["最終報告"]
    C --> D["勝出清單"]
    C --> E["3D 效能數據"]
    C --> F["實驗指南"]
    F --> G["實驗室落地執行"]
    
    style C fill:#000,stroke:#39ff14,color:#fafafa
    style G fill:#112211,stroke:#39ff14,color:#fafafa
                    

目標:將繁複的 AI 運算結果整合為可立即執行的醫療或藥研文件。

  • 報告內容:
    • 列出勝出的藥物名單、3D 結合效能數據以及真實世界的臨床證據。
    • 505(b)(2) 法規包,加速上市流程。