統合分析(meta-analysis)的核心結論,往往只用一個 Hedges' g 或勝算比呈現,但這個數字有多「穩健」(robust),取決於研究者所做的敏感性分析(sensitivity analysis)。本文以 Tsai 等人 2022 年發表於 Frontiers in Pharmacology 的 CoQ10 抗疲勞統合分析(PMID: 36091835)為範例,拆解敏感性分析的三個層次:偏差風險排除、固定效應對隨機效應模型選擇,以及納入標準調整,並討論單方與複方配方對比如何揭示結論的邊界。
什麼是敏感性分析,為什麼它決定結論的可信度?
敏感性分析是一種「如果我拿掉這筆,結論還站得住嗎?」的壓力測試。在統合分析中,研究者先合併所有符合納入條件的 RCT,得到一個主要效應量;接著系統性地改變納入條件或分析模型,觀察效應量與統計顯著性是否改變。當結論在多種情境下仍保持一致,我們稱之為穩健;若只要拿掉某一筆研究,顯著性就消失,則結論的解釋必須保守。
Tsai 等人的統合分析納入 13 項 RCT,共 1,126 名受試者,橫跨纖維肌痛、多發性硬化症、Statin 相關疲勞、慢性疲勞症候群等多種疾病情境。主要結果顯示 CoQ10 相較安慰劑可顯著降低疲勞評分(Hedges' g = -0.398, 95% CI: -0.641 至 -0.155, p = 0.001),屬於小至中等效應量。若只看這一行數字,讀者無從判斷這個結論是否脆弱;敏感性分析的價值,就在於把「數字背後的不確定性」攤開。
排除高偏差風險研究後,效應量會怎麼變?
Cochrane 風險偏差工具(RoB 2)是目前 RCT 品質評估的國際標準,把每項研究依隨機分派、盲化、結果測量等面向分為低、不清楚、高風險三級。統合分析的第一層敏感性分析,通常是「只保留低風險研究,重算效應量」。若效應量維持、方向一致且仍具統計顯著性,代表結論不是靠幾筆品質較差的研究撐起來的。
在 CoQ10 疲勞統合分析中,作者回報了研究品質分布,並以 leave-one-out(逐一排除)方式檢查是否有單一研究主導整體結論。這種做法的合理性在於:若某一項研究樣本數特別大,或效應量特別極端,它對合併結果的權重就會特別高。當逐一排除後效應量的變化幅度有限、95% CI 未跨越零點,就可以判斷結論不是由單一研究「帶動」。這是讀者閱讀統合分析時最應該留意的一個段落,遠比「主要結果顯著」那一行重要。
固定效應 vs 隨機效應:兩種模型差在哪?
統合分析有兩種主要的合併模型。固定效應模型(fixed-effect model)假設所有納入研究的真實效應量是同一個,研究間差異只是抽樣誤差;隨機效應模型(random-effects model)則假設每項研究反映的是從一個效應量分布中抽出的樣本,允許真實效應量在不同研究間有差異。當納入研究在族群、劑量、追蹤時間上異質性高時,隨機效應模型較合適。
CoQ10 疲勞統合分析納入的研究涵蓋多種疾病、劑量從 100 到 300 mg/天、追蹤 4 到 24 週不等,I² 異質性指標通常偏高,因此作者採用隨機效應模型作為主要分析。敏感性分析中再以固定效應模型重算,若兩者效應量方向一致、大小相近,代表模型選擇對結論影響有限。反之,若兩者差異很大,通常意味著研究間存在真正的異質性來源,需要進一步次群組分析來解釋。
單方與複方配方對比,揭示了什麼?
這份統合分析最具方法學啟發性的環節,是將納入研究分為「CoQ10 單方」與「CoQ10 複方」兩組分別計算。結果顯示,單方配方組的疲勞改善達統計顯著,複方配方組則未達顯著。這個分層分析同時扮演兩個角色:一是次群組分析(subgroup analysis),二是另一種形式的敏感性檢驗。
作者推測,複方未達顯著的可能原因是複方產品中 CoQ10 劑量通常較低,與其他成分共同分配總劑量預算。這個觀察帶出一個重要的方法學訊息:當統合分析把「介入是否包含 CoQ10」當成納入條件時,結論可能被低劑量複方產品稀釋;若改以「CoQ10 劑量達到某一閾值」作為納入標準,效應量可能會提高。這就是納入標準調整型的敏感性分析——它不是在事後挑選資料,而是在事前明確界定「我們真正想回答的 PICO 問題是什麼」。
劑量與療程次群組,為何效應量越大?
Tsai 等人進一步報告,每日劑量越高、補充期間越長,疲勞改善幅度越明顯。這類劑量—反應(dose-response)次群組分析,是敏感性分析之外另一條檢驗穩健性的途徑。若高劑量組的效應量大於低劑量組、長療程大於短療程,且方向一致,代表觀察到的效應與生物機制預期吻合,可降低「結果來自隨機波動或發表偏差」的疑慮。
不過,讀者仍需注意:次群組分析本質上是觀察性的,並未隨機分派受試者到不同劑量,因此只能作為支持性證據,不能直接作為最佳劑量的證明。在 CoQ10 的臨床應用脈絡下,單方配方、≥200 mg/天、持續至少 8 週的設計,是目前證據較為集中的範圍;實際使用仍應依個別健康狀況與醫療建議調整。
專家與學會怎麼看?
Cochrane Collaboration 在 Cochrane Handbook for Systematic Reviews of Interventions 中明確指出,敏感性分析應在統合分析的分析計畫中事先規劃,至少涵蓋研究品質、模型選擇與納入標準三個面向。美國國家衛生研究院(NIH)的系統性回顧指引也強調,若主要結果與敏感性分析結果不一致,作者應在討論中明確交代,讓讀者判斷證據強度。就 CoQ10 抗疲勞議題而言,目前尚無主要學會發布正式臨床指引,臨床使用多見於輔助治療建議,讀者在引用時應同時呈現主要效應量與敏感性分析結果,避免只引用最顯著的那一行數字。
讀者如何在閱讀統合分析時自我檢核?
一篇統合分析是否值得信賴,除了看 PRISMA 檢核表是否完整,更實用的做法是翻到「敏感性分析」段落並問三個問題:第一,排除高偏差風險或 leave-one-out 後,效應量是否仍具統計顯著性?第二,固定效應與隨機效應模型的結果是否一致?第三,次群組分析是否揭示了納入研究的異質性來源?在 CoQ10 疲勞統合分析中,這三個問題的答案大致正面,但單方與複方配方的分歧,提醒我們「CoQ10 有效」這個陳述的邊界——它比較接近「單方 CoQ10 在足夠劑量下可能有助於疲勞改善」這樣的精確敘述。
本文重點是什麼?
敏感性分析是統合分析的可信度核心;CoQ10 疲勞統合分析透過排除偏差、模型對比與單複方分層,呈現了一個穩健但有邊界的結論——這正是讀者應該期待每一篇統合分析都做到的透明度。