2023 年 Advances in Nutrition 發表的一篇 GRADE 統合分析(PMID: 36130103)納入 26 項隨機對照試驗、1,831 名心臟代謝疾病患者,報告輔酶 Q10(CoQ10)補充平均降低收縮壓 4.77 mmHg。更引人注意的是其亞群分析:糖尿病與高血脂患者的收縮壓降幅更大。這類「某亞群更顯著」的結果在保健品宣傳中經常被放大引用,但亞群分析(subgroup analysis)在統計學上是一個需要謹慎處理的工具。本文以 meta-004 為例,說明子群分析的方法學原則。
什麼是子群分析,為何需要?
子群分析指的是將研究樣本依據某個特徵(例如年齡、性別、疾病類型、基線血壓)切分為多個子集,分別估計各子集中的介入效果。其目的是回答:「這個介入在所有人身上效果一致嗎?還是在某些族群更有效?」在統合分析中,子群分析通常以「亞群效應(subgroup effect)」呈現,透過交互作用檢定(test for interaction)判斷差異是否達到統計顯著。
以 meta-004 為例,作者除了報告整體效果外,還依據疾病類型(糖尿病、代謝症候群、高血脂、高血壓)、劑量範圍、介入時間等進行亞群切分。這類資訊有助於臨床醫師判斷「哪種病人可能最受益」,但前提是方法學必須嚴謹。
預先設定 vs 事後分析:差異在哪?
方法學上最關鍵的一條分界線,是子群分析屬於「預先設定(pre-specified)」還是「事後分析(post-hoc)」。預先設定指的是在資料分析開始前,研究者已在研究計畫書(protocol)或統合分析註冊(例如 PROSPERO)中明確列出要做哪些子群比較、依據什麼假設。事後分析則是看到資料後才決定切分。
兩者的差異並非形式問題,而是推論強度的根本差異。事後分析容易落入「資料探索偏差」:研究者會無意識地挑選顯示差異的切分方式、忽略不顯示差異的切分。這使得統計檢定的第一型錯誤率(偽陽性)遠高於名義上的 5%。Cochrane 手冊明確建議,事後子群分析結果應被視為「探索性」而非「驗證性」,並需在後續獨立研究中再現。
多重檢定校正為什麼重要?
假設一份統合分析進行 10 組子群比較,每組使用 α=0.05 作為顯著水準。在虛無假設都成立的情況下,至少出現一個偽陽性的機率為 1−(1−0.05)^10 ≈ 0.40。也就是說,即便 CoQ10 對任何亞群都沒有額外效果,單純靠運氣也有四成機率會看到「某個亞群顯著」。
為了控制這種家族錯誤率(family-wise error rate),統計學提供了 Bonferroni、Holm、Hochberg 等校正方法,也有控制偽發現率(FDR)的 Benjamini-Hochberg 程序。然而,在營養介入的統合分析中,這類校正並未普遍實施。讀者在解讀亞群差異時,應自行考量比較次數,並對未校正的 P 值保持保守態度。
如何檢視 meta-004 的亞群結果?
meta-004 報告糖尿病與高血脂患者收縮壓降幅更顯著,這個發現是否可信?我們可以從幾個問題切入檢視:
- 是否預先設定? 論文方法段描述依照疾病類型進行子群分析,但未明確說明是否於 PROSPERO 註冊中預先宣告。若讀者希望判斷證據強度,可至 PROSPERO 查詢該統合分析的原始計畫書。
- 交互作用檢定結果? 真正支持「亞群差異存在」的統計證據,不是各亞群各自的 P 值,而是亞群間的交互作用 P 值(test for subgroup differences)。單看糖尿病組 P<0.05 並不足以宣稱糖尿病患者「比其他族群更受益」。
- 生物學合理性? CoQ10 參與粒線體能量代謝與內皮功能調節,糖尿病患者普遍存在氧化壓力升高與內皮功能異常,理論上可能對 CoQ10 反應較強。生物學合理性可作為亞群差異可信度的旁證,但不能取代預先設定的檢定。
- 劑量效應的一致性? meta-004 報告 100–200 mg/天呈現 U 型劑量反應(P_nonlinearity=0.004)。若亞群差異是真實的,理想上應觀察到在該劑量區間內各亞群的反應一致。
專家與學會怎麼看?
Cochrane Handbook for Systematic Reviews of Interventions(第 10 章)指出,子群分析應「預先設定、數量有限、生物學可解釋」,並強調「應使用交互作用檢定而非各亞群分別檢定」。PRISMA 2020 聲明同樣要求作者明確報告哪些子群分析是預先設定、哪些是事後探索。
國際營養精神醫學研究學會(ISNPR)在評估營養介入試驗時,一貫強調證據分層(evidence tiering)——亞群發現屬於「假設生成(hypothesis generating)」層級,需要後續設計專門針對該亞群的前瞻性 RCT 來驗證,才能提升至「假設驗證」層級。美國心臟協會(AHA)於 2017 年科學聲明中亦指出,在心血管營養介入的統合分析中,亞群差異常見但重現性有限,臨床決策不應單獨依賴單一統合分析的亞群結果。
對讀者與臨床的意涵是什麼?
回到 meta-004 的實際結論:整體 1,831 名心臟代謝疾病患者收縮壓平均下降 4.77 mmHg,劑量最佳區間為 100–200 mg/天,介入 >12 週效果較佳,這些屬於主要分析(primary analysis)的結果,證據強度為中等(GRADE 評級)。亞群分析中糖尿病與高血脂患者降幅更顯著,則屬於次要發現,應視為「未來研究方向」而非「臨床分層依據」。
對保健品消費者而言,這意味著看到「某研究顯示 X 疾病族群效果更好」時,應追問三個問題:這是預先設定還是事後發現?交互作用檢定結果如何?是否有獨立研究重現?對臨床工作者而言,則需將亞群結果與該族群的獨立 RCT 資料合併評估,而非直接外推。
方法學素養並非為了否定研究結果,而是為了讀懂研究想告訴我們什麼——以及它還沒告訴我們什麼。
Key Facts
- meta-004(PMID 36130103)納入 26 RCT、1,831 人,報告 CoQ10 降收縮壓 4.77 mmHg(95% CI: −6.57, −2.97)。
- 最佳劑量 100–200 mg/天,呈 U 型劑量反應(P_nonlinearity=0.004)。
- 亞群分析顯示糖尿病與高血脂患者降幅更大,但屬次要發現。
- 子群分析應預先設定並使用交互作用檢定,事後分析僅為假設生成。
- 未校正多重檢定時,10 次子群比較的偽陽性率可達 40%。