當你看到「統合分析顯示輔酶 Q10 有效」這類標題時，最容易被忽略的數字不是 p 值，而是 I²。這個百分比代表研究之間的「異質性」（heterogeneity）——簡單說，就是納入分析的各篇研究彼此吵得有多兇。I² 越低，代表研究結論越一致、越可以放心把效果量推論到一般情境；I² 越高，代表研究之間存在無法解釋的差異，就算平均效果顯著，讀者也必須更謹慎地解讀。

什麼是 I²？為什麼它比 p 值更重要？

I² 是 Higgins 與 Thompson 於 2002 年提出的異質性量化指標，用來估計統合分析中「觀察到的變異」有多少比例來自研究之間的真實差異，而非隨機誤差。Cochrane Handbook 給出的經驗閾值是：I² 低於 25% 視為低異質性，25% 到 75% 為中等異質性，超過 75% 則屬高異質性。

這個指標的臨床意義在於：一個 p 值顯著但 I² 高達 80% 的統合分析，其實是在說「平均起來有效，但各研究結果差很大，我們不確定哪一群人、哪一種劑量、哪一種配方真的有效」。相反地，p 值顯著、I² 低於 25% 的結果，則代表不同研究團隊在不同情境下都得到相似結論，這種一致性本身就是高品質證據的一部分。

案例一：CoQ10 與疲勞——中度異質性怎麼讀？

2022 年發表於 Frontiers in Pharmacology 的一篇統合分析（Tsai IC et al., PMID 36091835）納入 13 項隨機對照試驗、共 1,126 名受試者，檢驗 CoQ10 補充對各類疾病相關疲勞的影響。結果顯示 CoQ10 組相較安慰劑組疲勞評分顯著降低（Hedges' g = -0.398, 95% CI: -0.641 至 -0.155, p = 0.001），屬於小到中等程度的效果量。

這類研究的異質性通常落在中等區間，原因很容易理解：納入的受試者涵蓋纖維肌痛、多發性硬化症、Statin 相關疲勞、慢性疲勞症候群等多種疾病背景，劑量從 100 到 300 mg/天不等，介入期間從 4 週到 24 週橫跨六倍差距。當臨床情境如此分歧，研究結果出現中等異質性反而是可預期的。

作者的處理方式值得參考：他們進行次群組分析，發現「單方 CoQ10 配方」減少疲勞達統計顯著，而「複方配方」則未達顯著。這項次群組差異很可能就是異質性的來源之一——複方產品中 CoQ10 劑量往往被稀釋到臨床有效閾值之下。此外，劑量越高、補充期間越長，疲勞改善越明顯，也進一步解釋了研究間的差異。這種「合理解釋異質性」的能力，才是一篇高品質統合分析的價值所在。

案例二：CoQ10 與血壓——低異質性的含義是什麼？

在 CoQ10 與血壓的統合分析中（如 meta-004 代表的一系列研究），典型的 I² 值往往落在低到中等區間。這種研究的受試者條件通常較為一致：多為原發性高血壓患者、介入劑量集中在 100–200 mg/天、追蹤期以 8–12 週為主。當母體族群與方法學趨於同質，研究結果自然比較接近。

低 I² 的統合分析有一個優點：研究者可以放心使用「固定效應模型」（fixed-effect model），假設所有研究都在估計同一個真實效果。這類結論的外推性較強，臨床指南也更容易把它轉化為建議。但讀者仍須留意：低異質性不等於「證據等級高」，若納入的研究本身品質偏低（例如樣本小、盲法不嚴），即使 I² 低，整體證據強度仍可能受限。

案例三：CoQ10 與血糖——高異質性的警訊是什麼？

相較之下，CoQ10 與血糖控制相關的統合分析（如 meta-006 代表的研究脈絡）常出現高異質性。原因並不難找：第二型糖尿病患者、代謝症候群族群、糖尿病前期受試者被混合納入；基線 HbA1c、病程長短、合併用藥差異巨大；CoQ10 劑量從 60 mg 到 300 mg 橫跨五倍。

當 I² 突破 75%，即便平均效果顯著，研究者也必須使用「隨機效應模型」（random-effects model），並且明確提醒讀者：這個平均值可能並不代表任何一個真實族群的預期反應。負責任的做法是進行預先設定的次群組分析，找出哪類受試者受益最大，或進行 meta-regression 試圖找出劑量反應關係。若研究者只報告一個籠統的平均效果、沒有探討異質性來源，讀者應對結論保持保留。

專家與學會怎麼看？

Cochrane Collaboration 在其《系統性回顧手冊》中明確指出，統合分析不是「把研究加總起來」，而是「評估研究能否合理合併」。手冊建議：當 I² 超過 50% 時，研究者應主動探討異質性來源；超過 75% 時，應重新考慮是否適合合併，或改以敘事性整合（narrative synthesis）呈現。

國際營養精神醫學研究學會（ISNPR）與多個臨床營養學會近年強調，閱讀營養補充品相關統合分析時，讀者應至少檢視三個方法學重點：異質性指標（I²）、是否進行次群組分析、是否執行發表偏誤檢驗（如 funnel plot 與 Egger's test）。這三項缺一不可，少了任何一項都會讓結論的可信度打折。

讀統合分析的實用檢查清單是什麼？

對於一般讀者與科學記者，以下四個問題可以幫助你快速評估一篇統合分析的品質：

第一，I² 是多少？落在哪個區間？若作者沒有報告 I²，這本身就是一個警訊。第二，作者如何解釋異質性？是訴諸受試者、劑量、期間的差異，還是完全略過不談？第三，次群組分析有無預先註冊？事後挖掘出來的「顯著次群組」可信度遠低於預先設定的分析。第四，效果量有多大？Hedges' g = 0.2 屬小效果、0.5 屬中等、0.8 屬大效果，臨床意義必須對照日常基準判讀。

回到 CoQ10 的三組案例：疲勞（中等異質性、單方效果優於複方）、血壓（低到中等異質性、結論較穩定）、血糖（高異質性、需審慎解讀）。同一種營養素在不同應用情境下的證據強度可以天差地別，而這份差距，正是 I² 這個看似冷僻的方法學指標在替我們守門。

結語：讓方法學成為閱讀習慣是什麼？

在資訊爆炸的健康新聞環境中，能讀懂一個 I² 數字的讀者，就能比多數人更精準地判斷一篇「研究顯示」的真實分量。科學是持續演進的過程，統合分析不是終點，而是一個階段性的綜合快照。下次看到 CoQ10 或任何營養補充品的統合分析時，不妨先把目光從 p 值移開，找一找那個被藏在表格角落的 I²——它會告訴你，這份結論有多值得你信任。

讀 CoQ10 統合分析前：先看懂 I² 異質性指標

什麼是 I²？為什麼它比 p 值更重要？

案例一：CoQ10 與疲勞——中度異質性怎麼讀？

案例二：CoQ10 與血壓——低異質性的含義是什麼？

案例三：CoQ10 與血糖——高異質性的警訊是什麼？

專家與學會怎麼看？

讀統合分析的實用檢查清單是什麼？

結語：讓方法學成為閱讀習慣是什麼？

參考來源

品質保證

延伸閱讀

網絡統合分析：為何 Q10 劑量比較需要 NMA

孟德爾隨機化如何檢驗 Q10 的因果效應？

貝氏統計如何改寫 Q10 meta-analysis 的證據詮釋？

Q10 研究還缺什麼？五大空白盤點