輔酶 Q10（CoQ10）的臨床試驗文獻中，絕大多數設計採用「優效性（superiority）試驗」架構——也就是比較 CoQ10 與安慰劑，試圖證明前者「比較好」。然而在當代臨床研究方法學中，另一種設計樣式「非劣效性（non-inferiority）試驗」同樣重要，卻在 Q10 領域幾乎缺席。這篇文章從 Q-SYMBIO 試驗（Mortensen SA et al., 2014, JACC: Heart Failure, PMID: 25282031）的設計出發，拆解兩種試驗的本質差異、delta margin 的決定邏輯，並解釋為何 Q10 研究者鮮少採用 non-inferiority 設計。

為什麼要先從 Q-SYMBIO 談起？

Q-SYMBIO 是 CoQ10 在心衰竭領域最具里程碑意義的大型 RCT，收案 420 名 NYHA III-IV 級慢性心衰竭患者，隨機分配至 CoQ10 300 mg/天（100 mg 每日三次）或安慰劑組，追蹤 2 年。兩年後主要心血管不良事件（MACE）複合終點為 CoQ10 組 15% vs 安慰劑組 26%（p = 0.003），心血管死亡 9% vs 16%（p = 0.026），全因死亡 10% vs 18%（p = 0.018）。這是一項典型的「優效性試驗」——研究者預設 CoQ10 的效果應「優於」安慰劑，統計假設檢定的虛無假設（H0）是「兩組無差異」，對立假設（H1）是「兩組有差異」，而結果成功推翻 H0。

但若把研究問題換一個方向——「CoQ10 作為輔助療法，是否與某個現役標準輔助藥物『效果相當』？」——那就不是優效性試驗能回答的問題了，而要進入非劣效性的設計邏輯。

優效性與非劣效性試驗的本質差異是什麼？

兩種試驗的差別不在於統計公式，而在於「想證明什麼」。優效性試驗要證明 A 比 B 好，非劣效性試驗則要證明 A「不會比 B 差太多」，其中「差太多」由一個事先定義的邊界 δ（delta margin）決定。形式上：

優效性（superiority）：H0 為「A = B」，H1 為「A ≠ B」或「A > B」。結論需要 95% 信賴區間（CI）不跨越 0。
非劣效性（non-inferiority）：H0 為「A 比 B 差超過 δ」，H1 為「A 比 B 差不超過 δ」。結論需要差異的 95% CI 下界（若 B 為參考組）不超過 −δ。

換句話說，非劣效性試驗承認 A 可能略遜於 B，但只要劣勢幅度在「臨床上可接受」的範圍內，就視為治療上可互相取代。這種設計通常用於：新藥療效與舊藥相當但副作用較少、給藥更方便、或成本較低的情境。

delta margin 是如何被選出來的？

delta margin（δ）是非劣效性試驗最具爭議性的參數，因為它直接決定試驗能否宣告成功。δ 選得太寬鬆，試驗容易通過但臨床意義薄弱；δ 選得太嚴格，所需樣本量暴增、試驗幾乎無法完成。方法學文獻普遍建議 δ 的選擇應同時滿足兩個條件：

統計條件：δ 應小於「活性對照組對安慰劑的歷史效應量」的一定比例（常用 50% 或更保守的 30%），確保即使檢定通過，A 仍保有一定程度的「對安慰劑優越性」。這被稱為「M1/M2 法則」：M1 為對照組對安慰劑的效應，M2 為保留比例後的容許邊界。
臨床條件：δ 應由該領域臨床專家共識認定為「病人與醫師都能接受的最小重要差異」。例如在抗凝血試驗中，δ 常設在年事件率 1-2 個百分點，而非單純統計公式算出的數字。

FDA 2016 年發布的《Non-Inferiority Clinical Trials to Establish Effectiveness》指引正是圍繞這套雙重條件展開，並要求試驗計畫書事先明訂 δ 與其推導依據，不可在資料解盲後回溯調整。

為什麼 Q10 領域幾乎看不到非劣效性試驗？

回到本文核心問題：為何 Q-SYMBIO 這類指標性研究全都走優效性路線，而非劣效性設計在 Q10 文獻中幾乎缺席？從方法學角度可歸納四個結構性原因：

原因一：缺乏公認的「活性對照藥」。非劣效性試驗需要一個已被充分驗證、效應量可量化的對照治療。CoQ10 在心衰竭、偏頭痛、他汀相關肌肉症狀等主要適應症中，並沒有一個「公認的輔助療法標準藥物」可作為比較基準，使得 M1 無從估算。
原因二：CoQ10 被定位為「輔助性營養介入」而非「治療藥物」。多數試驗都是在標準治療之上加 CoQ10 或安慰劑，這本質上就是優效性的邏輯——「加了會不會更好」。若要證明「CoQ10 與某標準輔助藥相當」，需要重新設計研究假設，成本與招募難度顯著上升。
原因三：贊助與監管驅動力不同。非劣效性設計在製藥業常見，因為後進者要挑戰既有品牌；但 CoQ10 市場主要由保健食品與少數處方級製劑組成，廠商動機更偏向「證明有效」（優效性）而非「證明不輸」（非劣效性）。
原因四：歷史效應量異質性高。CoQ10 跨研究的效應量差異很大（例如心衰竭 MACE 試驗與他汀肌肉症狀試驗結果不一致），使得「從歷史資料推估 δ」這一步在方法學上極不穩健，審查委員會難以批准。

如果真的要做一個 CoQ10 非劣效性試驗，會長什麼樣？

一個假想範例：比較 CoQ10 300 mg/天與泛醇（ubiquinol）200 mg/天在心衰竭患者的 MACE 發生率。研究者會先從過往資料估算 CoQ10 相對安慰劑的效應（Q-SYMBIO 的 MACE 差異約為 11 個百分點），再設定 δ 為此效應的 50%（約 5.5 個百分點），計算達到 80% 檢定力所需的樣本量，通常會遠大於優效性試驗。試驗結束後，若 ubiquinol 組 MACE 發生率比 CoQ10 組高不超過 5.5 個百分點（95% CI 下界），即可宣告非劣效。這類設計的價值在於協助臨床指引決定「兩種形式可互相取代」，但前提是要有足夠穩定的歷史效應量估計。

專家與學會怎麼看？

國際心臟科與循證醫學機構對非劣效性設計的立場大致一致。International Conference on Harmonisation（ICH）E9 指引與 E10 指引明確規範了非劣效性試驗的統計邏輯與對照組選擇標準，並強調「假 non-inferiority margin」可能造成的公共衛生風險。Cochrane Handbook 則在方法學章節提醒，缺乏足夠效應量基礎的營養介入若強行採用非劣效性設計，極易產生「雙陰性」結果——新介入與對照都沒效，卻被錯誤宣告為相當。FDA 2016 年的非劣效性試驗指引進一步要求試驗者公開 δ 的推導證據。這些立場共同解釋了為何像 CoQ10 這類效應量異質、缺乏活性對照的營養介入，方法學家普遍傾向先以優效性設計累積證據，再考慮是否進入非劣效性階段——Q-SYMBIO 之所以選擇優效性架構，正是這個層級的自然選擇。

對讀者而言，這個方法學反思意味著什麼？

對一般讀者與臨床專業人員，理解兩種設計的差異至少有三個實用意涵：第一，看到「CoQ10 優於安慰劑」的 RCT 時，應意識到這是優效性結論，不代表 CoQ10 可取代任何現役藥物；第二，若未來出現 CoQ10 非劣效性試驗，務必檢視 δ 的設定是否合理、是否有事先註冊；第三，方法學設計的選擇反映了該領域的證據成熟度——Q10 目前仍處於「建立優越性」的階段，這本身就是有價值的資訊。Q-SYMBIO 兩年追蹤的陽性結果，為後續可能的非劣效性研究奠定了起點，但還遠不到終點。

小叮嚀

本文探討試驗方法學概念，不構成 CoQ10 補充建議。若您有心衰竭或其他慢性病，請依循醫師處方治療，任何營養補充品的使用請與主治醫師討論，避免與正在服用的藥物產生交互作用。

為何 Q10 領域少見非劣效性試驗？方法學反思

為什麼要先從 Q-SYMBIO 談起？

優效性與非劣效性試驗的本質差異是什麼？

delta margin 是如何被選出來的？

為什麼 Q10 領域幾乎看不到非劣效性試驗？

如果真的要做一個 CoQ10 非劣效性試驗，會長什麼樣？

專家與學會怎麼看？

對讀者而言，這個方法學反思意味著什麼？

小叮嚀

參考來源

品質保證

延伸閱讀

網絡統合分析：為何 Q10 劑量比較需要 NMA

孟德爾隨機化如何檢驗 Q10 的因果效應？

貝氏統計如何改寫 Q10 meta-analysis 的證據詮釋？

Q10 研究還缺什麼？五大空白盤點