讀輔酶 Q10 的臨床試驗時,你可能看過兩個看起來很像、結論卻可能差很多的名詞:ITT(Intention-To-Treat,意圖分析)與 PP(Per-Protocol,完成者分析)。前者指「只要被隨機分配進某組,不論最後有沒有按計畫完成,都算進該組」;後者則是「只算真正吃完、沒違反計畫的人」。看似小小的定義差異,卻會牽動統計結論的保守程度。本文以 Q-SYMBIO 試驗(PMID: 25282031)為例,拆解這兩套分析邏輯為什麼存在、差在哪裡、以及為什麼主流方法學界普遍把 ITT 當成 RCT 主要結局的預設選項。
什麼是 ITT 與 PP?兩套邏輯如何分流?
ITT 的核心原則是「once randomized, always analyzed」——一旦完成隨機分配,這個人就永遠屬於原分組,即使後來沒吃藥、吃錯藥、提早退出,他的結局仍算回原組。PP 則相反,它排除所有違反試驗計畫的受試者:中斷服藥、交叉到對照組、依從性過低等,只留下「乖乖完成」的人進行比較。
兩種分析回答的是不同問題。ITT 回答的是「如果我開這個處方,實際上會發生什麼」;PP 則是「如果病人完全照做,理論上會發生什麼」。前者貼近臨床真實世界,後者接近生理學上的最大可能效果。正因為 ITT 保留了所有脫落與違規個案,它會稀釋組間差異、讓統計結果偏向保守;PP 因為只留下「表現好」的子集合,通常會放大療效估計。
為什麼 ITT 被視為 RCT 的黃金標準?
隨機分配的價值在於,理論上能讓兩組在所有已知與未知的干擾因子上達到平衡。這份平衡只在「全體被隨機分配者」的尺度上成立;一旦你開始排除某些人,平衡就可能被破壞。舉例來說,副作用嚴重而退出試驗的人,通常也是對介入反應最極端的一群——把他們從 PP 分析剔除,剩下的樣本就不再是原本的隨機樣本,而是經過事後篩選的子集,容易帶入選擇偏差。
這也是為什麼 CONSORT 2010 聲明、Cochrane 手冊以及多數心血管學會的審閱標準,都要求 RCT 的主要結局以 ITT 為主,PP 僅能作為敏感度分析。換言之,PP 用來回答「若依從性完美的話,效果最大會是多少」;但真正拿來做決策的,是較保守、較難被高估的 ITT 結果。
Q-SYMBIO 是一個怎樣的試驗?
Q-SYMBIO 是 2014 年發表於《JACC: Heart Failure》的多中心、隨機、雙盲、安慰劑對照試驗(PMID: 25282031),共納入 420 名 NYHA III–IV 級中度至重度慢性心衰竭患者,在標準心衰治療之上,隨機分派到 CoQ10 100 mg 每日三次(共 300 mg/天)或安慰劑,追蹤兩年。
短期終點(16 週)的 NYHA 分級、6 分鐘步行、NT-proBNP 並未出現顯著組間差異;但兩年的長期追蹤中,CoQ10 組的主要心血管不良事件(MACE)複合終點為 15%,明顯低於安慰劑組的 26%(p = 0.003)。心血管死亡為 9% 對 16%(p = 0.026),全因死亡為 10% 對 18%(p = 0.018),因心衰竭住院亦顯著減少。
Q-SYMBIO 的 ITT 分析說了什麼?
Q-SYMBIO 的主要結局採用 ITT 分析:研究者將所有完成隨機分配的 420 名受試者,按照最初被分派的組別計算事件發生率,不論他們在兩年追蹤期間是否中途停藥、更換治療或失聯。這意味著分母包含了依從性不佳的個案,也包含了那些或許因其他原因提早退出的病人。
在這樣保守的前提下,兩年追蹤仍看到 MACE 風險下降約 11 個百分點、全因死亡率從 18% 降到 10%。從方法學角度來看,這個效果值得被特別看待的原因有兩個:其一,它是「被稀釋過」後仍能偵測到的差異,代表真實世界可預期的效益大致也在這個量級;其二,它不是事後挑出「表現好」子集才跑出來的結果,降低了選擇偏差質疑的空間。
如果改用 PP,數字會怎麼變?
雖然 Q-SYMBIO 的主分析以 ITT 為準,但從方法學邏輯推想,PP 分析往往會給出更大、更誘人的效果估計。理由很直接:退出者、依從性不佳者被移除後,剩下的都是實際吃到足量 CoQ10 的病人,他們的死亡率與住院率理所當然更低——但這部分差異有多少來自 CoQ10、又有多少來自「能乖乖吃兩年藥的人本來健康狀態就比較好」,就很難拆乾淨。
這也是為什麼臨床指引審閱者看到一份 RCT 同時呈現 ITT 與 PP 時,通常會以 ITT 為主、PP 為輔;如果兩者方向一致,信心提高;如果 PP 顯著而 ITT 不顯著,就必須警覺結論是否過度依賴完成者子集。對讀者而言,一個簡單的原則是:當你看到某篇 CoQ10 研究只引用 PP 數字、卻不提 ITT 時,應該要回頭問一句——ITT 的結果是什麼?為什麼沒有被凸顯?
專家與學會怎麼看 ITT 原則?
CONSORT 2010 聲明明確指出,RCT 應報告主要分析所使用的分析族群(analysis population),並建議以 ITT 為預設;Cochrane 系統性回顧手冊也將「是否採用 ITT」列為偏誤風險評估的重要項目之一。歐洲心臟學會(ESC)與美國心臟學會(AHA/ACC)在審閱心衰竭相關試驗時,同樣優先檢視 ITT 主要結局,再參考 PP 或 on-treatment 分析作為敏感度檢查。Q-SYMBIO 正是依循這套標準,將 ITT 作為主要結局的設計,這也是它能被寫入後續 meta 分析與部分臨床指引討論的原因之一。
讀者可以帶走的三個方法學觀念是什麼?
第一,看到療效數字,先問是 ITT 還是 PP。 ITT 通常較保守、較貼近真實;PP 較樂觀、接近「完美依從」下的理論上限。Q-SYMBIO 的兩年死亡率差異來自 ITT,這讓它在方法學上站得比較穩。
第二,隨機分配的價值只有在 ITT 下才完整保留。 一旦事後排除受試者,原本平衡的干擾因子可能被破壞,選擇偏差就會悄悄滲入。
第三,長期終點與短期終點可能給出不同答案。 Q-SYMBIO 在 16 週時看不到 NYHA 或步行測試差異,但兩年追蹤時 MACE 與死亡率的差異才浮現——這提醒我們,對於慢性疾病的輔助治療,評估時程本身就是方法學的一部分。
輔酶 Q10 作為慢性心衰竭的輔助營養素,目前的證據以 Q-SYMBIO 這類 ITT 為主的 RCT 最具代表性。理解 ITT 與 PP 的差別,不只是為了看懂一篇論文,更是為了在海量健康資訊中,判斷哪些數字比較禁得起檢驗。