结合多个研究实例,说说ITT分析和PP分析

ITT分析

意向性分析(Intention-to-treat Analysis, ITT分析)意味着一个临床试验的结果包含全部随机分组患者的随访数据(还没搞懂ITT的小伙伴赶紧戳:不明觉厉的统计学术语之ITT分析)。目前,RCT研究都将ITT分析作为临床疗效比较的主要分析方法。

ITT分析的优势在于它提供了一个没有偏倚的疗效比较方法(每一个研究对象无论是否都随访至观察终点,都将按照最初的随机分组全部参与最终的统计分析,即不会破坏组间可比性),但是仍有两个问题需要考虑:

  1. 所有研究对象都有可供分析的全部数据吗?
  2. 一项临床研究的成败全部靠ITT分析结果合适吗?

有关第一点,研究随访过程中不可避免会出现失访,这时候越多研究对象失访, ITT分析的结果就越远离真实情况。因此,在临床试验的实施过程中,减少研究对象的失访尤为重要。保持研究对象较高的依从性是第一步。此外,当研究对象退出临床试验时,如果可能的话,对他们的随访应该继续下去。

在多数生存分析中,研究对象的实际随访情况差别很大。一般而言,研究对象的招募需要1-2年,所有的研究对象都会按照一个固定的访视时间进行随访。如果所有没有出现主要结局的研究对象都随访到了研究观察终点,就可以获得一个真实的ITT分析,并且绘制K-M生存曲线,这时候的删失可以明确为未出现目标结局。

但是,如果患者在随访早期即发生失访,这时候是很难假定其发生是随机的。例如,失访的患者可能病情更严重,主要结局发生的风险更高,但这些都是无法记录的。因此,失访是潜在的信息删失,并且可能导致临床疗效比较出现偏倚。如果失访率以及失访原因在治疗组间不同,疗效比较的结果不免会遭到质疑。

举个实例,ATLAS ACS 2研究[2]比较了利伐沙班两个剂量和安慰剂对照治疗急性冠脉综合征患者的获益,共纳入15526名患者,平均随访时间为13个月。已发表的研究结果看起来特别地支持利伐沙班低剂量组——在主要复合终点(心血管死亡、心梗、卒中)以及全因死亡方面,伐沙班低剂量组都表现十分优异,尽管与安慰剂组比较会轻微地增加出血事件的发生风险。

然而,在核查整个临床试验过程中,发现15.5%的研究对象过早的退出了临床试验,特别是8.3%患者撤销了知情同意,并且无法获知这部分研究对象在观察终点时的健康状态。这种情况无疑会引起对于临床试验结果的怀疑,并且影响审批机构对于该药物上市的批准。尽管很难做到100%随访,但是ATLAS ACS 2研究在这方面显然做得不够好。

尽管报告了ITT分析结果,ATLAS ACS 2将重点放在了所谓的校正ITT分析上,即研究治疗中断超过30天发生的任何事件在分析时都会被剔除掉,但是这种分析方法通常作为次要分析。

使用“校正ITT分析”在临床试验报告中是非常普遍的,即获得试验资料的“全分析集”(通过对所有随机化受试者的数据做最少和公正的剔除之后所得到的数据集,保持原始数据集的完整性,减少偏倚),但是目前缺乏有关这一问题的共识。事后排除无疑可能会导致偏倚发生,更多情况下,可接受的“校正”是排除那些被随机分组的不合格研究对象,并且在双盲试验中,排除那些没有接受任何治疗的研究对象。

APPROVe研究[3,4]说明了获得一个合适的ITT分析对于得到一个可信的有效结论是多么重要。该研究是一项多中心、随机、安慰剂对照、双盲试验,旨在评价罗非昔布预防结肠直肠息肉再次复发的疗效。2000-2001年间共招募了2587例有结肠直肠腺瘤病史的患者。对受试者在治疗期间及治疗后14天内发生的不良事件进行随访。

然而,该试验由于心血管毒性而提前终止,之后研究者尝试在治疗终止后随访所有随机化的患者至少1年。主要复合终点包括心梗、卒中以及全因死亡。84%受试者获得了治疗后延长随访期间的心血管资料,95%获得死亡资料。

该研究首次报告结果时,仅包括在治疗期间(从开始治疗一直到最后一次给药后14天内)发生的终点事件,进而认为两组的终点事件发生率在过去前18个月是相近的,而两组出现差异是在此之后。

但是这种分析方法并没有给出临床试验的全貌,并且随后的ITT分析(包含失访病例),显示不同的结果:罗非昔布组有59例,安慰剂组有34例发生主要终点事件(HR= 1.79; 95% CI: 1.17-2.73, P = 0.006)。在治疗终止后的第1年,主要终点事件发生风险未观察到显著增加,即HR并未随时间发生明显变化。(图1)

v2-09c6de961d16311d6c03da505648e622_hd.jpg

PP分析

另外一种临床研究常用的统计分析方法是符合研究方案(Per-protocol, PP)分析,对应的试验资料“符合方案集”(是全分析集中一个子集,其受试者对方案具有充分的依从性,能够用来对处理的效应进行估计)。

v2-661465dfa0def0f5710d035002e974f6_hd.jpg

例如,TECOS研究[5]比较了西他列汀与安慰剂在2型糖尿病中的获益情况。主要复合终点(心血管死亡、心梗、卒中、不稳定型心绞痛)。ITT分析显示,西格列汀组与安慰剂组受试者主要终点事件发生率分别为11.4%与11.6%(HR=0.98; 95%CI; 0.89-1.08)。

然而,在平均3年的随访过程中,有相当一部分患者停止服药。PP分析结果显示,西他列汀组和安慰剂组主要终点事件发生率均为9.6%(HR=0.98; 95%CI; 0.88-1.09)。在两个治疗组中,ITT分析得到事件发生率比PP分析的要高。也就是说,依从性差的研究对象往往有着较高的结局事件发生风险,而这种情况在多数RCT中都比较常见。

ROCKET-AF[6]比较了利伐沙班和华法林治疗冠脉纤维化患者的疗效,ITT分析和PP分析是不一致的。ITT分析显示,利伐沙班组主要终点事件(卒中、系统性栓塞)发生风险与华法林组并无显著差异(HR= 0.88; 95%CI: 0.75-1.03, P=0.12),进一步采用PP分析,结果却支持利伐沙班获益更高(HR=0.79; 95%CI: 0.66-0.96, P =0.02)。

一般而言,PP分析会导致偏倚——依从性差的研究对象是一个被选择人群,经常(非随机地)有着较高的结局事件发生风险,因而会降低结果的可信性。

总之,ITT分析倾向于低估真实的疗效差异,而PP分析可能高估疗效。两种分析方法的结果应该被同时呈现在研究报告中,一致才能有助于确定研究结论,不一致则需要进一步的分析讨论。

参考文献

  1. J Am Coll Cardiol. 2015; 66:2648-62
  2. J Am Coll Cardiol. 2013; 62:777-81
  3. N Engl J Med. 2005; 352:1092-102
  4. Lancet. 2008; 372:1756–64
  5. N Engl J Med. 2015; 373:232-42
  6. N Engl J Med. 2011; 365:883-91