总生存(OS)与无进展生存(PFS)是评估非小细胞肺癌(NSCLC)治疗疗效的两个重要指标。OS是临床试验终点的金标准,而PFS是一个替代终点指标。PFS能否替代OS一直是饱受争议的话题。
近期,美国《临床肿瘤学杂志》发表的一项回顾性分析显示,过去30年间,晚期NSCLC的Ⅲ期临床试验的设计和解读发生明显改变;将OS作为主要终点指标试验比例正在下降。

多伦多大学Natasha B. Leighl等对200篇NSCLC临床试验相关文献进行回顾性分析,发现把OS作为主要终点的试验明显减少。(J Clin Oncol. 2014 年3月3日在线版)
研究者旨在分析过去30年晚期非小细胞肺癌Ⅲ期试验设计和解读的变化。研究者最初筛选了1980-2010年间发表的248项试验,排除不符合晚期NSCLC全身治疗标准的试验后纳入203项独立研究:32项发表于20世纪80年代,53项发表于20世纪90年代,118项发表于最近10年。
结果显示,过去30年间试验终点的选择发生明显变化,在2000年以前几乎所有Ⅲ期NSCLC临床试验都将OS作为主要终点;但是2001-2010年,19%的Ⅲ期试验开始使用OS之外其他指标作为主要终点(与之前的数十年相比,P<0.001),多数使用PFS(13%)。
试验样本量随时间推移明显增加,从首个10年的中位152例增至2001-2010年的中位413例(P<0.001)。
终点指标具有统计学意义改善的试验比例随着时间推移仍比较稳定,然而报告阳性结果的试验(主要终点指标未显著改善)比例明显增加,从首个10年的30%增至2001-2010年的53%(P<0.001)。
对报告终点指标具统计学意义改善的60项试验分析显示,患者获益幅度呈下降趋势,1981-1990年试验的中位生存获益为3.9个月,在1991-2000年试验的中位生存获益为2.4个月,最近10年试验的中位生存获益为2.5个月;对所有报道“结果阳性”的试验进行分析显示,首个10年间生存获益为3.9个月,第二个10年间生存获益为2.0个月,2001-2010年生存获益为0.9个月(图1)。
只有早于1990年的试验将存在统计学差异但临床生存获益不显著的结果报告为阴性。
自1990年至2010年,使用PFS作为主要终点的试验比例从0%上升至13%。虽然达到其设定的主要终点的试验比例仍保持不变,但是报告阳性结果的试验比例却上升了。尽管随时间推移生存获益程度有所下降,但是不具有统计学意义。这些发现引出了许多关于晚期非小细胞肺癌Ⅲ期试验设计和解读的问题。
多阶段的临床试验旨在将资源投入到有希望的药物上,每个阶段都淘汰掉有毒性或药效最低的药物,而该回顾性分析提示,在晚期非小细胞肺癌试验中研究人员完成这一工作的效率日益下降。
晚期NSCLC临床试验推动了一线、二线化疗药物以及用于化疗失败后患者的靶向治疗药物的临床应用,然而这些治疗药物的疗效一般。
随着肿瘤学团体和制药企业对NSCLC兴趣的增加,试验设计和解读也正在发生改变。这些改变包括主要终点和次要终点的选择、统计学功效和样本量大小。因为越来越多的患者在疾病进展后就会改用其他治疗方案,并且治疗选择也越来越多,所以PFS作为主要终点被提倡使用。尽管美国食品药品监督管理局(FDA)已认可将PFS作为晚期NSCLC治疗药物审批的潜在主要终点,但是FDA对这种做法持保留态度。
除了临床试验设计的改变,试验解读方式也会发生改变。曾有报道称,尽管一种新治疗方案的疗效极其有限或不确切,但是越来越多的研究者愿意将这些结果解读为阳性。
该回顾性分析证实,晚期非小细胞肺癌Ⅲ期试验设计发生了令人堪忧的改变。在过去30年间,尽管通过扩大样本量、提高统计功效使其设计水平得到提高,但是判断肺癌新药临床获益的标准似乎正在降低。

专家点评
无进展生存作为试验主要终点优缺点兼在
▲ 北京大学肿瘤医院 张力建
多伦多大学Natasha B. Leighl等报告的回顾性分析显示,过去30年间,晚期NSCLC临床试验的设计和解读发生了显著改变。
尽管总生存(OS)仍是晚期NSCLC新药Ⅲ期试验最常用的主要终点指标,但是过去10年间使用无进展生存(PFS)作为主要终点的试验逐渐增多。
NSCLC临床试验终点的选择发生改变,而PFS能否替代OS?应基于PFS作为试验终点的优缺点进行审度。
PFS作为试验终点优点
☆PFS反应患者肿瘤的增长情况,而肿瘤增长在很大程度上是造成肿瘤相关死亡的原因,因此PFS具有作为替代终点的良好特性。
☆评估PFS,无需非要等到出现死亡事件,因此可使试验随访时间会大大缩短。
☆与OS相比,PFS的获益程度(magnitude)会更大,意思是什么呢?同样的两组治疗,两组间PFS的差异往往会比两组间OS差异更大,也就是说可通过更少的事件数来检验出差异,这也就意味着病例数大大减少。
☆PFS较少受非研究药物治疗的影响。因为患者往往是在药物治疗无效即疾病出现进展后才开始考虑换药,因此对于PFS的评估往往是在患者换药之前,这就使得PFS不像OS那样容易受非研究药物治疗的影响。
PFS作为试验终点缺点
☆PFS的确认对于许多种类的肿瘤比较困难。
☆对PFS的评估不如OS评估精确,因为PFS评估主要依赖于一些放射学检查,某个患者在某次放射学检查时出现进展,那么其进展日期就记录为放射学检查的这一天,其实很可能患者在这次放射学检查前早就出现进展了,只是没有进行放射学检查确定而已。因此,在时间精度方面肯定不如死亡时间那么精确,特别是当放射学检查时间隔的比较长时。
☆存在主观偏倚,因为进展与否最终还是由研究者根据放射学检查主观判定的。
☆需要频繁的放射学检查。