验证性篮子试验的设计概念
行业之声 | Cytel思特尔 | 2023年7月6日
目前,在药物开发的总体成功率都较低的情况下,抗癌疗法的临床开发尤其面临着超高的失败率。(1) 这其中一个主要的原因在于治疗效果或预期收益的不确定性。在2012年发表的一篇文章中,Gan等人(2) 分析了250多项已发表的肿瘤学试验。这些作者们发现,预期效益和观察到的效益之间几乎没有对应关系,甚至预期收益通常会大大高于实际观察到的收益。
因此,业界迫切需要新的临床开发策略来提高成功率。食品药品监督管理局(FDA)专员Scott Gottlieb(3) 近期开始倡导一种颇有希望的方法——适应性临床试验。从更有效地针对最大耐受剂量的探索性设计,到支持精准医学的人群富集方法,这些更灵活的试验设计方法将有可能提高效率并降低风险。
在本次采访中,我们与医学博士Robert Beckman讨论了他在2018年Cytel的East® 软件用户会议上的演讲——《验证性篮子试验的设计概念》。
在当时的演讲中,Robert Beckman博士就设计概念本身进行了深入的解析,而这次采访,将进一步揭示他对篮子试验及其未来潜力的洞察与见解。
问: 为什么篮子试验方法在今天的药物开发中至关重要?
Robert Beckman(以下简称RB):一直以来,特殊药物都是许多研究团队颇为感兴趣的话题,它所带来的效果的确不同凡响且令人兴奋。随着特殊药物得到大量炒作,在许多非业内人士看来,我们似乎正在步入一个只有特殊药物的时代。但是与此同时,也存在着很多有效但并不特殊的药物。对于深入参与开发这些药物的人来说,在知晓特殊药物好处的同时,也需要明白在99%的现实中,我们更应该对于那些有效但不特别的药品进行规划。药物开发的成本有限,随着科学带来越来越多的可能性,其成本的维系也变得更加不可持续。但是药物开发的成功率,却不一定会像有趣的新发现一样不断增加。因此,我们迫切需要一种更为有效的方法来开发药物。
我和我的同事最初在进行概念验证研究时发现了一种方法,可以通过优化II期试验研究和对III期试验的通过/不通过决策,将II期试验和III期试验的效率提高10%到30%。我们认为这个发现意义重大,因为对于数十亿美元的开发费用来说,10%到30%的效率提升将节省一笔巨大的开支。而“篮子试验”的方法则更上一层楼,将成本节约提升到了前所未有的水平。
问: 您能解释一下,什么是篮子试验吗?
RB:实际上,对于篮子试验,你可以先提出一个关于“一种药物是否同时对多种适应症有效”的问题。假设你在“篮子”里放有三到五个适应症,且它们都是按照其他基本特征分组得到的——例如,它们都具有相同的突变、相同的分子生物标志物或相同的疾病发病机制。在一个篮子试验中,你能够对篮子中的这三到五个适应症进行试验,其成本与进行一个试验大致相同,而不仅仅是像我们在先前的工作中所期待的节省10%到30%的费用。这样一来,你的效率提高了数倍。
在过去,篮子试验一般用于两个目的:一个是用于探索性工作,以了解药物在开发早期所展示出的潜在活性。另一个是用于特殊药物的验证性研究。这也是我为什么特别对特殊药物和一般有效的药物做了区分。
在关于特殊药物的几个案例中,卫生当局研究了这些药物的活性水平和益处,以及科学证据水平,他们也不出意料地接受了相对往常不一样的证据水平。
举个例子,第一个篮子试验是针对格列卫(Glivec)的。格列卫是首批基于科学知识设计的靶向药物之一,它使慢性骨髓性白血病成为了一种可治愈的疾病,这也的确是一种了不起的药物。
在一项篮子试验中,若干罕见的癌症类型被聚集在一起进行小型试验。这些癌症类型非常罕见,以至于一些组别中仅仅有5到10名患者。在没有对照组的情况下,试验者们试图寻找肿瘤萎缩这一短期终点,而它可能是否和生存率相关,恰恰是我们真正感兴趣的地方。一般而言,这样的试验方法对于一项II期试验来说是不够严谨的,但是由于这批肿瘤类型非常罕见,我们也难以在如此罕见的肿瘤类型中开展更大规模的研究,再加上已有大量的科学数据表明格列卫很可能有所帮助,最终,所有这些看似探索性的特征都被FDA接受,也获批用于那些出现反应的适应症。在一个适应症中,五名患者中的一名在使用药物后肿瘤缩小,FDA后来批准了格列卫在该适应症上的应用。
总体来看,进行试验的40个适应症中只有4个被批准。这表明,尽管这些适应症都具有相同的分子特征,但其反应存在异质性。目前正在进行的维莫非尼(Vemurafenib)试验也有类似的设计。维莫非尼(Vemurafenib) 是一种用于治疗具有 b-raf V600E 突变的黑色素瘤的出色药物。同样,一种免疫疗法最近被批准用于所有具有高突变负荷的肿瘤,即默克公司的帕博利珠单抗(Keytruda)。这些都属于例外的情况。
然而,现在的问题是——对于既有用又有效却并不特殊的药物,我们能在确认性空间内做些什么?我们的确可以尝试忘记确认性空间,只在早期的探索空间使用篮子试验,但不得不承认的事实是,药物开发的大部分资金都花在确认性空间上。我个人对罕见疾病也很感兴趣,但是众所周知的是,我们可能很难对罕见病开展常规的验证性试验。你可能无法找到足够数量的患者,也很难说服一家公司进行试验。因为这既不仅具有非同寻常的挑战性,而且市场空间很小。因此,我们需要关注的是:能否将药物开发的验证部分用于罕见疾病或生物标志物定义的亚群,通过将三到五项研究合并到一个篮子中来降低成本,让它变得更加负担得起?
问: 在实施过程中需要克服哪些挑战?
RB:我们需要在设计中解决篮子试验的两个主要统计问题:一是假阳性率,即 I 类错误;二是假阴性率,或称 II 类错误。想象一下,基于“共享一个分子标记”的假设,你选择了一批预期为阳性的适应症。假设你选取其中的五个纳入篮子试验,发现对其中三个是阳性的预判正确,但有两个预判错误。而难点在于,当篮子试验结束时,你对篮子里的所有东西进行了汇总分析。此时,两个错误指示的负面结果可能稀释正面结果,即使你将所有的五个结果进行汇总,也无法得到有意义的结果。这无疑是一个关键的风险所在。
例如,维莫非尼(Vemurafenib)是一种用于治疗具有 b-raf V600E 突变的黑色素瘤的出色药物。但没有人事先预测到,其对具有相同突变的结直肠癌并不起作用。一旦观察到这一点,分子生物学家就能及时返回到之前的步骤并进一步调查原因。也因为这是事前没有预料到的,所以如果有人对黑色素瘤和结肠直肠癌的适应症进行了篮子试验,他们很可能因负面的试验结果而放弃药物。这便是 II 类错误,也是我们在设计中试图克服的问题之一。
关于Robert Beckman
医学博士Robert Beckman,肿瘤学临床研究员和数学生物学家,曾在4家制药公司开发新的肿瘤学临床研究小组中发挥重要的领导作用;在其跨公司的5项合作中,将23种肿瘤学疗法引入首次人体研究,其中5个进入2期试验,2个应用于市场。他与其他合作伙伴共同发明了包括验证性篮子试验设计等新的临床策略,用于概念验证研究以及早期、晚期生物标志物驱动的临床开发。此外,Robert Beckman博士开发了一种基于肿瘤演变的癌症精准医疗新方法,该方法有可能极大地提高生存率和治愈率。其发表记录,包括超过200篇文章和摘要,范围从计算化学到临床肿瘤学,强调定量方法。Robert Beckman博士目前是伦巴第综合癌症中心和乔治敦大学医学中心生物医学信息学创新中心的肿瘤学和生物统计学、生物信息学和生物数学教授。
1) Clinical Development Success Rates 2006-2015 Biomedtracker
2) Gan, H., You, B., Pond, G. and Chen, E. (2012). Assumptions of Expected Benefits in Randomized Phase III Trials Evaluating Systemic Treatments for Cancer. JNCI Journal of the National Cancer Institute, 104(8), pp.590-598.
3) Servick, K. (2017). Congress and FDA nominee heap love on ‘adaptive trials’. Science.