医疗器械监管与报销流程的关联:综合评估的需求
奥里亚娜·奇亚尼a,b,布里特尼·威尔彻a,阿努克·范吉森c,d和罗德·S·泰勒a*
a医疗卫生改善证据综合与建模,健康研究所,埃克塞特大学医学院,埃克塞特,英国
b医疗卫生与社会照护管理研究中心,博科尼大学,米兰,意大利
c健康科学与初级保健尤利乌斯中心,乌得勒支大学医学中心,乌得勒支,荷兰
d临床流行病学与医疗技术评估系(KEMTA),马斯特里赫特大学医学中心,马斯特里赫特,荷兰
摘要
人们对医疗器械(MDs)的许可要求提出了诸多批评,因为这些要求往往导致缺乏有力证据来支持卫生技术评估(HTA)决策。为了更好地理解当前国际上针对医疗器械技术的决策框架,我们开展了三项相互关联的研究:对器械监管程序的综述、对当前HTA实践的调查,以及对药品与医疗器械HTA报告的实证比较。我们的综述证实,全球现行的器械监管流程在严格性方面明显低于药品。因此,国际HTA机构报告称,他们在评估医疗器械时面临诸多挑战,包括依赖质量不足的数据进行临床和成本效益决策。尽管许多HTA机构已调整其流程和程序以应对医疗器械技术的申报材料,但在HTA报告的比较中,我们发现很少有证据表明应用了考虑器械特有问题(如渐进式开发)的评估方法学。总体而言,我们的研究进一步强调了加强许可与HTA之间衔接的必要性,以及开发和应用创新的HTA方法学,以确保能够更快地让患者获得那些被证明具有高性价比的技术。© 2017 作者。
《卫生经济学》由约翰·威立父子有限公司出版
2016年2月23日收到; 2016年12月6日修订;2016年12月7日接受 r 2016
关键词: 医疗器械;监管;市场准入;卫生技术评估
1. 引言
卫生技术评估(HTA)旨在综合有关卫生技术(包括药品、医疗器械(MDs)、临床操作和组织系统)在临床、经济、社会和伦理方面的价值信息,以支持制定安全有效的卫生政策,特别是与报销或覆盖决策相关的政策(班塔,2009)。然而,卫生技术评估和经济学评价方法主要是针对药品或药物的评估而发展起来的(弗兰肯等,2012;奥特维恩等,2010)。因此,许多评论者认为,将国际HTA方法指南普遍应用于非药物技术,尤其是医疗器械(MDs),是不合适的,这些方法忽视了药物与器械之间的重要差异(德拉蒙德等,2009;基里斯茨和雷德科普,2013;索伦森和德拉蒙德,2014;泰勒和伊格莱西亚斯,2009)。简而言之,这些差异大致可分为三个方面:(i)(临床)证据基础的性质:传统上,器械的许可要求低于药品,这意味着其临床器械的证据基础可能包含容易产生选择偏倚和混杂问题的数据,且很少甚至没有随机对照试验(RCT);(ii)设备技术的特性:与药品不同,器械技术往往随着时间推移经历渐进式演进,可能导致被评估技术迅速变化。此外,由于器械通常仅为临床操作的一个组成部分,患者相关结局往往取决于操作者的培训水平和经验,以及器械应用的具体环境;(iii)定价:由于新器械产品进入市场或许多医疗保健系统中的采购方式,医疗器械定价相较于药品更具动态性。技术制造商和政策制定者正不断向卫生技术评估(HTA)和健康经济学领域施加压力,要求其改进现有的评估方法,以更好地考虑医疗器械的这些特点(Ferrusi 等,2009)。例如,鉴于产业界面临的挑战以及国家卫生服务资源日益增长的成本效益配置需求,英格兰和威尔士的国家卫生与护理卓越研究院(NICE)牵头开发了医疗技术评估项目(MTEP),该项目于2009/2010年启动。然而,对MTEP前三年成果的一项分析表明,该项目在实现预先设定的目标方面仍有待改进,这些目标包括简化评估准入、加快评估流程以及提升NICE对器械的评估能力(Chapman 等,2014)。
鉴于这一背景,欧盟委员会于2013年在其第七框架计划下资助了“医疗技术卫生技术评估方法(MedTecHTA)”项目,其总体目标是改进现有针对医疗器械的卫生技术评估和经济评估方法学框架(博科尼大学 ‐ CERGAS,2016)。MedTecHTA项目的起点是,在整个研究计划所包含的七个工作包中的第一个工作包中,对当前医疗器械评估的方法和途径进行回顾。该项目设计了三项关联的研究:一项是对器械国际监管程序的综述,一项是对当前国际医疗器械HTA实践的调查,以及一项对药物与器械在HTA报告中方法应用的实证比较。由于前两项研究的详细内容已在其他地方发表(Ciani 等,2015;Tarricone 等,2014),本文重点聚焦于第三项研究。本文其余部分简要概述了先前开展的研究,阐述了HTA报告比较研究的方法与结果,并以讨论收尾,综合考虑工作包1的研究发现所带来的影响。总体目标是提供对现有医疗器械监管和HTA方法的当代回顾与评述,并提出基于证据的建议,以改进这些技术的政策评估框架。
1.1. 当前国际医疗器械的国际监管与卫生技术评估实践
2014年,塔里科内等人(2014)基于对文献的系统评价以及对多个国际司法管辖区监管机构的访谈,研究了当前医疗器械的监管实践,这些司法管辖区包括欧盟(欧盟委员会健康与消费者总司、健康技术与化妆品部门)、美国(食品药品监督管理局、FDA)、澳大利亚(治疗用品管理局)、加拿大(加拿大卫生部)和中国(中国国家食品药品监督管理总局)。该综述揭示了若干问题。首先,器械监管框架十分复杂,很大程度上是因为技术种类繁多。其次,现有的医疗器械监管流程所产生的临床证据少于药品相应的流程。第三,医疗器械被划分为若干监管类别之一,通常依据器械相关风险、制造商对器械的预期用途以及器械的适应症。在欧盟,《欧盟委员会医疗器械指令 93/42/EEC》定义了四类器械,根据风险评估进行分级,考虑以下四个维度:(i) 与患者接触的持续时间;(ii) 侵入性;(iii) 预期用途及对外部能源的依赖;(iv) 受影响的解剖区域的位置。器械分类决定了证明安全性和有效性所需的证据水平和评估程度(例如,侵入性和高风险器械需要更多证据);然而,不同司法管辖区在这些要求方面存在显著差异。特别是,与美国相反,欧盟现行的监管体系通常不要求为高风险器械的批准提供充分统计效能的随机对照试验。第四,一种常见的方法用于加快监管流程的做法是允许新器械宣称其与市场上已有的其他器械相似(例如美国食品药品监督管理局的510(k)流程)。美国最高法院已承认,实质性等效并不能保证医疗器械的安全性和有效性,此前有作者指出,如果某些通过510(k) clearance的器械经历了完整的上市前申请流程,其风险可能更早被发现(Campillo‐Artero,2013)。最后,尽管监管流程始终要求制造商履行上市后监管义务,但此类批准后监测方法通常仅限于对已上市器械不良事件的被动报告。
在更好地理解了医疗器械监管的复杂性之后,我们着手研究卫生技术评估机构如何在有关器械覆盖范围、报销或使用建议或决策的背景下评估这些技术。为实现这一目标,奇亚尼等人(2015年)对36个非欧盟卫生技术评估机构的医疗器械相关活动进行了调查。数据收集分为两个阶段——首先使用标准化问卷对机构网站进行评估,随后对部分机构的机构人员进行半结构化电话访谈。该调查有三项主要发现。第一,尽管所调查的机构中有27家(75%)已采用针对器械的特定卫生技术评估方法,但这些方法主要是组织性的(例如,指派专门人员负责医疗器械评估)或程序性的(例如,召集专门委员会来评估器械证据并提供政策建议)。机构程序的异质性对于希望在多个司法管辖区开展卫生技术评估流程的制造商而言是一个重要挑战。第二,只有一家机构(即巴西科学技术部)制定了针对医疗器械的方法学指南(巴西卫生部,2014年)。最后,除了缺乏可靠的临床证据这一问题外,许多接受访谈的机构还指出资源不足(如预算和熟练员工)、监管机构与报销机构之间缺乏协调,以及无法将证据综合的结果进行推广,是医疗器械卫生技术评估中的关键挑战。
1.2. 比较医疗器械与药物的卫生技术评估报告评估
尽管科学文献已指出当前可用于医疗器械(MDs)的卫生技术评估(HTA)和经济评估方法的局限性(Cohen 和 Billingsley,2011;Kramer 等,2012;Sorenson 和 Drummond,2014),但尚未有研究正式比较这些方法在医疗器械HTA报告与药物技术HTA报告样本中的应用情况。本工作包1中的第三项研究旨在解决以下具体研究问题:(i)医疗器械与药物HTA报告中所包含的证据性质和结局指标有何不同?(ii)应用于医疗器械与药物HTA报告中的方法(例如系统评价和经济评估)是否存在差异?以及(iii)在医疗器械与药物的HTA报告中,数据不确定性是如何被处理并反映在技术采纳或政策建议中的?
鉴于心血管领域是全球销售额、销售增长和市场份额方面仅次于体外诊断的第二大器械领域(MedTech Europe,2015),并且考虑到我们在MedTecHTA项目中可充分利用与欧洲心脏病学会的合作关系,因此决定将医疗器械与药物HTA报告的比较聚焦于心血管疾病领域。
2. 方法
2.1. 卫生技术评估报告的识别
通过检索约克大学评论与传播中心卫生技术评估数据库中2003年至2014年的文献来识别卫生技术评估报告。检索策略列于附录A。
2.2. 报告的筛选与选择
如果HTA报告评估的药物或器械其主要适应症为心血管疾病(即脑血管、心脏或外周血管疾病),则将其纳入。我们排除了主要适应症非上述疾病的报告。
适应症并非心血管疾病;评估的外科手术未涉及医学博士(MD);针对的是诊断或预后问题;主要是指南或综述,评估的是疾病适应症的管理而非特定技术;不是完整的卫生技术评估报告(即对新型或已有卫生技术进行全面的系统性评估,评价维度包括效果、安全性、成本效益,以及常涉及的伦理、法律、组织和社会后果等方面;Velasco 等,2002);以及无法以英文全文公开获取。研究团队的两名成员(B. W. 和 R.S. T.)独立对所有标题和摘要进行纳入筛选。对于报告纳入存在分歧的情况,均通过讨论达成共识。
2.3. 数据提取和质量评估
使用标准化数据提取工具,我们从纳入的卫生技术评估报告中提取了以下类别的信息:一般信息(例如研究标题、发布HTA报告的机构名称)、证据性质(例如所包括的临床或经济学研究类型)、应用方法(例如系统评价和经济评估)、结果(例如全因死亡率结局的治疗效果)、特定技术考虑因素(例如器械的渐进式创新或药物给药方式)、处理不确定性的方法(例如敏感性分析)以及结论(例如最终政策建议)。
药物和器械报告中呈现的主要结局指标根据一个通用定义被分类为“最终”或“替代指标”,其中替代指标是指旨在替代患者相关结局的生物标志物或中间结局(生物标志物定义工作组,2001)。
我们将此分类应用于每份HTA报告中的主要结局(即报告中明确指出的主要结局,或未明确指出时报告中讨论的第一个结局)。由于心血管疾病是导致死亡的主要原因,我们提取了报告中关于全因死亡率以及主要结局(如提及)的治疗效果。同时记录了基础病例增量成本效益比。报告的政策建议根据英国国家卫生与临床优化研究所(NICE)技术评估结果(NICE,2013)进行分类:(i)推荐:批准在卫生系统范围内对所有或特定获批适应症或患者亚组使用干预措施;(ii)优化:批准在特定获批适应症或患者亚组中常规使用;(iii)仅限于研究:仅在适当的研究背景下使用干预措施;(iv)不推荐:因临床或成本效益证据不足而拒绝批准。
我们根据两个质量维度评估了卫生技术评估报告所采用的方法:系统综述方法使用评估系统评价的测量工具(AMSTAR)(Shea 等,2007;Shea 等,2009)进行评估,经济学评价方法则使用经验证的检查清单(Drummond 等,2005)进行评估。AMSTAR评分通过汇总单项条目计算得出,质量最高得分为11分。我们使用10项德拉蒙德清单来评估所纳入HTA报告中提供的经济评估的有效性。本研究应用了一组先前描述的与德拉蒙德清单项目相关的全球加权值(Drummond 和 Jefferson,1996;La Torre 等,2010)。当35项检查清单中的多个问题对应于10项清单中的单个问题时,通过取相关问题的全球权重平均值来计算新的权重。经济学评价质量评分的最高可能得分为43.3。最初的数据提取条目列表在一个随机选择的药品卫生技术评估报告上进行了试点测试。在此试点应用之后,我们对条目进行了修改,并在必要时更新了相应的说明。这些条目还在一个随机选择的器械报告上进一步测试。最终的67项数据提取条目列于附录B中。所有纳入的HTA报告的数据均由研究团队的一名成员(B. W.)提取,并由第二位评审员(A.G.)独立核对。
2.4. 数据分析
定量数据(例如,每份报告中包含的随机对照试验数量)通过中位数、范围和百分比在各报告间进行汇总。我们使用非参数统计方法(即针对连续性和分类结果的曼‐惠特尼检验以及费希尔精确检验或对二元结果进行卡方检验。我们旨在通过荟萃分析汇总报告的死亡率以及明确说明的主要结局指标结果,比较器械与药品治疗效果的大小。该比较将揭示在心血管领域,器械技术与药物技术所产生的平均治疗效果是否存在显著差异,从而判断是否需要针对器械技术进行特定的方法学调整。描述性信息(例如不确定性处理方法)则进行了主题分析,并在可能的情况下对器械报告与药物报告进行了比较。
数据最初被提取到 MS Office Access 表单中,并使用 STATA©13.2 StataCorp LP 对定量和定性数据进行分析。
3. 结果
3.1. 纳入的卫生技术评估报告的描述
HTA报告的筛选过程总结见图1。在筛查的699份HTA报告中,有45份HTA报告符合纳入标准并被纳入本次审查(表I)。其中,18份为医疗器械报告,27份为药物报告,主要来自加拿大(n = 15)、英国(n = 20)和美国(n = 8)。纳入的医疗器械报告与药物报告在发表日期、心血管适应症以及发布机构方面总体相似。所有报告所涉及的器械均属于“中等风险”或“高风险”(即IIa类及以上),依据欧盟委员会医疗器械分类系统(欧洲共同体理事会,1993年)。
表I. 关键 纳入的健康技术评估报告的主要特征摘要评估报告
| 药物 (N = 18) | 器械 (N = 27) | 药物与器械 | |
|---|---|---|---|
| n (%) | n (%) | P值 | |
| 发表日期 | |||
| 2003–2008 | 2 (11) | 2 (7) | 1.00a |
| 2009–2013 | 16 (89) | 25 (93) | |
| 出版国家 | |||
| 澳大利亚 | 0 (0) | 1 (4) | 0.13b |
| 加拿大 | 3 (17) | 12 (44) | |
| 爱尔兰共和国 | 0 (0) | 1 (4) | |
| 英国 | 12 (67) | 8 (30) | |
| 美国 | 3 (17) | 5 (19) | |
| 心血管适应症 | |||
| 脑血管 | 2 (11) | 0 (0) | 0.20b |
| 心脏 | 12 (67) | 19 (70) | |
| 外周 | 4 (22) | 8 (30) | |
| 器械分类 | |||
| I类(低风险) | NA | 0 (0) | — |
| IIa类(中等风险) | NA | 3 (11) | |
| IIb类(中等风险) | NA | 5 (19) | |
| III类(高风险) | NA | 19 (70) |
a费希尔精确检验。b卡方检验。
3.2. 证据性质与结局指标
与药物报告相比,器械报告更可能包含非随机对照试验/观察性研究(44%/48% vs 22%/17%)(表II)。当药物或器械报告考虑随机对照试验时,它们所包含的随机对照试验数量相似(每份报告中位数为五项)。然而,药物报告中所纳入的随机对照试验、非随机对照试验和观察性研究的平均患者数量是医疗器械报告的三倍。大多数药物
表II. 卫生技术评估报告所考虑的证据性质
| 药物(样本量= 18) | 器械(样本量 = 27) | 药物与器械 | |
|---|---|---|---|
| n (%) 中位数(范围) | n (%) 中位数(范围) | %b的P值 中位数a的P值 | |
| 临床研究类型 | |||
| RCTs | 17 (94) 5 (1; 35) | 18 (67) 5 (1; 82) | 0.03 0.92 |
| 非随机对照试验 | 4 (22) 5.5 (1; 18) | 12 (44) 6 (2; 29) | 0.13 0.43 |
| 观察性研究 | 3 (17) 46 (13; 92) | 13 (48) 25 (4; 53) | 0.03 0.24 |
| 证据综合c | 6 (33) 5.5 (5; 30) | 8 (30) 5(1;15) | 0.79 0.30 |
| 其他d | 1(6) 89(不适用) | 2(7) 1.5(1;2) | 0.81 0.22 |
| 患者数量 | |||
| RCTs | 13 (72) 4203 (34; 66 477) | 12 (44) 1482 (291; 35 597) | — 0.23 |
| 非随机对照试验 | 3 (17) 4917 (926; 184 372) | 5 (19) 836 (79; 12 217) | — 0.18 |
| 观察性研究 | 1 (6) 7636 (不适用) | 7 (26) 646 (76;13 890) | — 0.51 |
| 证据综合c | 1 (6) 102 594 (不适用) | 1 (4) 102 594 (NA) | — 0.32 |
| 经济评估类型 | |||
| 成本分析 | 1 (6) 5 (NA) | 4 (15) 1.5 (1;2) | 0.33 0.14 |
| 成本最小化分析 | 0 (0) — | 0 (0) — | — — |
| 成本效益分析 | 8 (44) 4 (1; 20) | 9 (33) 2 (1; 8) | 0.45 0.53 |
| 成本效用分析 | 8 (44) 3.5 (1; 8) | 9 (33) 1 (1; 4) | 0.45 0.11 |
| 成本‐效益分析 | 0 (0) — | 1 (4) 1 | 0.41 — |
| 成本‐结果分析分析 | 0 (0) x — | 0 (0) — | — — |
随机对照试验(RCT)、卫生技术评估(HTA)。a曼‐惠特尼检验。b费希尔精确检验。c系统综述、荟萃分析和HTA报告。d快速综述以及不属于上述证据类别等级体系的证据来源。
报告(17/18,94%)和器械报告(23/27,85%)以部分或完整评估的形式考察了经济学研究。
根据HTA核心模型®分类(EUnetHTA联合行动2号工作包8,2016年),药物和医疗器械报告均一致考虑了安全性、有效性以及经济性证据(表III)。与药物报告相比,器械报告较少提供技术及其相关疾病适应症的详细描述。相反,44%(12/27)的医疗器械报告考虑了组织性问题,而药物报告中仅有6%(1/18)考虑了此类问题。在45份报告中,有36份(82%)考虑了最终结局指标(如全因死亡率和心血管死亡率),其中药物报告为14/18(78%),医疗器械报告为22/27(81%)。其余9份报告考虑了替代指标结局(如低密度脂蛋白胆固醇(LDL‐胆固醇)、最大步行距离以及从心房颤动转为正常窦性心律的平均时间);其中5份(19%)为器械报告,4份(22%)为药物报告。
3.3. 卫生技术评估报告应用的数据综合方法
大多数药物和医疗器械报告均包含了对临床研究(37/45,82%)和经济学研究(19/45,42%)的系统评价(表IV)。与医疗器械报告相比,药物报告更可能进行荟萃分析(10/18,56% vs 9/27,33%)。约60%的药物报告和器械报告进行了从头开始的模型化经济分析。药物报告在系统综述和经济学评价方法方面的质量似乎高于医疗器械报告。药物报告和器械报告的AMSTAR评分平均分别为7.5和5.5(最高得分为11分)。根据德拉蒙德清单,药物报告和器械报告的平均得分分别为29分和21分(最高得分为43.3分)。
大多数药品(16/18,89%)和医疗器械(18/27,67%)报告均考虑了技术特异性问题。对于药品,剂量、治疗持续时间和给药方式均有普遍报告。对于医疗器械,最常见的问题是使用医疗环境、学习曲线以及设备代次或型号。然而,这些技术特异性问题通常仅在HTA报告的讨论部分被简要提及。没有任何报告包含正式的定量分析,以评估这些问题可能对器械的临床有效性或成本效益产生的影响。
约60%的药物和医疗器械报告在其临床和经济有效性部分进行了不确定性评估。对于这两类报告,最常用的方法是敏感性分析(确定性或概率性)、使用95%置信区间以及报告P值。
3.4. 治疗效果和经济结果的大小
我们旨在通过汇总药物和医疗器械报告中关于全因死亡率的临床治疗效果以及增量成本效益比,来比较药物和医疗器械报告。然而,临床和经济结局指标的类型在不同报告中,结果指标(例如比值比和风险比)、定义(例如全因死亡率、心血管死亡率和血管性死亡)以及随访时间点(例如7天、30天和6个月)存在高度异质性。因此,本研究认为跨报告合并治疗效果是不合适的。部分药物报告(4/18,22%)和医疗器械报告(7/27,26%)基于荟萃分析提供了全因死亡率的合并值。10份(56%)药物报告和16份(59%)器械报告报告了基础病例增量成本效益比。在医疗器械报告与药物报告之间,实验性技术相对于对照的死亡率获益幅度或成本效益比未见实质性差异。
表IV. 卫生技术评估报告的证据综合方法
| 方法 | 药物 (N= 18) | 器械 (N= 27) | 药物与器械 P值 a | 总计 N |
|---|---|---|---|---|
| n (%) | n (%) | |||
| 数据合成方法 | ||||
| 临床结果的系统评价 | 18 14 (78) | 27 23 (85) | 0.52 | |
| 荟萃分析 | 18 10 (56) | 27 9 (33) | 0.14 | |
| 经济学评价的系统评价 | 18 9 (50) | 27 10 (37) | 0.39 | |
| 经济模型 | 18 11 (61) | 27 17 (63) | 0.90 | |
| AMSTAR(系统评价质量) | ||||
| 是否提供了“先验”设计? | 15 13 (87) | 24 12 (50) | 0.04 | |
| 是否进行了重复的研究选择和数据提取? | 15 13 (87) | 24 10 (42) | 0.01 | |
| 是否进行了全面的文献检索? | 15 14 (93) | 24 20 (83) | 0.78 | |
| 是否将发表状态(即灰色文献)作为纳入标准? | 15 10 (67) | 24 18 (75) | 0.65 | |
| 是否提供了研究列表(纳入和排除)? | 15 12 (80) | 24 8 (33) | <0.001 | |
| 是否提供了纳入研究的特征? | 15 10 (67) | 24 20 (83) | 0.36 | |
| 是否评估并记录了所纳入研究的科学质量? | 15 14 (93) | 24 17 (71) | 0.078 | |
| 所纳入研究的科学质量是否被恰当地用于制定结论? | 15 10 (67) | 24 13 (54) | 0.32 | |
| 用于合并研究结果的方法是否恰当? | 15 9 (60) | 24 9 (38) | 0.17 | |
| 是否评估了发表偏倚的可能性? | 15 6 (40) | 24 3 (13) | 0.12 | |
| 是否包含了利益冲突? | 15 1 (7) | 24 2 (8) | 1.00 | |
| 总分 – 平均值(标准差) | 15 7.5 (2.2) | 24 5.5 (2.7) | 0.04b | |
| 德拉蒙德检查表(经济评估质量) | ||||
| 是否提出了明确的问题? | 11 4 (36) | 17 8 (47) | 0.71 | |
| 是否给出了竞争性替代方案的全面描述?(即你能说出谁对谁做了什么、在哪里以及多久一次吗?) | 11 11 (100) | 17 11 (65) | 0.06 | |
| 项目或服务的有效性是否已确定? | 11 7 (64) | 17 8 (47) | 0.46 | |
| 是否已识别出每种已确定替代方案? | 11 7 (64) | 17 10 (59) | 1.00 | |
| 成本和后果是否以适当的物理单位准确测量(例如护理时间(小时)、医生就诊次数、误工天数和获得的生命年)? | 11 7 (64) | 17 8 (47) | 0.46 | |
| 成本和后果是否被合理估值? | 11 10 (91) | 17 12 (71) | 0.36 | |
| 成本和结果是否根据时间差异进行了调整? | 11 8 (73) | 17 9 (53) | 0.44 | |
| 是否对替代方案的成本和结果进行了增量分析? | 11 11 (100) | 17 9 (53) | 0.01 | |
| 是否在成本和后果? | 11 10 (91) | 17 10 (59) | 0.10 | |
| 研究结果的呈现和讨论是否包含了用户关心的所有问题? | 11 8 (73) | 17 10 (59) | 0.69 | |
| 加权总分——均值(标准差) | 11 29 (7.1) | 14 21 (9.2) | 0.03b |
HTA,卫生技术评估;AMSTAR,评估系统评价的测量工具。aP值使用费希尔精确检验计算。bP值使用曼‐惠特尼U检验计算。
3.5. 卫生技术评估报告提出的政策建议
仅有少数报告(18份药物报告中的5份,占28%;27份器械报告中的6份,占22%)包含了政策建议(表V)。在已报告的情况下,药物报告与器械报告的作者所提出的建议类型之间没有显示出差异的证据。然而,更高比例的器械报告(83% vs 21%)推荐“优化”采用,表明可能由于上市前证据不足、证据质量差距或需要了解实际使用情况,对于器械而言,在评估时有更大的空间来简化适应症。
4. 讨论
创新医疗器械的开发在疾病管理和健康促进中发挥着核心作用。2015年,全球市场价值达2100亿欧元,高于2010年的1500亿欧元,并预计到2018年将达到4030亿欧元,复合增长率约为每年4.4%。西欧约占全球医疗器械市场的25%,其中德国位居首位,随后是法国、英国和意大利(Cunningham等,2015年)。然而,目前医疗器械的许可和报销途径仍面临重要挑战。近年来,由于安全性问题引发的多起高调的器械召回事件受到了广泛关注(Thompson等,2011年;Zuckerman等,2011年),这些问题包括乳房植入物(Lahiri和Waters,2006年)、特定类型的人工髋关节(Curfman和Redberg,2011年)以及植入式心律转复除颤器导线(Maisel,2008年)。
针对这一持续的争论,我们对当前国际许可和医疗器械HTA实践进行了全面审查。我们的研究凸显了一些重要发现。首先,尽管我们观察到各监管机构在上市前和上市后审批依赖性方面的要求平衡存在差异,但本研究证实,全球范围内的现行监管流程通常比药品的监管流程宽松得多。这一说法首次通过医疗器械HTA报告与药品HTA报告的比较评估得到证实,结果显示,纳入观察性和非随机对照试验证据且基于较小临床研究的医疗器械报告比例显著更高。虽然目前尚无统一的医疗器械国际分类体系,但监管机构似乎始终将其许可所需的证据要求与不同类别器械使用相关的患者风险水平相联系。例如,与其他国际监管机构相比,美国食品药品监督管理局更有可能要求高风险(如III类)植入式产品提供上市前随机对照试验。
其次,我们对卫生技术评估机构的访谈及其报告的审查证实,为医疗器械监管要求所产生的临床证据不足,导致在开展卫生技术评估时遇到困难,在某些司法管辖区可能造成资金支持和患者可及性的延迟。此类挑战包括在使用观察性数据对器械进行可靠的有效性及成本效益评估时存在的能力或专业知识缺口以及方法学困难。这一特定方面体现在我们的比较研究中所显示的医疗器械HTA报告的方法学质量低于药物报告。
表V. 卫生技术评估报告提出的政策建议b
| 药物(样本量 = 18) | 器械 (样本量= 27) | 药物与器械 | |
|---|---|---|---|
| n (%) | n (%) | P值a | |
| 推荐 | 1 (20) | 0 (0) | 0.26 |
| 优化 | 1 (20) | 5 (83) | |
| 仅限于研究 | 1 (20) | 0 (0) | |
| 不推荐 | 2 (40) | 1 (17) | |
| 未报告 | 13 (72) | 21 (78) |
a卡方检验。 b根据国家卫生与护理卓越研究院技术评估决策结局指标分类。
第三,许多卫生技术评估机构已针对器械评估的处理开发了特定的组织结构和流程。机构程序的异质性对制造商而言是一个不利因素,因为他们需要为不同的申报材料进行准备和安排。然而,我们发现几乎没有证据表明卫生技术评估方法学被定量地用于考虑器械的特殊性。在考察HTA报告中方法的实证应用时,我们发现与药物报告相比,医疗器械报告更有可能考虑卫生技术实施中的组织方面,这证实了与环境相关、与机构相关以及与操作者相关的因素在塑造器械有效性方面所起的关键作用。尽管HTA报告经常承认医疗器械特有问题(即组织因素、学习曲线以及观察性证据与试验性证据的结合),但令人失望的是,它们往往未能评估这些医疗器械特有技术问题对器械成本效果或不确定性所产生的定量影响。
尽管对纳入的HTA报告采用系统性方法进行选择、数据提取和分析,增强了本研究结果的可靠性,但符合条件的文件数量较少,且均为英文发表并涉及心血管疾病,因此可能无法推广至其他疾病类型。然而,鉴于器械技术在心血管疾病领域无论在经济学还是治疗方面均具有重要意义,如果有任何关于器械评估的方法学发展被采纳,很可能首先在此特定疾病领域实施。针对其他疾病类型的药物与医疗器械HTA报告开展进一步的比较分析,可能有助于进一步阐明我们的研究发现。
我们的研究结果对于监管机构、卫生技术评估决策者、制造商和临床研究人员均具有重要意义,有助于改进并加快评估流程,从而确保那些被证明安全且具有成本效益的器械能够更快地惠及患者。首先,尽管在批准前所需证据的类型应与新型器械的潜在风险相匹配似乎是合理的,但对于中高风险器械而言,需要更严格地要求提供有关有效性和安全性的临床数据。应采用适当的方法学选择,以确定能够应对医疗器械临床评价所带来特殊挑战的试验设计(Bernard 等,2014)。与此相关的是,有必要推动监管要求的国际协调,并努力制定通用风险分类规则。此外,上市后监测对于器械尤为重要,不仅用于安全性监测,还应超越临床试验环境中所证明的有效性,评估其在常规使用中的有效性。应鼓励收集并促进获取器械及其使用者的真实世界数据,以提供更多关于不良事件、学习曲线以及医疗器械对组织影响的信息,从而在技术进入常规实践后支持对其重新评估。当前许可流程与卫生技术评估(HTA)流程之间存在加强衔接的需求和机会。尽管许可机构与HTA机构的目标不同,但在大多数国际司法管辖区,正是HTA驱动着医疗系统的资金支持,因而事实上成为医疗器械可及性的障碍(Tsoi 等,2013)。这一点对于首次在欧盟获得许可的器械尤为明显,制造商通常需要为HTA机构进一步生成临床和经济性证据,以获得报销资格。基于实质性等效的审批体系(例如美国510(k)审批流程)已被建议取代为一种整合的上市前和上市后监管框架,该框架能够在整个器械生命周期中有效提供安全性和有效性的合理保证(Heneghan 和 Thompson,2012;索伦森和德拉蒙德,2014)。
未来器械监管的一种潜在合作模式是目前在安大略省运行的MaRS 临床技术评估卓越(EXCITE)项目(Mars,2011年)。在EXCITE项目中,器械制造商可同时与监管机构(加拿大卫生部)和HTA机构(安大略省卫生技术办公室)进行讨论,共同设计临床试验方案,以满足监管机构和HTA机构的双重需求。随后鼓励并支持向这两个决策机构进行“并行提交”。目前正在开展的EXCITE器械项目包括:针对卒中患者上肢运动的电刺激治疗、家庭睡眠呼吸暂停事件检测仪,以及用于乳腺癌患者对化疗完全反应早期预测的RNA干扰检测法(Levin,2015)。2010年,美国食品药品监督管理局与医疗保险和医疗补助服务中心提出对其各自针对新型医疗器械的审查流程进行部分协调。这两个机构最近宣布,他们将实施并无限期延长医疗器械平行审查试点项目,从而允许寻求医疗保险和医疗补助服务中心国家覆盖范围决定的产品赞助方,在FDA审评流程的后期阶段同时更早地提出审查请求。所提议的协调证据生成体系被认为可节省时间、减少临床开发路径中的不确定性、加快市场准入,同时促进生成能够同时满足监管机构、支付方、患者和临床医生信息需求的更高质量证据(梅斯纳和突尼斯,2012)。
在欧洲,“塑造欧洲早期对话项目”已作为试点平台被开发出来,以促进与监管机构(即欧洲药品管理局)、选定的欧洲卫生技术评估机构以及产业界进行早期对话的机会(哈鲁索等,2015)。截至目前开展的11次早期对话中,有三次涉及医疗器械申报材料。一项相对简单但可能非常有效的举措是,监管机构向卫生技术评估机构更广泛地公开其文件和流程(贝尔恩特根等,2014)。
卫生服务研究界需要扩展现有的随机对照试验和卫生技术评估方法,以有效考虑器械的特定问题。欧洲卫生技术评估网络(EUnetHTA,2015)近期发布的医疗器械指南强调了此类方法学创新的重要性。MedTecHTA项目中产生的两项针对器械特有问题的方法学发展示例,已在本期《健康经济学》增刊的其他文章中详细阐述(施内尔‐因德斯特 等,2017;瓦拉比约娃 等,2016)。此外,卫生技术评估机构还需加强能力建设,以推动这些尚未充分利用的方法的实际应用。
当前的许可和卫生技术评估(HTA)体系正在持续发展,其具体目标是评估包括医疗器械在内的卫生技术的安全性、性能、功效、有效性和附加价值。迄今为止,这两者之间尚未实现明显的协调。根据我们研究项目的发现,我们建议所有相关方开展持续对话,就许可和资金支持新型器械所需的临床和卫生经济学证据类型达成一致,以加强证据基础,推动创新性HTA方法学的发展与应用,并缩短患者获得具有成本效益器械所需的总体时间。

625

被折叠的 条评论
为什么被折叠?



