2022-02-09 912
导 语
10月21日,美国FDA 发布《用于药品和生物制品提交的真实世界数据标准》指南草案,概述了对申办者应如何提交来自真实世界数据 (RWD) 来源的药品和生物制品研究数据的想法。
此前,海南省真实世界数据研究院副院长、北京大学第一医院姚晨教授团队一直从事数据标准化方向的课题研究,其通过前期对不同利益相关方的调研,以及对FDA最新指南的解读,总结归纳出了真实世界数据标准化的重要挑战,并提出相应解决方案与建议。
一、FDA对于真实世界数据标准的考量
申办者如何提交来自真实世界数据 (RWD) 来源的药品和生物制品研究数据?指南草案中提出的考量如下:
(一)推广符合FDA当前支持的CDISC研究数据标准在真实世界数据的应用。
目前,如研究数据指南所述,FDA可以处理、审查和存档使用数据标准目录(Catalog)中指定标准的临床和非临床研究数据(包括来自RWD来源的数据)的电子提交。正如该指南所解释的,目录提供了当前支持或要求的标准、它们的用途、FDA支持标准的期限、以及其他相关信息的列表。FDA发布本指南是为了向申办方提供建议,当在适用的药物申报资料中提交来自RWD来源的研究数据时,使用目录中规定的标准遵守FD&C法案的第745a(a)节。
FDA计划发布进一步的指南和/或使用源自RWD来源的研究数据标准更新目录。目前,在没有豁免的情况下,在FD&C法案第745a(a)节的申报资料中提交临床和非临床研究数据(包括源自RWD来源的数据)的申办方需要使用研究数据指南中描述的格式和目录中列出的研究数据标准。申办方在向FDA提交适用的药物申报资料中提交研究数据时,应参考《研究数据技术一致性指南》中提供的质量标准、建议和一般注意事项。当寻求使RWD符合FDA支持的数据标准时,申办方应考虑在适用的药物提交中以所需格式生成研究数据集可能需要的相关数据转换或映射。
申办方应与适当的FDA审查部门尽早讨论在适用的药物提交资料中从RWD来源获得的任何计划的研究数据提交资料及其将数据转换为当前FDA支持的数据标准的方法。申办方应描述这些方法,包括在方案、数据管理计划和/或最终研究报告中。FDA认识到,可以使用一系列方法将当前支持的数据标准(例如,临床数据交换标准协会(CDISC)的研究数据列表模型(SDTM))应用于RWD来源,例如EHR或索赔数据。在充分记录所使用的一致性方法及其依据后,可将源自RWD的研究数据转换为SDTM数据集,并在适用的药物申报资料中提交给FDA。
透过在元数据记录里明确阐述数据意义上的区别,加强真实世界数据到临床研究数据中的可溯源性:
在数据管理和数据转换过程中,应建立适当的流程以增加对所得数据的可靠性。这些过程的记录可能包括但不限于从源数据系统到最终研究分析数据集的数据添加、删除或更改的电子文件(即元数据驱动的稽查跟踪、质量控制程序等)。申办方还应在其适用的药物提交资料中记录数据的变更,以符合当前FDA支持的数据标准,以及这些变更的潜在影响。
FDA意识到,对于几乎每个数据域,RWD来源和FDA支持的数据标准之间使用的术语及其精确含义存在很大差异。示例范围包括用于人种/种族的含义和特定术语,药物的术语系统以及用于重要测量的医疗保健记录的解释。即使对于看似相同记录的变量(例如,男性/女性),在RWD来源和FDA支持的数据标准之间定义这些变量的方式也可能存在差异。例如,性别作为变量可以在CDISC的术语中编码为基于身体特征的概念,而EHR可以使用性别身份。在这种情况下,申办方应记录将性别变量或其他变量映射到CDISC的术语对研究结果的潜在影响。
记录申办方为RWD选择特定CDISC数据元素的依据以及记录两者之间的差异至关重要。申办方应在研究数据审查员指南的一部分或附录中提供数据映射的一般方法和预期影响的描述,以突出涉及的领域。此外,申办者应包括一个数据词典,记录所使用的每个数据元素的定义以及该元素的所有相关信息,例如其与其他数据的关系、来源、用法和格式。建议把相关数据集/域中的详细映射以及流程放入Define-XML文件(请参阅附录),最好不包含在研究数据审阅者指南中(Study Data Reviewer Guide)。
(二)标准化带来的挑战源于真实世界数据的多元化以及产生的流程与研究流程不同。
FDA能理解标准化来自RWD的研究数据所涉及的挑战,这些挑战包括但不限于:
(1)RWD来源的多样性及其格式不一致(例如,EHR,注册);
(2)使用不同的标准、术语和交换格式来表示相同或相似的数据要素,在区域和全球范围内获取的源数据的差异;
(3)用于创建旨在汇总数据的数据集的各种方法和算法;
(4)可能影响数据整体质量的卫生保健数据的许多方面,包括业务流程和数据库结构,不一致的词汇和编码系统,以及共享时用于保护患者数据的去识别方法。
二、透过访谈理解国内应用数据标准的现状
了解多利益方对于标准化真实世界数据的障碍是解决标准化的策略。
在FDA发布该数据标准指南草案之前,笔者一直从事数据标准化方向的课题研究,通过前期对不同利益相关方的调研,以及解读FDA的指南,总结出以下四个重要挑战,并提出了相应建议。
1. 将国际标准本地化所需周期漫长,导致难以用于医疗
FDA提到,标准化的挑战包括了:如RWD来源的多样性及其格式不一致(例如,EHR,注册);使用不同的标准、术语和交换格式来表示相同或相似的数据要素,在区域和全球范围内获取的源数据的差异。
访谈发现:标准术语库不能完全表达医生描述患者病情的需要,也没有最通俗的术语,这使得选择最佳术语的过程更加困难。对于医院内的标准数据交换,医院信息系统供应商在不使用预先指定的标准(如HL7标准消息)的情况下实现数据交换,并根据医院的要求进行个案协商。
解决方案:多方应结合真实世界数据标准辅助本地化标准建设
2. 源数据采集的过度结构化影响诊疗过程
FDA提到,可能影响数据整体质量的卫生保健数据的许多方面,包括业务流程和数据库结构,不一致的词汇和编码系统。
访谈发现:标准实施的主要阻碍是它会加重医院临床医师的工作量。全标准化的数据采集模式需花费更多的时间来确保每个数据字段都是按照标准收集的。通常,使用全标准化的数据采集会导致临床医生放弃寻找正确的输入,而只使用“其他”选项来编写自己的答案。标准数据收集进一步可能会限制医生用于描述其决策的表达范围,并可能导致数据的过度收集或错误分类。
解决方案:将数据采集及标准化的工作尽量区分开
3. 研究数据集难以在多项研究中重复利用
FDA还提到标准化的挑战来自于:用于创建旨在汇总数据的数据集的各种方法和算法。
访谈发现:制药公司和监管机构希望利用真实世界的证据来支持医疗产品的开发和生命周期评估。根据临床指南的汇总,医院开发的疾病专科数据库通常非常定制化,但不能轻易地用于次要目的。希望使用多个专科数据库进行研究的制药公司发现,由于数据定义和结构的差异,聚合数据源是不可行的。
解决方案:推广更通用的研究数据模型以适应不同利益相关者
4. 标准化过程难以审计
FDA强调:在数据管理和数据转换过程中,应建立适当的流程以增加对所得数据的可靠性。
访谈发现:制药公司和监管机构发现真实世界的数据源难以审计,因为现成的研究数据通常是通过多步骤转换过程得出的,也不允许访问源数据。大数据公司也发现很难记录涉及多个部门和先进算法的数据标准化过程。
解决方案:应用方便核查及可溯源的管理流程
总结:如果要真正应用数据标准,必须适应和辅助诊疗过程,以及在采集多来源研究数据时,汇总多方对核查的需求。