实用|临床试验既往病史、不良事件和合并用药数据清理的方法

作者:法迈新媒体
临床试验数据管理中 , 病例报告表(casereportform , CRF)中的既往病史(medicalhistory , MH)、不良事件(adverseevent , AE)和合并用药(concomitantmedication , CM)的数据没有普遍规律可循 , 大量文本型数据需要研究者填写 , 数据量较大 , 一般需要有相关医学背景知识人员才能完全清理等特点 , 是数据清理的难点和重点 。 这部分临床试验数据的清理是衡量一个临床试验项目数据质量的关键点 , 也是监管机构评价临床试验真实、可靠、完整的切入点 。 基于当前业内临床试验数据管理趋势 , 本文欲以临床数据交换标准协会(clinicaldatainterchangestandardsconsortium , CDISC)?临床数据采集整合标准(clinicaldataacquisitionstandardsharmonization , CDASH)为基础 , 探索目前临床试验MH、AE和CM的CRF表设计的成熟性和规范化程度 。 建立一套通用、广覆盖的MH、AE和CM数据逻辑核查方案(EDC自动核查、SAS程序核查) , 用以清理MH、AE和CM三者普通逻辑错误和数据彼此矛盾的情况 。 从而标准化、模块化临床试验前期数据管理的准备工作 , 降低试验成本 , 提高效率及数据质量 。
1基于CDISC?CDASH标准的MH、AE和CM的CRF表设计
1.1CRF设计流程
CDISC建立了涵盖研究方案设计、数据采集、分析、交换、递交等环节的一系列标准 。 其中CDASH描述了基础数据采集域和CRF标准问题文字描述的变量、实施指南和最佳操作方案的融汇 。 尽管CDASH涵盖了MH、AE和CM3个表格最通用的数据采集要求 , 可以应用于绝大多数临床试验 , 但是由于每个临床项目方案不同 , 所有CRF表格还是需要进行独立的设计评估流程(图1) 。
实用|临床试验既往病史、不良事件和合并用药数据清理的方法
文章图片
1.2MH、AE和CM的CRF表
CDASH将所有需要采集的变量分为3类(表1) , 强烈推荐:一般情况下CRF都要包含这些变量;推荐:特定条件下需要包含这些变量;可选:根据方案或申办者实际需求选择性包含这些变量 。 除此之外 , 也可根据方案的实际情况 , 添加其他变量 。
实用|临床试验既往病史、不良事件和合并用药数据清理的方法
文章图片
实用|临床试验既往病史、不良事件和合并用药数据清理的方法
文章图片
1.3CRF表设计的注意点
除了事件名称外 , 尽量避免开放性的文本框 。 目前绝大多数临床研究都会使用MedDRA和WHODrug分别对AE、MH和CM的名称进行编码 , 从而使后期数据统计分析变得更加便捷 。 减少开放性文本框 , 意味着研究者填写更加便利清晰 , 数据质疑的数量将会大大减少 。
使用通用术语来定义CRF采集变量的回答选项 。 不同研究的数据采用相同变量名、回答选项术语代码、结构或格式 , 有助于数据分析和交流 , 也方便了向药政管理部门提交 。
具体化想要得到的答案 , 充分考虑可能存在的回答 。 比如合并用药开始日期可能存在不完全的情况 , 在设计阶段中 , “日”需要增加“UN”选项 , “月”需要增加“UNK”选项 , 整体日期需要增加“Unknown”选项 。
2逻辑核查
逻辑核查是指通过计算机编程 , 利用计算机软件的功能 , 对已录入CRF的数据进行验证 , 以发现存在问题的数据 。 CDISC中对逻辑核查的定义:对预期的内容逻辑、数据字段格式、范围或其他属性进行一个可追溯的、自动化的评估过程 。 逻辑核查的优点:可以对录入CRF的数据进行实时反馈;及早发现前后数据矛盾点;提高数据质量 , 使监查员和数据管理员有更多精力放在更为复杂的数据清理上 。
2.1逻辑核查的分类
根据目前普遍的数据管理流程 , 逻辑核查可分为系统实时逻辑核查和SAS程序逻辑核查两类 。 同时按照核查数据点的不同 , 又可分为单一变量逻辑核查和多变量交互逻辑核查 。