纳入环境数据能否提升CDS识别儿童哮喘风险的能力?

本文转自:中国网
健康号
纳入环境数据能否提升CDS识别儿童哮喘风险的能力?】纳入环境数据能否提升CDS识别儿童哮喘风险的能力?文/CDSreport2022-05-2520:38:52来源:中国网医疗频道研究者表示无法考虑所有可能对哮喘恶化产生重大影响的变量 , 包括药物补充数据、室内环境和直接呼吸道病毒暴露 。
导读
此项研究目的是开发一种临床决策支持(CDS)工具 , 来准确识别出哮喘发作风险最大的儿童 。 研究评估了临床数据 , 及空间和时间分辨的环境数据对哮喘恶化预测模型性能的价值贡献 。
哮喘是一种慢性气道疾病 , 在美国影响超过500万儿童 , 每年有超过一半的哮喘儿童会出现急性加重 , 其中有1/6会到急诊室就诊 , 每20人中有1人因哮喘加重需要住院 。 哮喘加重由多种临床和环境因素引发 , 但这些因素的相互作用及其对恶化风险的影响尚不清楚 。
近期发表在BMCMedicalInformaticsandDecisionMaking的一项研究 , 探索了开发临床决策支持(CDS)工具的潜力 , 以识别在30天、60天和180天期间哮喘发作高风险的儿童 。 评估了EHR中提取的临床数据 , 及空间和时间分辨的环境数据对儿童哮喘恶化预测模型性能的影响 , 并表明空间和时间数据没有显着提高模型性能 。
01
临床、空间、时间三方面数据关联纳入评估
该研究使用杜克大学卫生系统(DUHS)的回顾性数据进行的 , DUHS包含一家三级保健医院、两家社区医院以及初级保健网络专业诊所的EHR系统 , 基于EHR的临床研究数据集市(clinicalResearchDatamart)提取了阶段时间的临床数据 , 确定了6395名(5-18岁)患有哮喘的儿童 , 根据相应条件 , 最终5982名儿童纳入研究分析 。 研究采用临床数据与空间数据、时间数据的所有预测变量相关联 , 评估模型在预测儿童哮喘恶化方面的效用 。 以下为各方数据提取来源:
临床数据:从EHR中提取每个孩子的临床和社会人口学信息 , 包括性别、年龄、种族、保险类型、合并症、药物处方 。
空间数据:根据患者地址得出社区层面的环境数据 。 通过每个孩子的居住地邮政编码和美国社区调查的相关数据 , 来计算医疗保健研究与质量机构(AHRQ)的社会经济地位指数(SES);使用ArcGIS计算数据集中每个地理编码地址到道路的直线距离 。
时间数据:从美国环境信息中心下载了每日平均气温、总降水量等气候数据;从美国环境保护署下载了最大二氧化硫读数等空气质量数据;还从环境质量部下载了花粉数据;以及通过提取当月每天进行流感检测的次数来计算季节性流感负担等 。
02
EHR中提取的临床数据赋予模型预测性能更多价值
研究者使用LASSO、随机森林和xgBoost构建Person-Month预测模型 , 由5组不同的预测变量(所有预测变量、时间因素、临床因素、空间因素、简约模型)训练出15个不同模型 , 在三个不同的时间范围(30天、90天和180天) , 预测儿童哮喘恶化的风险 。 通过计算预测事件发生率和曲线下面积(AUC)来比较不同模型的性能 。
研究结果显示 , 所有模型的短期预测性能优于长期 , xgBoost模型的性能名义上优于使用LASSO或随机森林的模型 。 在评估时间、空间和临床因素对模型预测恶化风险的相对贡献时发现 , 无论采用何种建模方法 , 临床因素赋予了模型预测性能更多价值 , 时间因素赋予的预测价值偏低 , 空间因素的预测价值最小 。 以随机森林预测模型30天时间范围内的结果为例:基于临床因素模型AUC=0.741 , 基于时间因素模型AUC=0.608 , 基于空间因素模型AUC=0.502 , 简约模型AUC=0.672 。