周晓华:如何用数学语言来描述进行因果分析?( 二 )
(2)单调性假设 , 即Di(1)≥Di(0) , 不存在d组;
(3)a组和d组的排他性约束假设 , 即a组和d组的两种潜在结果相等 。
下面我们用一个实际例子来说明带非依从性的因果推断[1] 。 为了研究流感疫苗的作用 , 实施一个激励试验 。 这里 , 分配的方案是鼓励打疫苗、不鼓励打疫苗 , 但被鼓励打疫苗的人仍有可能不打疫苗 , 未被鼓励打疫苗的人也有可能打疫苗 。 传统的意向治疗分析是有问题的 , 因为这种做法得到的是鼓励打疫苗的作用 , 而不是实际打疫苗的作用 。 用工具变量把人群分层后 , 估计依从组的因果作用 , 才能代表打疫苗的真实作用 。
周晓华和他的同事解决了随机临床试验中存在非依从性和不可忽略的结局缺失时研究参数的可识别性问题 , 提出了针对非依从性的贝叶斯分析方法 , 证明了在不同类型的完全不可忽略缺失数据下(即缺失机制依赖于结局) , 满足一定条件时 , 感兴趣的因果参数是可识别的 , 同时推导出了参数的最大似然估计和矩估计 , 并分析了它们在有限样本中的性质 。 当结局存在不可忽略缺失时 , 或者对于聚类激励试验 , 研究了多重填补方法[2-5] 。
利用高维协变量和观测数据 , 在不存在强可忽略性假设的情况下 , 周晓华和合作者提出了异质局部治疗效应的新估计和推断方法[6] 。 针对两阶段广义线性模型 , 给出了非凸目标函数下的Lasso估计 , 并提出了一种协变量特异治疗效果置信区间的构造方法 , 这种方法同时纠正了由于两个阶段的高维估计而产生的偏差 。 这项研究成果即将发表在JRSSB上 。
3.非标准条件下的因果推断之死亡截断
和非依从性类似 , 死亡截断也会破坏经典的因果分析假设 。 在临床试验中 , 一些个体可能在收集到结局之前就发生死亡 , 这一现象被称为死亡截断 。 需要特别强调的是 , 死亡截断与缺失数据是两个完全不同的问题:前者的结局没有定义 , 而后者的结局有定义、只不过是未被观察到罢了 。
用Zi表示第i个个体被随机分配的处理方案(假设个体依从于分配方案) , Si(Zi)表示个体i的潜在存活状态(1表示存活 , 0表示死亡) , Yi(Zi)表示潜在结果(如果Si(Zi)=1) , 用Xi表示协变量 。 仍然利用主层分析的方法 , 把人群分为四层 , 用G表示:永远存活组LL(Si(z)=1)、永远死亡组DD(Si(z)=1)、有益组LD(Si(z)=z)、有害组DL(Si(z)=1-z) 。 只有永远存活的LL组 , 其因果参数是有意义的 , 因为对于其他组来说 , 两个潜在结果至少有一个是无定义的 。 因此 , 我们关心永远存活组的平均因果作用SACE=E[Yi(1)-Yi(0)|G=LL] 。
类似地 , 为了识别存活组平均因果作用 , 需要做出额外的假设:关于S和Y的可忽略性假设、单调性假设、排他性约束假设、替代相关性假设 。 通过工具变量对人群分层 , 进而使用参数模型估计出存活组的因果作用[7,8] 。 在单调性假设下 , 有害组DL组被排除了 。 如果要放宽单调性假设 , 可将其替换为随机单调性假设 , 也就是允许DL组的存在 , 但需要事先给定Si(1)、Si(0)和LL组之间的概率关系 。
周晓华和他的同事在国际上率先提出了用于超过三个组别且存在死亡截断的多处理随机临床试验的统计方法[9] 。 此外 , 周晓华和他的同事还发展了新的推断方法来检验总体治疗效果 , 并且证明了该方法在大样本下的收敛性 , 完善了大样本下该方法的统计理论 。 周晓华和他的同事还提出了适用于结果是二分类和连续型变量的情形下 , 在非参数和半参数模型中识别感兴趣因果参数SACE的方法 。 证明了SACE在部分正则假设下可识别的数学性质 , 同时提出当违背部分假设时 , 减少估计偏差的统计方法和理论 。
- 隔离|如何帮治疗、隔离中的孩子做好心理调适?专家给出建议
- 射线|北京北城甲状腺医院提醒:甲状腺疾病高发要如何预防?这5件事要做好
- 苹果|冬季最应该吃的水果,苹果和梨都不如它,4元1斤,多给老人孩子吃
- 常见肉类 如何吃才健康
- 一月转眼就已经过去大半,多吃3种如意果,寓意开心快活
- 本周就要放寒假了,孩子开心爱吃3种如意果,寓意福气绵绵
- 气温下降,孩子吃的好食物,寓意幸福如意,吃了身体不生病
- 补充|血糖的“抑制器”已找到,并非木耳,若你爱吃,血管或洁净如初
- 春节快到了,卧室里要有的3种“如意果”,寓意福星高照寿诞生辉
- 新年新气象,卧室里要有的3种“如意果”,寓意福星高照寿诞生辉
