分析阿兹夫定的临床试验数据:一个打死不冤的伪新冠特效药( 三 )


中国实际招募348人 。 完整数据没有公布过 , IPO文件描述有效性时 , 加了一个前提——基线载毒量高于3^10 , 在这些高载毒量受试者中 , 第3、5、7天用药组载毒量下降比安慰剂组更多:
分析阿兹夫定的临床试验数据:一个打死不冤的伪新冠特效药
文章图片
那么问题来了 , 这载毒量高的受试者是多少人呢?这一标准是事先确定的 , 还是事后加入?如果是事后加入 , 是否存在偏倚(bias)呢?而且即使是在这不知道多少人的高载毒量组里 , 载毒量变化达到显著差异的只有第5天 。
根据这些描述可以推断试验的主要终点——受试者第7与14天的载毒量 , 用药组与安慰剂组没有显著差异 , 也就是说该试验还是没有达到主要终点 。
另外 , IPO文件里也说了所有次级终点均未显示显著差异 。 那么次级终点里有什么呢?除了吸氧比例、肺炎变化等症状 , 还有核酸检测转阴时间与速率 。
也就是说 , 巴西两个试验里观察到的核酸转阴更快 , 在中国的试验里没有观察到 。 而且在以载毒量为主要终点的中国试验里 , 这个主要终点没有达到 。
以症状相关指标为主要终点的两个巴西临床试验 , 没达到主要终点 , 拿出不知怎么计算出来的核酸转阴时间以及不知采样人数为何不断变动的载毒量数据说有差异 。 可真的以载毒量为主要终点的中国临床试验里 , 载毒量没有达到终点 , 核酸转阴也没有差异 。
这种情况下 , 你觉得阿兹夫定值得相信吗?如果还是相信 , 那只能说是真爱 , 韭菜爱镰刀那种真爱 。
4.试验人数问题
巴西的两个试验 , 轻症的是招募312人 , 中症原计划招募342人 , 后来改成180人 。 阿兹夫定药企IPO文件里还提到中国和俄罗斯两个试验 。 中国计划招募342人 , 俄罗斯计划招募314人 。
这些试验的主要终点不一 , 中国的是载毒量下降 , 俄罗斯与巴西是症状缓解 。 可是无论什么终点 , 如此少的计划招募人数非常诡异 。
有人可能会说 , 管它招募多少人 , 最后有效性指标——临床试验终点能做出统计意义上的区别不就行了?可在非常少的招募人数下做出显著差异 , 意味着药效要非常好 , 这样用药组与安慰剂组才能拉开足够的差距 。 但前瞻性的三期临床试验 , 试验完成前——包括设计试验的时候 , 没人知道药效有多高 。 试验人数的确定 , 一般是在希望能有多大概率(统计检验功效)确认至少多高的有效性 , 这一基础上去推算 。
比如新冠疫苗的试验 , 假设希望试验能有90%的把握确认一个50%有效性的疫苗 , 可以回推需要多少病例 , 再根据一些感染率假设 , 推算应招募多少人以及试验需要做多久 。
新冠药物在试验设计阶段 , 觉得只要招募三百多人就能确定有效性几乎是匪夷所思 。 参考辉瑞与默克口服药 。 在轻到中症的高危人群三期临床 , 辉瑞计划招募约3000人 , 希望有1700人有数据做主要分析 , 默克计划招募1550人[3-4] 。 这些都是基于希望有足够的统计检验功效去检测50%降低重症风险 , 演算出来的需要的样本量大小 。 最后两家实际分析的数据量分别有2200多人与1400多人 。
即使说这两个药检测的降低重症风险与阿兹夫定的临床试验终点不同 , 那参考辉瑞口服药在低危人群的EPIC-SR试验 , 这里主要终点是症状持续改善 , 也招募了1440人[5] 。 国内新冠单抗药Brii-196/198 , 参与NIH的ACTIV-2试验 , 确认有效性是用药组418人 , 安慰剂组419人[6] 。
为什么阿兹夫定的研发方认为300多人的试验就能验证药物有效性?同行都是计划招募一两千人明确有效性时 , 有人却不断设计300多人的临床试验 , 甚至改到180人后能继续做出所谓的有效性 , 这值得警惕 。