相同数据库,相同主题,两篇论文得出了相反
2021-4-4 来源:本站原创 浏览次数:次白癜风哪家医院好 http://pf.39.net/bdfyy/bjzkbdfyy/
过去几十年来,使用临床注册数据库进行的研究数量激增,例如,使用美国外科医师学会-国家手术质量改进数据库(ACS-NSQIP)所发表的论文,从年的68篇上升到年的篇,增长了10倍。原因显而易见:这些数据相对容易获得;可以很短时间内就能进行分析;并可以回答诸多问题。但局限性也很明显:数据是观察性的,很容易发生选择偏倚或混杂偏倚。
结论相反的两篇论文
相距一个月发表在同一个期刊上的两篇论文,却得出了完全相反的结论,这是去年发生在《Surgery》期刊上的事情(IF=3.)。两篇论文均使用了NSQIP数据库年的数据,研究主题是针对腹腔镜阑尾切除术的患者,手术时在将切除的阑尾从切口取出体外之前,放置到取物袋中再取出体外是否会减少术后感染。论文A的结论显示取物袋可减少伤口感染率,论文B的结论则是不能减少伤口感染率。
论文A纳入的患者人数为,其中(92.2%)例患者使用了取物袋,例(7.8%)患者未使用取物袋。多因素分析显示,使用取物袋的患者,腹腔内脓肿发生率为2.7%,未使用取物袋的患者发生率为3.8%,即使用取物袋,腹腔内脓肿发生率相对降低40%。
论文B纳入的患者人数为,其中(92.6%)例患者使用了取物袋,例(7.5%)患者未使用取物袋。使用取物袋的患者,3.6%发生了手术部位(浅表、深部和器官间隙)感染,未使用取物袋的患者为4.2%。两组间并无统计学差异。
为何结论不同?
如何解释这种差异呢?尽管使用了相同的数据集,但两篇论文的纳排标准,设定的主要结局,样本量,协变量都不同(表),这些因素导致了结果的不同[1]。
利用数据库中的数据如何进行分析,研究者通常会基于经验或既往研究。首先,要有一个研究假设,使用取物袋会发挥作用吗?是仅在阑尾穿孔时有用吗?能预防腹腔受污染吗?诸如此类的问题可以帮助确定纳排标准和相关结局指标。然后,需要选出所有可能影响结局的变量,要考虑每个变量是直接影响结局还是一个中介因素。选择完变量后,还要考虑到如何测量的问题。
要多提问题:高血压会增加伤口感染率吗?为什么?两个变量是否存在共线性?对于年龄等连续性变量,为什么要转成分类变量?如果仍然当作连续性变量来分析,年龄和手术部位感染风险的关联是否线性的?这些问题将使得研究更为严谨。
哪篇论文的结论更可靠?
两篇结论不同的论文,哪篇论文的结论是准确的呢?不幸的是,两篇论文都不太准确。因为使用的这个数据库,“使用取物袋”这个变量,是基于手术记录得到的。这个变量的准确性很差,因为很多病例的手术记录并未提到取物袋,但实际上可能使用了只是未记录。结果的可靠性依赖于数据录入的质量。
对此我们能怎么改善呢?首先,数据库中的数据记录应尽可能标准化,《JAMASurgery》提供了一个清单[2],以提高基于数据库开展研究的质量。这只是第一步。
作者、审稿人和期刊编辑应该共同参与到对分析过程的评估中。敏感性分析中可考虑用不同方法来处理缺失数据,对变量进行不同形式的分类或转换,尝试不同的纳排标准,以测试结果的稳健性。如果仅通过简单的更改就能改变结果,如前面两篇论文,则应该降低结论的确定性。许多数据库都会保存有多年的数据,统计模型可以合并年份也可以单个年份进行分析。
最后,在有其他团队也发现类似的结果前,不应将数据库分析得出的结论就视为正确的结论。编辑可以考虑让其他研究者通过Letter的方式发布来自同一个数据库的复现结果。
参考文献:
1.JAMASurg.Nov25.doi:10./jamasurg...
2.JAMASurg.;(6):-
医咖会面向医生个人、医院/单位、企业提供各种科研服务,包括研究设计、统计分析、EDC系统、科研培训等,详情查看:医咖会可为你提供这些科研服务,助你解决各种科研难题!。快加小咖