投稿问答最小化  关闭

万维书刊APP下载

临床研究中常见回归分析的异同点及适用条件

2022/4/26 17:02:47  阅读:608 发布者:

医学科研与管理空间 2022-04-25 15:30

中华儿科杂志, 2022,60(4) 石岩岩, 张华, 刘家玮, .

临床研究的结局往往与多个因素相关,因此在统计分析中,经常会用到多因素分析的方法。常见的回归分析方法有多重线性回归、Logistic回归、Cox回归以及Poisson回归。本文将对不同回归分析方法的适用场景进行简要介绍,以帮助临床研究者正确选择回归分析方法。

1.共同点:它们都属于多因素分析,目的都在于探讨多个自变量与因变量的关系,对于自变量的要求基本是一致的,即自变量可以为1个或多个,可以为连续变量、等级变量和分类变量,其中分类变量需转换为哑变量进行处理,等级变量按连续变量或哑变量进行处理,都需要进行共线性检查。

2.区别:(1)多重线性回归:用于分析连续性因变量数值随自变量变化而变化的线性趋势;强调因变量为连续变量,如研究出生儿体重(连续变量)的影响因素。应用多重线性回归分析时,要求数据满足的条件为各自变量和因变量之间均呈线性关联趋势,要求所有的自变量的值均能被准确测量,对自变量没有具体的分布限定,但要求残差为正态分布。为了保证参数估计值的稳定性,需注意模型对样本量的要求,有研究者认为样本量应为纳入模型的自变量数的20倍以上。(2Logistic回归:用于分析分类变量(或等级变量)和影响因素之间的关系,由于因变量非连续变量,与自变量间失去了线性关系的可能性,该方法经过Logit转换,将转换后的因变量与自变量为线性关系;强调因变量为分类变量或等级变量。若因变量为二分类变量,则模型选择二分类Logistic回归模型,如研究低出生体重儿与否的影响因素。与多重线性回归相同,Logistic回归模型对样本量也有要求,一般选择因变量中较少的一类,该数值除以10,即为模型中可容纳的自变量数。(3Cox回归:用于研究不同因素对生存时间的影响;生存时间指从某一时间点起到所研究的事件发生时的持续时间长度,生存状态即随访结束时的结局。因变量为双变量,包括生存状态和该状态对应的时间。如儿童髓母细胞瘤患者预后(二分类变量,且含时间因素)相关的危险因素分析。(4Poisson回归:通常适合于处理罕见结局事件的研究资料,即结局变量服从Poisson分布的资料,其他要求与Logistic回归相似。Poisson回归是研究离散事件的重要回归方法,用于分析服从Poisson分布的事件发生数与各影响因素之间的关系。

常用的回归模型对自变量的要求是相似的,依据因变量数据类型不同选择适合的回归分析方法,应用之前需要检验其应用的假设条件是否成立。各回归模型对于样本量有一定的要求,多数模型要求样本量是自变量个数的10倍以上,否则可能出现模型过拟合,如果自变量个数过多,建议改用机器学习或弹性网络模型进行自变量的筛选。

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com