投稿问答最小化  关闭

万维书刊APP下载

非独立数据统计分析方法的选择

2022/7/8 14:41:59  阅读:743 发布者:

中华儿科杂志, 2022,60(7) 张华, 石岩岩, 赵一鸣.

常用的统计分析方法往往要求数据是独立的,即2条数据不会互相影响,但在临床研究中经常会有非独立数据,如住院期间多次血常规测量记录、1例患儿的2次住院记录,前后几次的记录可能存在相关性。如果用传统的方法,只能保留1个病例的1次记录,会损失较多信息;有选择地删除某记录则可能造成偏倚。为避免数据损失和偏倚,下面介绍几种非独立数据常用的分析方法。

重复测量方差分析用于某一连续指标在多个时间点进行多次测量的情况,例如多次血常规测量结果,它可以用于比较几组间该指标随时间变化的趋势有无差异,也可以用于比较同一时间点的组间差异和不同时间点间的差异。该方法要求各病例测量间隔相同,不能出现缺失值,同时要求数据满足多元正态。

多水平模型又称为随机系数模型、随机效应模型、混合效应模型,是将个体变异与时间变量分别当作2个水平(因素),因此其既考虑了个体之间的变异,也考虑了个体内(不同时间点)变量。多用于具有层次结构的数据分析,重复测量数据可以看作是多水平模型的一个特例。

广义估计方程可以处理1个病例有多次医疗记录的数据分析,如儿童的多次感染记录,该方法计算过程复杂,在进行协方差矩阵时认为一个病例的多条记录存在相关,建立等相关矩阵、球性、复合对称、可交换、一阶自回归、无结构型等矩阵。通过合适的连接函数,该方法可用于连续结局、分类结局的分析中,也可以处理有缺失值和观察对象观察时间间隔不相等的资料。

广义线性混合效应模型是广义线性模型和线性混合效应模型的扩展。广义线性模型可以通过不同的连接函数分析不同的结局,因此可以用于线性结局变量,也可以用于二分类和多分类结局变量等。线性混合效应模型是指在线性模型中加入随机效应,通常指个体间的变异等。结合上述2种方法,广义线性混合效应模型可以处理不同类型结局变量的分析,同时在模型中考虑个体的随机变化或随时间的随机变化。

在处理数据时,首先要判断数据是否独立,判断结果会影响数据分析方法;然后再根据非独立数据的类型选择相应的统计分析方法。

转自:医学科研与管理空间

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com