医学论文是对疾病或者临床科研的探究,但不管是某种疾病的影响因素,还是某种药物的临床效果都需要借助统计学的一些方法进行数据统计分析。正确使用医学统计学方法,能确切反映科研成果的价值,使所发表的论文更具有科学性和代表性。反之,不仅影响研究质量,甚至形成错误的结论,误导读者。正确掌握和使用统计学方法,是对一个医学科技工作者的起码要求。今天,我们就来为大家综合分析一下医学论文数据统计中那些容易被忽视但有需要格外重视的细节,以及如何才能准确进行医学论文数据统计分析,从而达到一篇优秀医学论文的要求。
那么怎么才能进行正确的统计分析呢?
确定统计样本设计的合理性
1.分组要严格遵循随机化原则,研究对象的分组与抽样离不开随机化原则,在足够样本的前提下,随机抽样,随机分组,明确交代随机方法,各组样本量、基本特征等。随机不等于随便,有的作者滥用随机,只要抽样或分组,一概冠以随机,不描述随机方法,把随意、随便当做随机,使研究结果不可信。
2.抽取恰当的样本量,结果才有可靠性。有些文章例数太少,这样抽样误差大,导致结果不可靠。研究对象变量标准差小的,样本可以小一些。观察计数指标的样本一般不少于20~30例,计量指标的样本不少于5~10例。有的作者仅仅观察了数例患者,就得出百分之多少的有效率,显然是不恰当的。
理清临床数据的种类
医学统计资料一般分为计数资料和计量资料资料两类。
1.计数资料又称为定性资料或者无序分类变量资料,是将观察单位按其性质或者类别分组,然后清点各组观察单位个数所得的资料,例如某种检查结果为阴性或阳性,则分别清点阳性和阴性结果的例数,属于非连续性数据;
2.计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位,例如身高(cm)、血压(mmHg)等等,属于连续性数据。
当然计数资料与计量资料之间可以按照论文写作的目的要求进行转换,例如将年龄的计量资料按照<30、31-40、41-50、51-60、>60(岁)进行分组,分别清点各组人数则可以转换为计数资料。
而在进行统计分析前,要先对统计数据进行统计描述。计数资料采用率或者构成比,计量资料则要先进行正态分布检验,符合正态分布则用均数及标准差,不符合正态分布则可以采用中位数及四分位数间距等。
对统计数据进行适当分析
回归分析是医学论文中常见的数据分析法。回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
使用回归分析的好处良多。具体包括两个方面:一是它表明自变量和因变量之间的显著关系;二是它表明多个自变量对一个因变量的影响强度。
1、一元线性回归分析
只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
2、多元线性回归分析
多元线性回归分析的使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。
(1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法。
(2)横型诊断方法:
残差检验:观测值与估计值的差值要艰从正态分布
强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法
共线性诊断:
诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例
处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等
3、Logistic回归分析
线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况。
分类:Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。
4、其他回归方法
非线性回归、有序回归、Probit回归、加权回归等
由于回归分析的类型较多,医学工作者在选择回归方法时,要根据数据的维数以及数据的其它基本特征来选择具体的回归类型,这对于接下来的数据分析是非常重要的。
医学论文写作中应注意的数据统计细节
多组间独立样本比较时直接采用 t 检验
若要对三组或者多组使用不同方法治疗的患者进行某个或者某几个指标的比较时,这就是典型的多组间独立样本的比较,正确的思路是先进行多组数据比较,结果显示,差异具有统计学意义(P<0.05)时再进行两组间的比较。若文章中出现多组间独立样本比较时,若直接进行两组间的比较是不合理的。多组间独立样本比较时,首先要判断研究资料的独立性、方差齐性、正态性等是否满足方差分析的条件,满足该条件且差异具有统计学意义(P<0.05)时再进行两组间的比较。两两组间比较的方法很多,常采用的有Bonferroni法、LSD-t检验、SKN法、Dunnett-t检验等,根据各自的适用条件进行选择。
对数据使用了不符合检验条件的检验方法
每一种统计学检测方法都要满足一定的条件,如要进行t检验时就要求所检验的计量资料满足正态分布,且具有方差齐性。临床常见很多论文中的计量资料明显呈偏态分布或者方差不齐,直接使用 t 检验进行了比较和分析是不合理的。
对重复测量的数据使用 t 检验或者方差分析
在医学论文中重复测量比较多见,重复测量是指对试验对象的观察指标在改变条件下进行多次测量,观察该条件对这些指标的影响,对这些重复测量的数据直接进行t检验或者方差分析是不合理的,应该使用重复测量设计资料的方差分析,由于 t 检验或者方差分析要求数据之间相互独立。
对不符合正态分布的计量资料采用平均数±标准差表示
文章中有的数据明显呈偏态分布,仍然采用平均数±标准差进行表示,如某患者的术中出血量为(85.38±102.52)mL,显然不合理,因为通常在数据均为正值的情况下,标准差小于平均数的1/2或者1/3时才符合正态分布。
样本量较少时得到的数据也不宜用平均数±标准差进行表示,可用中位数进行描述。
转自麦德辑学术编译微信公众号,仅作学习交流,如有侵权,请联系本站删除!