医学论文是对疾病或者临床科研的探究,但不管是某种疾病的影响因素,还是某种药物的临床效果都需要借助临床数据进行分析,进行了正确的统计分析,才能得出科学的结论,那么怎么才能进行正确的统计分析呢?
首先对临床数据的种类要弄清楚,医学统计资料一般分为计数资料和计量资料资料两类。
(1)计数资料又称为定性资料或者无序分类变量资料,是将观察单位按其性质或者类别分组,然后清点各组观察单位个数所得的资料,例如某种检查结果为阴性或阳性,则分别清点阳性和阴性结果的例数,属于非连续性数据;
(2)计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位,例如身高(cm)、血压(mmHg)等等,属于连续性数据。
当然计数资料与计量资料之间可以按照论文写作的目的要求进行转换,例如将年龄的计量资料按照<30、31-40、41-50、51-60、>60(岁)进行分组,分别清点各组人数则可以转换为计数资料。
而在进行统计分析前,要先对统计数据进行统计描述。计数资料采用率或者构成比,计量资料则要先进行正态分布检验,符合正态分布则用均数及标准差,不符合正态分布则可以采用中位数及四分位数间距等。
不同类型的数据应该选择不同的统计方法进行统计推断,对计量资料来说,t检验是目前医学数据研究中使用频率最高的、最常见的假设检验方法。但是要注意t检验的应用前提就是进行假设检验的资料必须符合正态分布,其次,t检验种类要选择正确。
例如:难产男婴出生体重均数是否与正常男婴不同则可以选择单样本t检验,20位病毒性肝炎患者和25位正常人血清转铁蛋白含量有无差异则可以选择两个独立样本均数比较的t检验,新药与常规药降血清总胆固醇效果是否相同则可以选择配对t检验。
当数据资料为两组以上时,则要采用方差分析,另外方差分析除了要符合正态分布外,各处理组的总体方差要相等,即符合方差齐性,对方差齐性要求比较严,需要做方差齐性检验。
当数据不符合t检验及方差分析的条件时,可以采用非参数检验,例如参数检验中的配对t检验可以对应非参数检验的符号等级检验,两组间差异比较可以采用Wilcoxon秩和检验,随机区组的方差分析对应M检验(Friedman法)等等。
计数资料的统计推断一般采用卡方检验,需要注意的是,当两组计数资料比较时采用四个表卡方检验,但是如果数据较少,理论值<5,特别是总观察数<40时,或者理论数<1,需要用精确检验法。计数资料超过两组时采用行×列表卡方检验,不宜有1 5以上格子数的理论频数小于5,或有1个格子的理论数小于1,否则将导致分析的偏性。<="" p="">
若理论数太小可采取下列方法处理:
①增加样本含量以增大理论频数;
②删去上述理论数太小的行和列;
③将太小理论数所在的行或列与性质相近的邻行或邻列中的实际数合并,使重新计算的理论数增大。
此外,多个样本率(或构成比)比较的检验,若结论拒绝检验假设,只能认为各总体率(或构成比)之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者之间有差别。
只有进行了正确的统计描述和统计推断,才能得出具有参考价值的结论,而这个过程就需要我们对这些所统计的数据进行适当的分析。回归分析是医学论文中常见的数据分析法。
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
使用回归分析的好处良多。具体包括两个方面:一是它表明自变量和因变量之间的显著关系;二是它表明多个自变量对一个因变量的影响强度。
1、一元线性回归分析
只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
2、多元线性回归分析
多元线性回归分析的使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。
1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法。
2)横型诊断方法:
A 残差检验: 观测值与估计值的差值要艰从正态分布
B 强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法
C 共线性诊断:
诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例
处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等
3、Logistic回归分析
线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况。
分类:Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。
4、其他回归方法
非线性回归、有序回归、Probit回归、加权回归等
由于回归分析的类型较多,医学工作者在选择回归方法时,要根据数据的维数以及数据的其它基本特征来选择具体的回归类型,这对于接下来的数据分析是非常重要的。
转自SCI论文服务平台微信公众号,仅作学习交流,如有侵权,请联系本站删除!