投稿问答最小化  关闭

万维书刊APP下载

论文中回归表格如何解读?

2022/10/31 10:42:42  阅读:574 发布者:

本文主要针对定量研究完全0基础的读者,详细地解释如何解读回归表格。

在学术论文中的回归表格往往会有*,以及()内的一些数字,这些符号、数字都是什么含义呢?读者需要知道的是,无论采用何种回归模型,这些符号、数字的意思都基本一致的,接下来我们主要解读简单线性回归和Logit回归两种常见的回归模型的结果。

1 简单线性回归的表格解读

下图为简单线性回归的结果表格,一般在论文中都是这样呈现的。首先,我们可以看到每一个变量对应这一个数字,这个数字上标有的标有*有的没有,每一个数字下面还会有一个带()的数字。那么他们都是什么意思呢?

变量对应的数字(不带括号的)就是回归系数,这个数字的上标*是代表p值,也就是显著性水平,一般而言*代表在0.05水平上显著,**0.01水平上显著,***代表在0.001水平上显著,只要有一个*存在我们就可以认为这个变量是显著影响因变量的。回归系数下面括号内的数字是标准误(SE),这个和我们学习的方差和标准差基本是一个意思,只不过在方差标准差是针对样本的描述值,标准误是针对总体的统计推断值。在一个规范的学术研究之中,回归分析结果必须要汇报这三个数值:回归系数、标准误、显著性水平,其实也可以只汇报两个,因为这三者之间有着密切的关系,回归系数/标准误=t值,而t值对应统计查表就可以得到p值,但是为了方便阅读我们都会汇报这三个数值。

那么,这三个数字我们需要关注什么?首先,最应该关注的就是p值,也就是有没有*,因为有*代表是显著的,我们才能得出结论,而没有*则是不显著的。其次,是关注回归系数的正负、大小,正值代表这个变量和因变量之间具有正向关联,负值代表是负向关系。一般情况下,标准误无需进行解释,只是作为一个统计参数存在。

我们以下图为例进行解读示例:

首先第一个变量“男性”显著性水平有三颗*,证明这个变量是在0.001水平上显著的,回归系数是0.319,其含义是相比于女性,男性的收入比女性高0.319万元,因为这里因变量的收入的单位是万元。抽象的来说就是回归系数代表因变量会变动相应个单位。这里“男性”这个变量比较特殊,是虚拟变量,只有两个值“男性和非男性(女性)”所以表述的时候一般是“相比于女性”抽象的来说,自变量为虚拟变量时的表述是,变量编码为1的相较于变量编码为0的,有什么变化。

接下来我们再看受教育年限,这是一个连续变量,其回归系数是0.027,并且有三个*,含义是:受教育年限每提高一年,收入增长0.027万元。其他变量的解读也是如此,在此不再重复。

在回归表中还会有很多统计量,如截距、F值、R平方等,这里面截距项一般不做解释;F值是判断整个回归模型的统计量,如果F值显著则证明这个模型建模是正确的;R方也叫作判定系数,一般而言越大越好,以下图为例R方为0.308,证明这个模型能够解释收入变量的30.8%的变异。当然,这些统计量一般情况下只是随表呈现出来,在论文写作中往往不进行详细的解释。

2 Logit回归的表格解读

Logit回归是社会科学中常用的回归模型,但是在模型解读中与线性回归有一定的差异。差异主要体现在对于系数的解读上,对于*和标准误的含义与线性回归一致。因为Logit回归是将因变量进行的Logit转换,因而其系数不再像现象回归一样可以直接解读,也需要进行转换,最常见的就是转化为发生比。

转自:量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com