如何撰写论文的实证部分?实证论文中一般会用到哪些模型?以下梳理实证论文中非常重要的三个基本模型!
01固定效应
实证论文一般是企业层面的面板数据,面板数据即在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。
而处理面板数据,有固定效应模型、随机效应模型、混合效应模型,但通常只考虑固定效应模型。
固定、随机、混合效应模型的区别?(摘自人大经济论坛)
第一、随机效应模型认为误差项和解释变量不相关,而固定效应模型认为误差项和解释变量相关。
第二、随机效应模型和固定效应模型认为,回归方程估计结果在截距项和斜率项是不同的,因此可以选择变截距模型,也可以选择变系数模型。
第三、混合效应模型,在各个截面估计方程的截距和斜率项都一样,也就是说回归方程估计结果在截距项和斜率项上是一样的。
选择固定效应有三个理由:
第一,可以通过豪斯曼检验证明固定效应模型是最合适的。
第二,固定效应更适合研究样本之间的区别,而随机效应适合由样本来推断总体特征。
第三,很少有文章会选择其他模型,几乎是约定俗成选择固定效应。
固定效应模型又分为三种,分别是:
1、个体固定效应模型:对于不同的时间序列(个体)只有截距项不同的模型
2、时间固定效应模型:对于不同的截面(时点) 有不同截距的模型。
3、时间个体双向固定效应模型:时点个体固定效应模型就是对于不同的截面(时点)、不同的时间序列(个体)都有不同截距的模型。
在论文当中,通常会选择双向固定效应模型,也可以选择时间或者个体来固定,考察不同回归结果的显著性,以及文章整体的合理性。建议参考以往文献都是固定了哪些效应,再应用到自己的文章当中。
总结:
固定效应模型是必须掌握的模型,是实证论文的基础
02中介效应
中介效应主要用来测度解释变量通过中介变量间接作用于被解释变量的影响程度,考虑自变量X对因变量Y的影响,如果X通过M影响变量Y,则称M为中介变量。
在论文当中,中介效应多用于检验自变量对因变量的影响路径,又称机制检验。
在研究了X对Y的影响后,我们进一步探究X通过哪些因素影响了Y,一般会选择2-4个变量作为中介变量,探究影响机制
总结:
中介效应模型与机制检验三部法,也基本是每篇论文都需要用到的,合适的中介变量将成为文章的亮点。
03调节效应
因变量Y和自变量X的关系随第三个变量Z的变化而变化,则称Z在X和Y之间起调节作用,称Z为调节变量。
调节效应检验非常简单,公式如下:
如果回归系数c显著,就表示调节效应显著。
不过,实际在应用调节效应时,会出现多重共线性的情况,即自变量X、乘积项XZ、调节变量Z,存在共线性。
因此,通常将自变量X和调节变量Z进行均值中心化(即变量减去样本均值),然后再产生乘积项 XZ ,最后进行多元回归分析。
如何解读调节效应?
第一,只要交互项系数c显著,就可以考虑调节效应存在,可以不关注自变量系数是否显著。
第二,主效应和交互项的系数同号,则为正向调节,Z增强了X对Y的影响;主效应和交互项的系数异号,则为负向调节,Z削弱了X对Y的影响。
中介效应和调节效应的区别?
中介效应模型考察自变量X通过什么因素影响因变量Y,而调节效应模型考察自变量X影响因变量Y的程度受哪些因素改变。
总结:
在一篇论文当中,调节效应并不是必须的,但是可以尝试加入,考察自变量和因变量之间受什么因素调节,丰富论文的内容。
以上三种模型,是最基础的实证模型,也是大家一定要掌握的、很可能被提问的模型。除此之外,还有更进阶的实证内容,比如:内生性如何处理?有哪些稳健性检验方法?
以及更多复杂的实证模型:
双重差分、门限回归、空间计量、二值选择……
转自蓝境数据微信公众号,仅作学习交流,如有侵权,请联系本站删除!