投稿问答最小化  关闭

万维书刊APP下载

4点轻松解决论文实证不显著微调数据

2024/10/30 8:48:40  阅读:31 发布者:

很多时候大家在做数据分析时,经常遇见过数据不显著的问题,然后就很痛苦,甚至绝望,其实不显著才是很正常的,显著反而是少数需要注意的是,当遇见回归系数不显著时,我们不能简单的认为对应的解释变量对被解释变量没有影响。

首先,观察一下F检验值,如果整体线性检验不显著,那么说明模型设定为线性不合适,需采用其他模型形式,如非线性回归模型。

如果替代模型的回归系数t检验拒绝原假设(显著),这就说明是模型设定的问题

其次,需要对残差进行异方差检验以及自相关检验,如果存在异方差或者自相关,则用广义OLS法消除后,再做参数显著性检验

异方差和自回归的存在都会使得t检验失效。如果结果仍然不显著,那么,我们就要考虑是否将该变量从模型中剔除掉

若剔除该变量后的回归结果使得三个信息准则值均有所下降,那么这就说明:该剔除该变量是明智的选择

我们也可以用参考一下方式

选方程

同样的问题,有时会有不同的模型。某篇经典文献用的是A模型,另外一个大牛可能用的是B模型。倒底哪个模型更好,取决于你对模型背后理论的信念。如果你更认可A模型背后的理论,就用A模型;同理对B模型也是如此。而选择不同的模型时,得到的实证结果往往会存在差别。有时候差别仅仅体现在系数的大小上,而有时候差别体现在系数的显著性上。

选变量

同一个财务变量,可能有多个指标能衡量 比如融资约束的度量,在文献经常出现的包括:公司规模、是否支付股利、产权性质、KZ指数、WW指数、信用评级、票据评级、利息偿付倍数、资产的可抵押能力、是否是集团公司等等

再比如掠夺风险的度量,包括:HHI、主营业务利润、价格-成本边际、超额价格-成本边际、勒纳指数、交叉弹性、熵指数、资本-劳动比偏离行业均值的绝对值、股票收益和行业组合收益的协方差、行业内最大四家企业的集中度等等

选择不同的指标衡量某个变量,得到的结果也存在差别。所以也可以采用这种思路来获得显著的结果

不过稳健性检验往往要求对某个无法精确度量的变量采取多种指标衡量,而且有时候还要检验这些指标的一致性(通过相关系数和交叉统计)

选样本

数据处理的过程包含了选择样本的过程。删除STPT公司,删除交叉上市的公司,删除IPO当年的数据,删除资不抵债的公司,对离群值进行Winsor处理。样本处理也是五花八门,值得细细琢磨一番

选方法

OLSFEGMM3SLSIVProbitDID,方法有很多,理论上可以改变不同的方法来做实证,但事实上每一种方法都有自己的限定条件和使用范围。所以选方法的可行性不太高

上面所说的四种办法,其实更严格地来看,应该也是稳健性检验要做的工作

首先,回归系数不显著不能简单滴认为对应的解释变量对被解释变量没有影响

先观察下F检验值,如果整体线性检验不显著,那么说明模型设定为线性不合适,需采用其他模型形式

如非线性回归模型。如果替代模型的回归系数t检验拒绝原假设(显著),那么说明是模型设定问题

再者,对残差进行异方差检验以及自相关检验,如果存在异方差或者自回归,则用广义OLS法消除后,再做参数显著性检验

异方差和自回归的存在均会使得t检验失效。

如果仍然不显著,那么就要考虑是否将该变量从模型中剔除了。若剔除该变量后的回归结果使得三个信息准则值均下降,那么就该剔除该变量

数据挖掘是一个技术活,一下子就显著的是不是要思考一下是不是伪回归的可能

不显著可能的原因很多,比如共线、变量度量的问题,样本的自选择偏误等等

如果实在需要显著的结果,有两个重要的方法,首先是看变量本身的度量,有没有其他度量的方法和调整的空间、比如楼上已经提到的融资约束的度量、分组的化哑变量的设置等等

另一个就是样本的选择和缺失值的处理,是替换成零(经济学上是否有意义),或者直接作为缺失删掉,这些都会显著的影响结果的显著程度甚至方向

当然,显著与否这些调整之后也许依然差的好远,那么就需要思考理论上是否成立了,或者是不是一个伪命题了

不显著就应该剔除,除非你想硬塞进这个自变量,那你只有改数据了要么剔除某些看起来就很跨装的数据,要么找个理由去掉常数项,你就会发现一下子就显著

转自蓝境数据微信公众号,仅作学习交流,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com