社科学术汇︱应用计量经济学常见问题汇总

2022/3/2 8:47:16　阅读：512　发布者：chichi77

计量经济学分析什么？

计量经济学的主要用途或目的主要有两个方面：

1、理论检验。

2、预测应用。

研究对象：

计量经济学的两大研究对象：横截面数据（Cross-sectional Data）和时间序列数据（Time-series Data）。前者旨在归纳不同经济行为者是否具有相似的行为关联性，以模型参数估计结果显现相关性；后者重点在分析同一经济行为者不同时间的资料，以展现研究对象的动态行为。

新兴计量经济学研究开始切入同时具有横截面及时间序列的资料，换言之，每个横截面都同时具有时间序列的观测值，这种资料称为追踪资料 (Panel data，或称面板资料分析)。追踪资料研究多个不同经济体动态行为之差异，可以获得较单纯横截面或时间序列分析更丰富的实证结论。

涉及到的相关学科：

计量经济学是结合经济理论与数理统计，并以实际经济数据作定量分析的一门学科。计量经济学以古典回归分析方法为出发点。依据数据形态分为：横截面数据回归分析、时间序列分析、面板数据分析等。依据模型假设的强弱分为：参量计量经济学、非参量计量经济学、半参量计量经济学等。常运用的软件：EViews、Gretl、MATLAB 、Stata、R、SAS、SPSS等……

什么是伪回归？

若是所建立的回归模型在经济意义上没有因果关系，那么这个就是伪回归，例如路边小树年增长率和国民经济年增长率之间存在很大的相关系数，但是建立的模型却是伪回归。如果你直接用数据回归，那肯定存在正相关，而其实这个是没有意义的回归。

变量取对数再进行回归

为避免伪回归，消除异方差，在不改变时间序列的性质及相关性的前提下，为获得平稳数据，通常会对时间序列取自然对数。对数据进行平稳性检验是研究中不可或缺的步骤，因为时间序列分析法只适用于平稳的数据。那么什么情况下会对数据取对数呢？

第一，关于对数的问题，若是自己选取的变量数据，里面有部分小于0，或者负数，需要重新考量下，看是否数据或者其他问题，此时肯定是没法取对数；

第二，针对CD 等生产函数等类型的数据分析，由于建模需要，一般需要取对数，此类情况一般会在柯布道格拉斯函数基础上，引入新的变量，包括但不局限于资本和劳动等变量；

第三，平时在一些数据处理中，经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数，取对数后不会改变数据的相对关系

第四，取对数作用主要有：缩小数据的绝对数值，方便计算。例如，每个数据项的值都很大，许多这样的值进行计算可能对超过常用数据类型的取值范围，这时取对数，就把数值缩小了，例如TF-IDF计算时，由于在大规模语料库中，很多词的频率是非常大的数字。取对数后，可以将乘法计算转换称加法计算。某些情况下，在数据的整个值域中的在不同区间的差异带来的影响不同。也就是说，对数值小的部分差异的敏感程度比数值大的部分的差异敏感程度更高。这取对数之后不会改变数据的性质和相关关系，但压缩了变量的尺度，数据更加平稳，也消弱了模型的共线性、异方差性等。例如在会计或者金融等变量的实证研究中，引入变量资产规模等变量，一般会取对数，因为不同行业或者国有、民营等公司的资产规模差距很大，取对数，会缩小差距，使得实证研究更具有针对性。

另外，山大大学陈强老师在计量经济学及stata应用公众号中汇总出如下五种情况：

第一，如果理论模型中的变量为对数形式，则应取对数。比如，在劳动经济学中研究教育投资回报率的决定因素，通常以工资对数为被解释变量，因为这是从Mincer模型推导出来的。

第二，如果变量有指数增长趋势（exponential growth），比如 GDP，则一般取对数，使得 lnGDP 变为线性增长趋势（linear growth）。

第三，如果取对数可改进回归模型的拟合优度（比如 R2 或显著性），可考虑取对数。

第四，如果希望将回归系数解释为弹性或半弹性（即百分比变化），可将变量取对数。

第五，如果无法确定是否该取对数，可对两种情形都进行估计，作为稳健性检验（robustnesscheck）。若二者的回归结果类似，则说明结果是稳健的。

在经济学中，常取自然对数再做回归，这时回归方程为 lnY=a lnX+b ，两边同对X求导，1/Y*(DY/DX)=a*1/X,b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义。

告诉你如何取对数quick\ generate series\ 输入新变量，比如 r=log( )，r就是取完对数后的序列。

R平方很小时怎么办

很多同学在做实证文章的时候常常问，我的R平方只有0.08到0.09，也就是说我的模型只能解释数据的8%到9%。在实证文章里，特别对于横截面数据来说，有时R平方只有0.05。R平方是什么意思？就是说，我们的模型能解释数据的variance的多少，可能对于绝大部分的variance的解释，经济学家是不知道的。

另外，R平方表示模型拟合优度，也就是模型解释力度，此值介于0-1之间，数值越大，说明模型解释力度越大，该值越大越好，在实际研究中，辞职表的意义相对较小，即使该值小于0.4或者更小，也关系不是很大。

R平方与所选取变量多少以及回归有很大关系，经常在会计领域多变量进行回归，此值会很小，所以不必太在乎这个统计量。另外调整R2可以为负数，当调整R2可以为负数时，说明此时R2会很小，几乎为0，此时模型几乎没有意义。

面板数据需要平稳性检验吗

就Panel Data的处理而言，建议先进行平稳性校验。一般完整的实证经济学论文，针对面板数据，会前期进行数据处理，包括描述性分析和平稳性检验的，这个根据期刊的要求或版面要求而定，另外，根据相关要求，一般情况下，由于面板数据主要核心在于回归，包括固定或者随机效应的回归结果，所以有些文章，并没有进行平稳性检验，而为了将面板数据做的高大上，分析更具有针对性，可以进行分类分行业分阶段进行回归，更能说明问题。

而在公司财务领域，研究都是资产负债率等，它们不可能包含单位根，所以我们基本上都不做这个检验。然而，在宏观经济领域，单位根过程很普遍，如果前期学者也证实了单位根过程的存在，一般也都做。所以具体情况，根据相关要求来定。

如何判断调查设计是否合理

问卷主要分为两大类：即量表问卷和非量表问题。

量表问卷通常更多使用于学术研究，主要针对人群态度看法使用意愿等方面的研究，量表题是指类似答项为“非常不同意”，“比较不同意”，“中立”，“比较同意”和“非常同意”之类的问题，这个在前期stata培训会议中以微信使用意愿以及影视旅游动机专题介绍过。主要软件为SPSS，主要分析方法比如因子、信效度、相关、回归模型等。

而非量表类来讲，其最大的特点为大部分为单选题、多选题或者排序填空题等，但很少有出现量表题（是）。

本文以stata培训会议中，影视旅游动机为例，为大家总结如下思路框架。

Stata中有哪些报表输出命令

如何将stata输出结果与报表word或者excel结合呢？stata结果输出主要外部命令包括outreg2、estoout、tabout、logout、est2tex、mktab、xml_tab、esttab等，之前为大家推荐过最重要最实用的outreg2、estoout、tabout、logout、esttab等命令。

由于这些命令均为第三方命令，因此需要下载安装，建议阅读之前推文，一般下载安装外部命令，可以选择，ssc install +命令名，或者findit +命令名，下载安装完毕，直接help 命令，就可以查看命令相关内容了。

如何解释交互项

在数学上解释变量与控制变量可以是一回事，但是如果控制变量是调节变量，回归方程在理论上的解释就不一样了，解释变量是解释与被解释变量的因果关系，调节变量则是确定因果关系的边界条件。

对于调节变量而言，其目的是强调它的出现对一个或几个解释变量在某一问题中影响，因而，需要将调节变量与所要调节的解释变量相乘，将其乘积作为一个回归变量。例如，在单因素方差分析中，有如下命令，anova wage edu married children married*children 来看二者对工资是否有影响，这类交叉项也进场在回归分析中遇见，包括但不限于常见的回归，在引力模型中也经常遇见。

在模型中引入交互项，通常这两个变量，从经济理论和经济现象上二者之间本身就存在相互影响，X1是X2对于因变量产生影响的必备条件，就是说X2要想对因变量产生影响，必须是在X1起作用的情况下进行。

另外，对于交互项的理解，主要可从边际效应（偏导数）来看。如果X与Y的系数为正，则X对Y的边际效应将上升；反之，如果系数为负，则X对Y的边际效应将下降。

什么时候需要交互项呢？

一般情况下，若是变量X1对被解释变量可能受到X2影响的时候，这时候可以考虑用交互项来进行回归。

有关交互项需要注意：

应该包含所有项目，例如交互项X1X2，则回归方程中应该包含所有变量，X1和X2，除非有经济理论可以不包括在内。若是交互项三个，例如X1*X2*X3，则变量回归中，还应该包含X1，X2，X3和这三个变量两两交互项。

如何确定论文方法&数据

有时候千辛万苦想用一个方法来研究某个课题，这时候建议根据前期中心给出的建议，一般情况下，需要结合研究发方法+软件+数据来考量，有时候你想用的面板数据，若是由于数据缺失等原因，可能就徒劳无功，所以一般情况下，建立同时考量方法，然后在数据可得性以及合理性的基础上，对数据进行一定的预处理，然后在进行数据分析，这时候，可能效果会更好了。10、如何理解格兰杰因果检验？

如何理解格兰杰因果检验

格兰杰因果检验是检验统计上的时间先后顺序，并不表示而这真正存在因果关系，是否呈因果关系需要根据理论、经验和模型来判定。

关于格兰杰因果检验若X都不是Y的格兰杰原因，这并不是说X与Y之间毫无关系。格兰杰因果检验本身也不是真实意义上检验变量的因果关系，而只是检验变量在统计上的时间先后顺序。

格兰杰检验只能用于平稳序列！这是格兰杰检验的前提，而其因果关系并非我们通常理解的因与果的关系，而是说x的前期变化能有效地解释y的变化，所以称其为“格兰杰原因”。

平稳性检验&协整检验

单位根检验是序列的平稳性检验，如果不检验序列的平稳性直接OLS容易导致伪回归。

当检验的数据是平稳的（即不存在单位根），即意思是单位根检验的原假设是存在单位根，存在单位根，则不平稳，等价关系！要想进一步考察变量的因果联系，可以采用格兰杰因果检验。

平稳性检验有3个作用：1）检验平稳性，若平稳，做格兰杰检验，非平稳，作协正检验。2）协整检验中要用到每个序列的单整阶数。

当检验的数据是非平稳（即存在单位根），并且各个序列是同阶单整（协整检验的前提），想进一步确定变量之间是否存在协整关系，可以进行协整检验，协整检验主要有EG两步法和JJ检验（1）、EG两步法是基于回归残差的检验，可以通过建立OLS模型检验其残差平稳性（2）、JJ检验是基于回归系数的检验。

单位根检验方法步骤

在eviews中，ADF检验的方法：1 view---unit roottest，出现对话框，默认的选项为变量的原阶序列检验平稳性，确认后，若ADF检验的P值小于0.5，拒绝原假设，说明序列是平稳的，若P值大于0.5，接受原假设，说明序列是非平稳的；2 重复刚才的步骤，view---unit root test，出现对话框，选择1stdifference,即对变量的一阶差分序列做平稳性检验，和第一步中的检验标准相同，若P值小于0.5，说明是一阶平稳，若P值大于0.5，则继续进行二阶差分序列的平稳性检验。

虽然定义经过d阶差分后是平稳的，但是软件只提供到2阶差分，若是原始数据没有经过差分就平稳，则说明那是零阶单整，记为I（0）的过程。

在stata中，单位根检验命令为：dfuller lnagdp，建议help dfuller等。

先做单位根检验，看变量序列是否平稳序列，若平稳，可构造回归模型等经典计量经济学模型；若非平稳，进行差分，当进行到第d次差分时序列平稳，则服从i阶单整（注意趋势、截距不同情况选择，根据P值和原假设判定）。若所有检验序列均服从同阶单整，可构造VAR模型，做协整检验（注意滞后期的选择），判断模型内部变量间是否存在协整关系，即是否存在长期均衡关系。如果有，则可以构造VEC模型或者进行Granger因果检验，检验变量之间“谁引起谁变化”，即因果关系。

关于截距、趋势选择问题，请大家看图，view，graph，若是有时间趋势，则选择截距和趋势；若是围绕0波动，则选择具有截距；若是没有上述情况，选择none。

单位根检验是检验数据的平稳性，或是说单整阶数。

协整是说两个或多个变量之间具有长期的稳定关系。但变量间协整的必要条件是它们之间是同阶单整，也就是说在进行协整检验之前必须进行单位根检验。

协整说的是变量之间存在长期的稳定关系，这只是从数量上得到的结论，但不能确定谁是因，谁是果。而因果关系检验解决的就是这个问题。

单位根检验是检验时间序列是否平稳，协整是在时间序列平稳性的基础上做长期趋势的分析，而格兰杰检验一般是在建立误差修正模型后，所建立的短期的因果关系。故顺序自然是先做单位根检验，再过协整检验，最后是格兰杰因果检验。

单位根检验是对时间序列平稳性的检验，只有平稳的时间序列，才能进行计量分析，否则会出现伪回归现象；协整是考察两个或者多个变量之间的长期平稳关系；格兰杰因果检验是考察变量之间的因果关系，协整说明长期稳定关系不一定是因果关系，所以需要在通过格兰杰因果检验确定两者的因果关系。顺序一般是单位根检验，通过后如果同阶单整，在进行协整，然后在进行因果检验。要特别注意的是：只有同阶单整才能进行协整。

VAR模型

VAR建模时lag intervals for endogenous要填滞后期，但是此时你并不能判断哪个滞后时最优的，因此要试，选择不同的滞后期，至AIC或SC最小时，所对应着的滞后为最优滞后，此时做出来的VAR模型才较为可靠。

选择方法为：这个问题，中心QQ群里，已经解答过，小编想说的是，一定要注意eviews操作界面有两个，目前所说的界面view，都是前面这个界面，不是后面那个有file，quick这个界面，请不要点错！

做协整检验前作VAR的原因是，协整检验是对滞后期和检验形式非常敏感的检验，首先需要确定最优滞后。由于VAR是无约束的，而协整是有约束的，因此协整检验的最优滞后一般为VAR的最优滞后减去1，确定了最优滞后后，再去诊断检验形式，最终才能做协整。

当确定了协整的个数后，往下看，有个标准化的结果，这个结果就是协整方程，由于在结果中各变量均在方程一侧，因此如果系数为正，则说明是负向关系，反之亦然。

协整表示变量间的长期均衡关系，貌似与你的OLS不矛盾。

（1）如检验不协整，说明没长期稳定关系，可以做VAR模型，但是模型建立后要做稳定性分析：做AR根的图表分析，如所有单位根小于1，说明VAR模型定，满足脉冲分析及方差分解所需条件之一

（2）VAR与VEC关系是：VEC是有协整约束（即有长期稳定关系）的VAR模型，多用于具有协整关系的非平稳时间序列建模

简单说VAR模型建立时

第一步：不问序列如何均可建立初步的VAR模型（建立过程中数据可能前平稳序列，也可能是部分平稳，还可能是没协整关系的同阶不平稳序列，也可能是不同阶的不平稳序列，滞后阶数任意指定。所有序列一般视为内生向量)， 1 滞后阶数检验，以确定最终模型的滞后阶数；2 在滞后阶数确定后进行因果关系检验，以确定哪些序列为外生变量进行AR根图表分析，如单位根均小于1，VAR构建完成可进行脉冲及方差分解。

转自：计量经济学服务中心

上一篇： 不可不知的五大工具变量研究方法综述！这些你都知道吗？
下一篇： Safety Science被引前10 论文

投稿问答最小化 关闭

社科学术汇︱应用计量经济学常见问题汇总

本文评论

暂无相应记录！

学术资源热门文章

本站推荐

最近更新

投稿问答最小化 关闭

社科学术汇︱应用计量经济学常见问题汇总

本文评论

暂无相应记录！

学术资源热门文章

本站推荐

最近更新

投稿问答最小化关闭