论文常见问题解析之工具变量的作用到底是什么？

2024/10/8 16:20:11　阅读：1496　发布者：

工具变量（‌Instrumental Variables，‌简称IV）‌的主要作用是在无法进行实际实验或控制某些变量的情况下，‌估计模型中的因果关系。‌

工具变量是一种统计方法，‌用于在无法直接控制某些变量或进行实验的情况下，‌估计这些变量对结果的影响。‌这种方法特别适用于那些难以直接测量或控制的变量，‌如某些潜在的、‌无法观测的混杂因素。‌通过引入工具变量，‌研究人员可以间接地评估这些变量对研究结果的影响，‌从而得到更准确的因果推断。‌

工具变量的应用基于以下

四个基本条件：‌

与所替代的随机解释变量高度相关。‌

与随机误差项不相关。‌

与模型中其他解释变量不相关。‌

在需要引入多个工具变量的情况下，‌这些变量之间也不应相关。‌

工具变量的使用可以帮助解决内生性问题，‌即当回归模型中存在遗漏变量时，‌这些遗漏变量可能会影响自变量和因变量，‌从而导致估计偏差。‌通过引入工具变量，‌可以更好地控制这些潜在的混杂因素，‌使得研究结果更加可靠。‌此外，‌工具变量分析还用于控制测量误差和未知混杂因素引起的偏倚，‌通过选择有效的工具变量，‌采用二阶段回归分析来消除未知混杂因素与暴露/处理因素之间的关系，‌使得混杂因素在暴露/处理组与对照组之间的分布均衡，‌从而获取暴露/处理因素对结局变量无偏的效应估计值

工具变量的应用场景包括

但不限于

遗漏变量偏误：‌当模型中存在未观测到的变量同时影响解释变量和因变量时。‌

测量误差：‌如果解释变量的测量存在误差，‌并且这些误差与模型的误差项相关。‌

样本选择偏误：‌在处理样本选择问题时，‌如Heckman模型中。‌

政策评估：‌在评估政策效果时，‌政策的实施可能与一些未观测因素相关。‌

自然实验设计：‌在自然实验中，‌利用外部事件或政策变化作为工具变量来识别因果关系。‌

面板数据分析：‌在面板数据中，‌固定效应和随机效应模型可能无法完全解决内生性问题。‌

医学研究：‌在随机对照试验不可行的情况下，‌评估医疗干预措施的效果。‌

发展经济学和劳动经济学：‌研究经济发展、‌教育、‌健康等方面的政策效果，‌以及教育对工资的影响等。‌

工具变量的使用可以帮助纠正内生性问题，‌从而更准确地估计因果效应，‌为政策制定和科学研究提供依据

检验是否有内生性

1、Hausman检验（同方差）

原假设 H0：所有解释变量均为外生变量，不存在内生性问题

原理：βiv和βols均收敛于真实参数值β，因此(βiv-βols)收敛于0

* 如果需要单独进行Hausman检验（用于OLS与IV结果的比较） * 首先使用OLS估计模型 regress y x w estimates store ols * 然后使用IV估计模型 ivregress 2sls y (x = z) w estimates store iv * 比较OLS和IV结果 hausman ols iv, constant sigmamore //constant表示估计参数包含常数项，sigmamore表示统一使用更有效的估计量所对应的残差来计算方差(如果是外生变量，则是OLS的估计量);p<0.05，在5%的显著性才平上拒绝原假设。

2、Durbin-Wu-Hausman检验（异方差）

原假设（H0）：所有解释变量都是外生的，备择假设（H1）是至少有一个解释变量是内生的。如果检验的p值小于0.05，通常拒绝原假设，认为模型中存在内生性。

estat endog //p<0.05，在5%的显著性水平上拒绝原假设

（二）过度依赖工具变量法（滥用）的后果

效率损失：工具变量估计（如2SLS）通常比普通最小二乘法（OLS）的估计效率低，尤其是在大样本下，OLS估计量是最佳线性无偏估计（BLUE）。

相关性约束

（一）不可识别检验(underidentification test)

不可识别检验用于确定模型是否有足够的信息来唯一确定参数估计值，换句话说，这个检验是用来评估工具变量模型是否可识别，即参数是否可以被准确估计。

如果一个模型是不可识别的，可能的原因就包括“工具变量和解释变量不相关”。原假设意味着工具变量与解释变量不相关，工具变量不可识别。

ivreg2 y x1 controls (x2=z1 z2 z3 z4)*扰动项iid:Anderson LM 统计量;p<0.01，说明在1%水平上显著拒绝原假设*不假设扰动项id:Kleibergen-Paaprk LM 统计量;p<0.01，说明在1%水平上显著拒绝原假设

（二）弱工具变量检验

检验工具变量是否足够“强”，即是否能够提供有效的识别能力，以避免由于工具变量的弱相关性导致的估计偏误。

1、最小特征统计值(minimum eigenvalue statistic)：

在第一阶段回归中，计算工具变量对内生解释变量的联合显著性，得到的F统计量。H0：工具变量的系数=0，存在弱工具变量。

使用estat firststage命令可以对第一阶段的结果进行分析，判断是否存在弱工具变量问题。如果F统计量大于10，通常认为不存在弱工具变量问题

estat firststage,all forcenonrobust*all表示每个内生变量的统计量，而非所有内生变量综合的统计量，forcenonrobust表示基于同方差的假设计算统计量;偏R2越高越好;*如果F统计量>10，拒绝“存在弱工具变量”的假设

2、扰动项iid：Cragg-Donald Wald F统计量

3、不假设扰动项iid：Kleibergen-Paap WaldrkF统计值

ivreg2 yx1 controls(x2=z1 z2 z3 z4)//如果F统计量>10，拒绝“存在弱工具变量”的假设

（三）是弱工具变量该怎么处理

1、换IV

寻找新的工具变量：重新审视理论框架和数据，寻找其他可能与内生解释变量更相关的工具变量。

2、调模型

增加工具变量的数量：如果可能，增加工具变量的数量，使用多个弱工具变量可能比单一工具变量更有效。

舍弃弱工具变量：进行冗余检验(redundancy test)。冗余工具变量(redundant instruments)指工具变量的系数不显著/工具变量与内生解释变量的“偏相关系数"(partial correlations，偏相关系数的平方即为偏R2 )为 0 或接近于 0。原假设 Ho:指定的工具变量是多余的

ivreg2 y x1(x2=z1 z2),redundant(z3) //怀疑z3为冗余变量

考虑交互项：检查工具变量与模型中其他变量的交互项是否可能作为更强的工具。

3、换模型

有限信息最大似然估计（LIML）：LIML对弱工具变量的敏感性较低，可以考虑使用LIML代替2SLS。

ivregress liml y x1(x2=z1 z2)

广义矩估计（GMM）：GMM可以使用多个矩条件，可能对弱工具变量问题更为稳健。

使用结构方程模型：结构方程模型可以同时估计多个方程，处理变量之间的内生性问题。

因果推断的其他方法：如工具变量法不适用，可以考虑使用断点回归设计（RDD）、自然实验等方法。

Stata操作

工具变量法的难点在于找到一个合适的工具变量并说明其合理性，Stata操作其实相当简单，只需一行命令就可以搞定，我们通常使用的工具变量法的Stata命令主要就是ivregress命令和ivreg2命令。

ivregress命令

ivregress命令是Stata自带的命令，支持两阶段最小二乘（2SLS）、广义矩估计（GMM）和有限信息最大似然估计（LIML）三种工具变量估计方法，我们最常使用的是两阶段最小二乘法（2SLS），因为2SLS最能体现工具变量的实质，并且在球形扰动项的情况下，2SLS是最有效率的工具变量法。

顾名思义，两阶段最小二乘法（2SLS）需要做两个回归：

（1）第一阶段回归：用内生解释变量对工具变量和控制变量回归，得到拟合值。

（2）第二阶段回归：用被解释变量对第一阶段回归的拟合值和控制变量进行回归。

如果要使用2SLS方法，我们只需在ivregress后面加上2sls即可，然后将内生解释变量lnjinshipop和工具变量bprvdist放在一个小括号中，用=号连接。选项first表示报告第一阶段回归结果，选项cluster()表示使用聚类稳健的标准误。

ivregress 2sls lneduyear (lnjinshipop=bprvdist) lnnightlight lncoastdist tri suitability lnpopdensity urbanrates i.provid , first cluster(provid)

第一阶段回归结果

First-stage regressions----------------------- Number of obs = 274 No. of clusters = 28 F( 7, 239) = 85.27 Prob > F = 0.0000 R-squared = 0.6487 Adj R-squared = 0.5988 Root MSE = 0.4442------------------------------------------------------------------------------ | Robust lnjinshipop | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------lnnightlight | .183385 .0682506 2.69 0.008 .0489354 .3178346 lncoastdist | .0350333 .077158 0.45 0.650 -.1169634 .1870299 tri | 1.06676 .5637082 1.89 0.060 -.0437105 2.177231 suitability | -.0769726 .0549697 -1.40 0.163 -.1852596 .0313144lnpopdensity | .196144 .0843727 2.32 0.021 .0299349 .3623532 urbanrates | 3.352916 1.687109 1.99 0.048 .029414 6.676419 | provid | 12 | .2051006 .0551604 3.72 0.000 .096438 .3137632 13 | -1.890425 .0951146 -19.88 0.000 -2.077795 -1.703055...... 64 | -1.301895 .1581021 -8.23 0.000 -1.613346 -.9904433 | bprvdist | -.0846917 .0107859 -7.85 0.000 -.1059393 -.0634441 _cons | 2.126233 .9791046 2.17 0.031 .1974567 4.05501------------------------------------------------------------------------------

从表中可以看出，工具变量bprvdist的系数为-0.085，标准误为0.011，在1%的水平上显著

转自蓝境数据微信公众号，仅作学习交流，如有侵权，请联系本站删除！

上一篇： 论文普遍存在的问题实例
下一篇： 论文常见问题解析之时间分析法

投稿问答最小化 关闭

论文常见问题解析之工具变量的作用到底是什么？

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化 关闭

论文常见问题解析之工具变量的作用到底是什么？

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化关闭