实证论文中必须认真解决的内生性问题，到底有哪几种处理方案？最全的总结

2022/11/28 10:19:12　阅读：1335　发布者：

来源：刘西川阅读写作课

整理自：经管定量笔记

控制代理变量

代理变量：用来代替观测数据中难以得到或无法测量的信息。

举个例子：例如研究“是否上大学对收入的影响”，要控制住上大学这个条件之外所有对收入可能造成影响的条件，比如“能力”，家庭条件等有很多难以测量的信息被遗漏

好的代理变量满足以下三个假设，由于比较难理解，穿插例子的形式进行理解：

比如说我们想看是否上大学对收入的影响，

即原本的关系满足：

我们找到了衡量“能力”的代理变量IQ，满足

原本的关系变成：

衡量IQ是一个好的代理变量需要满足以下三个假设：

假设1，代理变量与所缺失的混杂因素相关。即IQ与Ability相关，γ1不为0；

假设2，如果将该代理变量纳入方程内生性问题，则不存在。即Ability放入Income式子中，方程原本的内生性不存在，即新产生的

不与colledge或iq相关；

假设3，无法被代理变量所解释的那部分缺失变量与其他自变量无相关。即e不与colledge或iq相关。

4. 代理变量的不足

代理变量可以大概率减少该变量所在的内生性问题，但是无法完全替代我们研究中所忽略的那个变量。

固定效应模型

基于分析面板数据（对同一样本进行重复观测，比如说家庭追踪调查）

公式解释固定效应

通过对同一样本进行重复观测，得到简单的线性回归：

，其中残差项

可以分成两部分

和

，

，其中

指那些影响y却不随时间变化的不可观测变量，有时被称作固定效应，指代不可观测的异质性；

指随时间变化的，但不影响外的不可观测变量。满足独立同分布。

3. 一阶差分模型（FD）

当面板数据的时间为两个阶段的时候就是一阶差分模型，当时间大于两个阶段的时候就是固定效应模型，一阶差分模型以第一时间段为基期水平，进行相减，从而抵消固定效应，而固定效应模型以所有期的平均水平为基准点，每一期减去平均水平消去固定效应。

3.注意，如果我们使用固定效应模型去分析x对y的影响时，那么x需要是随时间变化的变量，因为非时变变量会被固定效应消去，无法估计。

4.拓展--随机效应模型（RE ）

如果我们非要去研究非时变变量对于y的影响，那么可以使用随机效应模型。随机效应模型既可以去估计非时变量的影响，也可以估计时变变量的影响。但是需要满足一定条件，

，t=1,2，……，T中，

与

不相关，即

，t=1,2，……，T,其中

在固定效应模型中是指那些影响y却不随时间变化的不可观测变量，在随机效应模型中，

满足独立同分布，所以才能研究非时变变量对于y的影响。

4.1Stata命令实现RE模型

工具变量（IV）

通过构建工具变量，来检测不可观测的因素的影响。

工具变量的来源

自然现象

霍克斯比：Y=地区教育质量；X=地区学校数量；Z=地区河流数量（通过河流划分学区）

阿西莫格鲁：Y=国家人均收入；X=制度；Z=殖民地时代死亡率

安谷瑞斯特：Y=母亲就业；X=孩子数；Z=老大老二的性别组合

时空距离（自然历史实验）

安古瑞斯特：Y=收入；X=教育年；Z=出生的季度

卡德：Y=收入；X=教育年；Z=家距离大学远近

钱楠筠：Y=男女性别比；X=家庭收入男女性别比；Z茶叶加工

陈云松：Y=幸福感；X=是否信教；Z=解放前宗教场所

陈云松：Y=政治信任；X=城市餐饮,解放前宗教场所；Z=餐饮，参与社群

3. 公式理解：

，如果

,可以考虑使用工具变量方法。

4.引入工具变量z，z需要满足两个关键假设：

投稿问答最小化 关闭

实证论文中必须认真解决的内生性问题，到底有哪几种处理方案？最全的总结

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

实证论文中必须认真解决的内生性问题，到底有哪几种处理方案？最全的总结

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭