投稿问答最小化  关闭

万维书刊APP下载

经济学实证研究中的稳健型检验基本环节和检验方法大总结

2023/12/27 17:03:33  阅读:51 发布者:

来源:计量经济圈

1. 稳健性检验的基本环节

一项可靠的稳健性检验是有因有果、前后对应、自成体系的,例如韦倩等(2014)在研究市场力量对中国沿海地区崛起的作用时,从四个方面进行了稳健性检验:一是考虑地理因素的影响,采用了某地区是否为沿海地区虚拟变量和省会城市离上海和香港的距离两种方法对地理因素进行度量。

二是考虑内生因果关系对模型估计造成的影响,将原始数据划分为五个时间段,对被解释变量和一部分解释变量计算该时间段内的均值形成新的变量;另一部分解释变量取不同时间段内的初始值,打乱其内在的因果联系对模型进行了重新估计。

三是考虑研究中自设市场因素变量本身也会存在概念有效性偏误,用普遍认可的市场化指数代替,对模型进行了重新估计。

四是将研究样本的时间序列进行扩展,加入19561978 年计划经济时代市场机制“天然”缺失机会,设置虚拟变量进一步进行了稳健性检验。再如申广军等(2016)利用2009 年增值税改革政策冲击,基于微观层面数据分析增值税率下降影响企业生产,进一步影响宏观经济增长的作用时,从四个方面进行了稳健性检验:一是考虑采用企业实际缴纳增值税这一核心解释变量面临的测量误差风险,采用备选指标增值税应缴纳税率替代核心解释变量进行分析;二是考虑企业进入和退出的影响,保留了连续三年存在的企业为子样本,利用平衡面板数据解决样本选择问题;三是考虑了增值税改革自身的内生性问题;四是考虑除企业层面异质性外,其他随时间变动的因素对企业行为和绩效的影响,包括行业、省份及税收优惠三种异质性趋势下增值税降低对企业行为和绩效的影响。

这类研究对样本选取、模型设计和变量指标选择中存在不确定性或较为主观的方面有着明确的说明,基于对核心解释变量主观性和测量误差的考虑,进一步对为何从这些方面出发进行稳健性检验有全面、明确的原因阐述;与此同时,对稳健性检验方法的选择均结合所研究的问题进行了严谨论述,可以从中清晰地探测到研究者的逻辑思考和方法选择过程。

Neumayer Plü mper2017)将这种稳健性检验逻辑步骤概括为“四步法”:第一步,根据研究理论及研究问题需要,确定基准模型;第二步,识别基准模型中所包含的假设;第三步,以改变基准模型假设的方式发展模型,这些模型就是备选稳健性检验模型;第四步,比较每一个稳健性检验模型和基准模型的估计效应,对稳健性进行分析。

第一步是实证研究的必要步骤,也存在较多争议,由理论模型逐步演化而来的实证基准模型往往更具说服力,设计构建基于讨论、叙述型理论分析的实证基准模型则更多以“借鉴已有研究”来反驳质疑。当然,基准模型的设定并不仅限于此,通常研究者还应对基准模型进行一系列模型设定检验。例如基于残差结构进行的检验,要保证基准模型在统计意义上不是已知被误设或一开始不会被质疑,若基准模型的设定不合理,则后续的稳健性检验便没有任何意义。

第二步是对可能造成基准模型不稳健的原因展开分析,需要识别的假设就是基准模型设定中存在不确定性而研究者假设其合理的地方。这些地方可以是基于经济意义的思考,比如核心解释变量的选择、样本的选择,尤其是微观数据研究中的样本选择,也可以是基于统计思想的考虑,比如内生性、遗漏重要解释变量等,这也正是为什么“如此”进行稳健性检验的原因。许多研究者在文章中会省略对这一过程的论述,但这恰巧也是让读者产生质疑、造成稳健性检验选择随意等不良错觉的根本所在。因此,本文认为在进行稳健性检验时,研究者有必要对基准模型包含的假设或为何如此进行稳健性检验进行阐释,尽可能排除所用模型不正确的可能性。

第三步通过改变模型的基准假设,对被检验的模型进行改变,以此作为基准模型的对比形式。这是第二步内容的进一步实践,同时也是第四步的开端。

第四步是稳健性检验结果的分析,现有研究普遍认为,若稳健性检验模型结果在系数大小、方向及显著性(尤其是方向和显著性)上没有较大的改变,则可认为基准模型研究结果稳健可靠,方向和显著性“较大的变化”容易理解,但“较大的变化”所表示的范围如何似乎没有严格的标准。为严格定义结果的稳健性,Neumayer Plü mper2017)提出了稳健度(ρ)的概念,即稳健性检验模型的概率密度函数落入基准模型概率密度函数95%置信区间的份额或百分比,如式:

“四步法”逻辑从“识别”到“实践”的逻辑思路呈现了一个较为完整的稳健性检验分析、思考过程,也阐明了实证研究的研究设计需要包含的重要环节,对研究者设计稳健性检验具有重要的启发和引领作用。

2. 稳健性检验类型

2.1基于模型假设的稳健性检验

不同的建模假设决定了如何选择稳健性检验,由此可将稳健性检验分为模型变异检验、随机置换检验、结构置换检验、稳健性极限检验以及安慰剂检验共五种类型。

模型变异检验是以离散的方式改变模型的某一个方面,从而进行稳健性分析。模型变异检验较为常见,增加或减少解释变量、改变模型函数形式、改变样本容量等均可归入该类型,这类方法的优点是容易找到备选策略并进行稳健性检验,但也会存在同义反复等缺陷。

随机置换检验是从大量看似合理的备选模型中随机选择稳健性检验模型,包括分割样本检验、基于解释变量集合的敏感性分析、任意置换测量误差范围的检验。随机置换检验一个致命的缺陷是,如果检验前后模型空间无法限制,那么检验结果就变得难以解释;

结构置换检验是在一个小空间内穷尽所有可能的替代模型,或以结构化的方式选择少数几个模型进行稳健性分析。例如,对于某些变量,如满意度、腐败程度等,可以以0 为分界点,在-1010 的标尺范围内进行选择,也可定义5 为分界点,在010 的标尺范围内进行选择,结构置换检验可以使用所有合理的分界点进行分析,讨论结果是否发生了改变。

稳健性极限检验通过探讨哪种模型设定会使得基准模型的估计不稳健,利用反证法的思想对基准模型的稳健性进行检验,这种模型可能代表了模型误设。考虑非时变“不可观测的异质性”是否会让基准模型变得不稳健时的检验,可归为稳健性极限检验。例如申广军等(2016)研究稳健性检验中考虑除企业异质性层面的影响之外,行业、省份及税收优惠三种异质性趋势下增值税降低对企业行为和绩效的影响。

安慰剂检验通常有两种做法,一是用安慰剂变量代替因变量,检验在预期无效的条件下感兴趣的变量没有效果,二是用安慰剂变量代替处理变量,检验这个安慰剂变量没有效果。第一种方法在单一模型运算下无法做出定论,故不常用;第二种方法在实证研究中较为常见,如利用PSM-DID 模型评判政策效应时,研究者总会利用将政策提出时间前移,说明此时的政策变量没有效果,以达到一定稳健性检验的要求。

可以看出,上述五种稳健性检验均假设基准模型是正确设定的或至少在某个维度存在确定性,并在不同维度放松基准模型所包含假设而进行稳健性检验分类,故本文将其概括为基于模型假设的稳健性检验类型。不难发现,基于模型假设的稳健性检验在操作思维上较为抽象,并且要求研究者做到统筹全局,尽可能识别基准模型所包含的全部假设。另外,在实际检验过程中,一种稳健性检验方法也可能同时属于两种或两种以上的稳健性检验类型,例如将样本逐个减少进行稳健性检验,既可认为是模型变异检验,也可属于随机置换检验。因此,从实际操作来看这种分类较为抽象,有待于挖掘更易理解和分辨的稳健性检验分类。

2.2 基于模型不确定性维度的稳健性检验

进行稳健性检验的原因在于实证模型充满不确定性,因而可以从不确定性维度得到另一种稳健性检验的分类方式。经济模型的不确定性体现在实证研究过程的所有环节。在模型设定环节容易出现两种不确定性:一是变量方面的不确定性,包括可能存在的遗漏变量和多选无关变量,二是模型形式选择的不确定性。

在变量衡量指标选择环节,对于解释变量和被解释变量具体指标的选择,往往会存在概念有效性难以准确判断等问题。在数据搜寻环节,常见的问题包括样本有效性较难确定、数据缺失严重等。在模型估计环节,通常需要检验基于真实数据的模型是否满足经典计量模型的基本假设,包括内生性等。因此,基于实证研究各环节存在的不确定性,稳健性检验的类型可以进一步扩展,也更易被理解和接受。故可以将稳健性检验划分为总体或样本不确定的稳健性检验、概念有效性和测量不确定的稳健性检验、存在内生性的稳健性检验、模型函数形式不确定的稳健性检验和考虑异质性的稳健性检验共五种类型。总体或样本不确定的稳健性检验是指包含总体或样本观测边界不确定、总体或样本存在奇异值、总体或样本部分观测值缺失的稳健性检验。考虑总体或样本不确定性,研究者常以包含可能不属于总体的观测值、剔除可能属于总体的观测值、扩充样本容量、选择子样本进行回归、上下缩尾剔除异常值等方法进行稳健性检验,具体如表1所示。

概念有效性和测量不确定的稳健性检验包含概念有效性的稳健性检验和测量不确定的稳健性检验,两者看似无关,但实际中概念有效性的难以确定往往会导致无法对所研究的问题进行统计测量,因而两者间也存在紧密的联系。概念有效性的不确定有两个根本原因:一是多维性,例如对于“健康”这一概念,刘畅等(2017)的研究给出了6 个维度的度量方法。二是缺乏一致的定义,例如“技术创新”,研究中经常以行为和结果两种形式衡量。

系统性测量误差是测量不确定的另一个重要原因,在现实世界中占主导地位,其主要来源有三个:一是测量过程的性质。例如小地震的死亡人数测量会较为精确,而大地震的死亡人数会因基础设施破坏较为严重等而难以测量,测量误差也会增大。二是在缺失测量制度和测量单位的情况下,个体自量化变量时通常会对量化施以影响。例如访谈调查中,很多变量会受到访谈人员主观意识的影响。三是研究者进行了不正当的转换。例如对次序变量计算算数平均值。测量误差往往会导致模型估计中真实信息被隐藏、无法显示无误差数据中存在的关系甚至估计系数的符号相反等情形。针对概念有效性不确定,研究者常采用变量替换法进行稳健性检验,包括考虑多维性采用的综合指标替代法和考虑缺乏统一定义而采用的单一变量替代法;针对测量误差的存在则可采用改变变量尺度、再分类等方法进行检验。具体如表2 所示。

存在内生性的稳健性检验在研究中较为常见。对于存在内生性的原因,往往有以下几种解释:一是存在内生的因果循环关系;二是遗漏了重要的解释变量;三是样本的自选择。关于内生性检验的方法主要有工具变量法、加入滞后期和Heckman 两阶段模型,考虑遗漏变量的影响研究者还会加入新的控制变量进行检验。具体如表3 所示。

模型函数形式不确定的稳健性检验来自通过经济理论推演便可得到模型函数形式的例子很少,许多研究中变量间的函数形式事先并不知晓,研究者必须自行设定函数形式进行分析验证,而这种模型形式的设定与研究者自身知识储备等密切相关。针对模型函数形式的不确定,Neumayer Plümper2017)在研究中提出了三种检验方法:一是高次多项式检验,即通过一个高次多项式模型来放松函数形式假设,例如以下两个模型:

模型(2)与模型(3)关于x 求一阶和二阶导数,并令其等于0。容易判断虽然两模型的函数形式不同,但具有相同的拐点,仅倾斜度存在差异,因此可利用模型(2)对模型(3)进行稳健性检验。二是半参数检验,即通过一个半参数模型来放松模型函数形式假设。三是函数形式中断检验,即加入一个虚拟变量,在断点处允许函数模型有不同的效应。不难看出,上述三种方法更多是针对非线性模型函数形式不确定的检验。对于线性概率模型,蔡晓慧和茹玉骢(2016)用条件LogitProbit Tobit 模型替换了线性基准模型进行稳健性检验。对于普通线性函数模型,许培源和程钦良(2020)在基准模型中加入了因变量的滞后项,改变模型函数形式进行了稳健性检验。具体如表4所示。

考虑异质性的稳健性检验包含关于因果异质性与环境条件性的稳健性检验、异质性时间趋势稳健性检验以及时间异质性结构变化检验。因果异质性为针对不同类型的人、地区、行业等,对于一项刺激可能会做出不同程度或完全不同的反应,环境条件性暗含分析单元同质,但针对不同的刺激环境因果关系可能会发生变化,实际中很难将因果异质性和环境条件性分开处理,且二者之间存在或多或少的联系,因此实证研究中也往往将两者同时处理。异质性趋势是指部分因素随时间的变化而变化,会混淆研究变量对目标变量的影响。例如申广军等(2016)指出,如果政府积极扶持某一行业,为其提供了多种机遇,那么这一行业会快速发展,从而混淆了增值税改革对企业行为和绩效的影响。时间异质性是指在某一个或某些时间节点,自变量x 对因变量y 的影响强度或方向可能发生变化,例如金融危机前后的货币、财政政策对宏观经济的影响可能发生变化。可能存在因果异质性和环境条件性时,研究者会采用分样本回归方法;可能存在异质性时间趋势时,固定随时间变化的因素是常用的稳健性检验方法;可能存在时间异质性结构变化时的稳健性检验方法有扩展时间窗口、缩短时间窗口、切割时间段、滚动时间窗口等方法,具体如表5 所示。

进一步地,稳健性检验“四步法”逻辑步骤中的第二步逐一识别基准模型所包含的假设,可阐述为从模型设定环节出发,识别基准模型所包含的不确定性。由此,研究者能有清晰方向查找基准模型的缺陷,阐明缘由并进行更全面的稳健性检验。

Source: 刘明,宋彦玲.经济学实证研究中的稳健性检验方法——基于检验逻辑视角的阐释

转自:“经管学苑”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com