本文选自《经济学报》2022年第 9 卷第 3期
作者信息
刘冲 北京大学经济学院长聘副教授
诸宇灵(通讯作者)北京大学光华管理学院博士研究生
李皓宇 北京大学经济学院博士研究生
摘要
近年来,作为最重要的准实验方法之一,断点回归设计(RDD)在经济学研究中的重要性不仅体现在应用实践中的快速发展,更体现在一系列前沿理论的突破与完善。本文系统梳理了连续性和局部随机性两种断点回归设计的分析框架,总结了两种框架的关键假设、估计方法、统计推断、实现方式及主要操作步骤,在此基础上对比了两者在理论和应用场景方面的差异。本文进一步阐述了多重配置变量、多重断点和拐点回归设计等三种特殊情形下的RDD估计方法,并提供了具体的实现方式,为丰富RDD方法的应用场景、拓展实证研究的可行性提供了有力支撑。
关键词 断点回归设计;连续性框架;局部随机性框架;理论进展;应用场景
结论启示
目前,国内部分实证研究在使用RDD方法时,存在缺乏细致讨论识别假设能否成立,以及带宽选取方式误用等问题,导致由此得出的结论缺乏可靠性。
本文的意义在于,借由对不同应用场景下RDD方法的基本假设和原理的介绍,提供规范化使用RDD方法的一般步骤,以期提高研究者利用RDD方法进行因果推断的严谨性,从而进行科学的政策评估,形成高质量的学术论文或研究报告,讲好中国故事、服务科学决策。
全文如下
引言
在经济学研究中,研究者十分关心变量之间的因果关系,以此解释经济现象背后的规律,或者评估特定事件冲击及经济政策带来的影响。类似于自然科学研究中使用的控制变量法,在社会科学领域中可以使用随机控制实验(Randomized Controlled Trial, RCT)进行研究。但是,囿于人力、物力、财力或伦理等方面的限制,并非所有实证研究都能够通过RCT方法进行。鉴于此,基于反事实的准实验(Quasi-experimental)方法在社会科学研究中越来越受到重视(Gangl, 2010;Morgan and Winship, 2015),工具变量法(Instrumental Variable, IV)、双重差分法(Difference-in-Difference, DID)、断点回归设计(Regression Discontinuity Design, RDD)等因果识别方法(Angrist and Pischke, 2010)在实证研究中的应用越来越广泛。
在众多准实验方法中,断点回归设计(Regression Discontinuity Design, RDD)是一种非常重要的因果识别方法,具有一些独特的优势。一般而言,断点回归设计比其他方法更接近于随机实验,可以得到与RCT类似的估计结果(Shadish et al., 2002;Lee and Lemieux, 2010;罗胜,2016;Athey and Imbens, 2017;刘生龙,2021),它能够从实验基准中还原因果效应(Recovering Experimental Benchmarks,Green et al., 2009;Hyytinen et al., 2018),具有更强的因果推断力,能够避免因果估计的内生性问题,反映变量之间真实的因果关系(Lee, 2008),因而在进行因果推断和政策评估时,RDD是最可信的准实验方法之一(Cattaneo and Titiunik, 2022)。此外,RDD能够在较弱的假设下识别因果效应,且假设易于被检验(Cattaneo et al., 2020d;Valentim et al., 2021),还可以灵活地通过使用参数和非参数等不同估计方法、调整带宽等方式对局部平均处理效应进行估计、推断和稳健性检验,从而增强RDD估计结果的可信度(Cattaneo et al., 2020a, 2022)。
Hahn et al.(2001)从理论上对断点回归设计的模型识别和模型估计做出了严格证明, 并提出了相应的估计方法,进而发展为最常用的基于连续性的RDD框架,并逐渐得到了广泛应用。以Angrist and Lavy(1999)为起点,2000年以来,RDD被越来越多地被应用于经济学的不同领域。2000—2019年间,使用RDD方法进行实证研究的英文文献达200余篇(Villamizar-Villegas et al., 2021),涉及教育(Jacob and Lefgren, 2004;Oreopoulos, 2006;Pop-Eleches and Urquiola, 2013;Cook and Kang, 2016)、劳动(Battistin et al., 2009;Jepsen et al., 2016)、财税(Meng, 2013;Li et al., 2021)、医疗(Almond et al., 2010;Bernal et al., 2017)、环境(Chay and Greenstone, 2005;Greenstone and Gallagher, 2008)、社会治安(Hjalmarsson, 2009;Depew and Eren, 2016)等不同细分领域。
2010年后,随着可供使用的中国微观数据逐渐丰富,国内学界开始较多地使用RDD方法进行实证研究(刘生龙,2021)。根据在中国知网上的检索,2010—2021年间,至少有300余篇文章在实证研究中使用了RDD方法,图1给出了历年使用RDD方法进行实证研究的文章数量变化趋势,这些研究涵盖了健康、劳动、金融、教育、财税等诸多领域。例如,雷晓燕等(2010)研究了退休制度对老年人健康的影响,刘生龙等(2016)研究了义务教育的回报率,李明等(2018)研究了减税对企业效益的影响,李芳华等(2020)研究了精准扶贫政策对劳动收入和劳动力供给的影响,陆蓉和谢晓飞(2020)研究了指数成分股交换对收益率的影响,杜鹏程等(2021)研究了税收征管改革对企业劳动收入份额的影响。
近年来,作为一种重要的因果识别方法,RDD的快速发展不仅体现在应用数量和范围的拓展(Villamizar-Villegas et al., 2021),更体现在一系列理论前沿进展的出现。基于在断点附近可以近似认为在进行随机实验的思想,Cattaneo et al.(2015, 2017)发展出了另一种基于局部随机性的RDD框架,这一框架与基于连续性的RDD框架适用于不同的应用场景,连续性的RDD框架更适用于大样本,而局部随机性的RDD框架则适用于样本量较小和离散配置变量等情形下的研究。在最优带宽的选择(Imbens and Kalyanaraman, 2012;Calonico et al., 2020)、协变量的引入(Calonico et al., 2019)、分位数处理效应的估计(Frandsen et al., 2012)、离散型配置变量的RDD推断(Kolesr and Rothe, 2018)等方面,RDD方法也经历了诸多理论发展。此外,RDD的前沿进展还体现在应用场景的丰富,例如从单一断点拓展到多重断点、从数值的跳跃拓展到变量斜率的弯折等等,一系列理论突破发展迅速(Choi and Lee, 2021),应用范围也不断拓宽。
本文首先梳理了RDD方法的两种分析框架,即基于连续性的断点回归设计和基于局部随机性的断点回归设计,并从关键假设和估计方法等方面比较了两种框架的异同,总结了两种框架的适用场景。在此基础上,本文介绍了RDD方法的前沿进展,重点关注多重配置变量、多重断点和拐点回归设计这几种特殊应用场景,并结合Stata软件为RDD方法的实证应用提供参考。本文的工作总结了近年来RDD方法在理论突破、应用范围上的快速发展以及在实证操作层面的具体步骤,对现有中文综述性文章进行了拓宽,同时也为RDD实证研究提供了应用操作层面的参考。
1RDD方法的两种分析框架
在精确断点回归设计中(Sharp RDD)①,我们记配置变量②(Assignment Variable)为X,配置变量的断点(Cutoff或Threshold)为c,个体i的处理状态为
RDD分析框架主要有两种,一是基于连续性的RDD框架(Continuity-Based Framework),二是基于局部随机性的RDD框架(Local Randomization Framework),两者都要求位于断点c两侧且配置变量X得分接近的个体之间具备“可比性”。两种分析框架的主要差异在于对“可比性”的设定:在基于连续性的RDD框架中,可比性指的是潜在结果变量(Outcome Variable)须满足连续性;而在基于局部随机性的RDD框架中,可比性指的则是断点附近需要满足类似于随机实验设计的条件。同时,两种方法对“可比性”也有共同要求,即被观测对象不能通过操纵自己的配置变量来有意识地控制自己的处理状态,这也是使用RDD方法的前提。目前针对此要求,可以使用配置变量的概率密度函数进行检验,即如果在断点附近,配置变量的概率密度函数连续,则可以认为配置变量没有被操纵。在实证研究中,通常采用Stata软件中的rddensity命令进行上述检验③。
由于两种分析框架依赖于不同的识别假设,使用的估计和推断方法也有所不同,因此在特定应用场景中的有效性也存在差异。
1.1基于连续性的RDD框架(The Continuity-Based Framework)
1.1.1基本假设
连续性的RDD框架需要满足以下两个关键假设:
假设1:用以分析的观测样本是从无穷大的整体中随机抽取的。
具体而言,在这一框架下,观察到的数据{Yi(1),Yi(0),Xi,Di}(i=1,2,…,n)是整体的一个随机样本,研究者主要关注的是结果变量的条件期望函数
假设2:在断点c处,μ(x)是连续的。
由于可能不存在Xi=c的观测样本(简称观测,下同),或者该处的观测量很少,为了得到控制组和处理组在断点处结果变量的均值
和
,需要利用断点c附近的观测来近似未知的回归函数μ(x)。这一假设也意味着,在断点c处,μ1(x)和μ0(x)是关于配置变量X的连续函数,影响结果变量的其他潜在变量都不存在跳跃,断点两侧附近的个体之间唯一的区别就是其处理状态Di,从而确保断点附近的个体具有“可比性”。因此,在精确断点回归设计中,研究者感兴趣的是断点处的平均处理效应
。基于μ1(x)和μ0(x)的连续性假设,有τ(c)=
。
需要明确的是,断点处的平均处理效应τ(c)不同于平均处理效应ATE=
只是x=c处的个体的平均处理效应,即,RDD估计的实际上是“局部平均处理效应”(Local Average Treatment Effect, LATE),这在一定程度上限制了断点回归估计的外部有效性。
1.1.2断点回归处理效应的估计:基于局部多项式的点估计
在RDD中,通常使用局部多项式来估计未知的函数
t=0,1,这一方法强调在断点c附近对回归函数的拟合,而不考虑与断点距离较远的观测,因此得到的估计结果更加稳健,对离群值等数据问题的敏感度更低。局部多项式法和普通最小二乘法(OLS法)的主要区别在于,OLS法假定用以进行估计的多项式是真实的函数形式,而局部多项式法只是将其视为真实函数形式的近似,因此得到的估计中包含近似误差或模型错误设定导致的偏差。
在利用局部多项式进行估计前,首先需要确定多项式的阶数p以及核函数K(x)。给定带宽h,多项式的阶数p越高,对回归函数拟合的准确性越高,但同时也会提高处理效应估计的方差。具体而言,局部常数拟合(p=0)容易产生欠拟合问题,高阶多项式(p>2)则可能导致过拟合问题,在估计边界点时不稳定,出现龙格现象(Runge Phenomenon)(Calonico et al., 2015),同时可能带来估计噪声(Noisy Estimates)、对多项式次数敏感(Sensitivity to the Degree of the Polynomial)、置信区间覆盖率低(Poor Coverage of Confidence Intervals)等问题,因此在实证研究中一般建议采用p=1(线性)或p=2(二阶)进行估计(Gelman and Imbens, 2019)。
核函数K(x)的作用是根据配置变量Xi和断点值c之间的距离赋予观测非负权重。具体而言,在利用局部多项式进行点估计时,只使用给定带宽(Bandwidth)范围内的观测,即配置变量X的值处于[c-h,c+h]范围内的观测,更接近断点c的观测在估计中通常会被赋予更高的权重,这一权重的分配方式是由核函数K(x)决定的。常用的核函数包括三角核函数(Triangular Kernel)、伊番科尼可夫核函数(Epanechnikov Kernel)、均匀核函数(Uniform Kernel)等,图2直观地刻画了不同核函数在赋权时的差异①。不过在实证研究中,核函数K(x)的选择对于估计和推断结果的影响往往较小。
给定带宽h、多项式阶数p以及核函数K(x),在基于连续性的RDD框架中,局部多项式估计主要包含以下三个步骤:
1.1.3带宽h的选择方法: 数据驱动的非参数方法
带宽h决定了断点c两侧能够用以进行断点回归估计和推断的样本量。在早期的实证研究中,研究者往往根据先验知识事先设定带宽h,由于断点回归估计结果对带宽h的选择很敏感,因此这一做法已逐渐被一些数据驱动的非参数方法所取代。
带宽h的选择面临“偏差-方差”的权衡问题,给定多项式的阶数p,带宽h越小,由模型错误设定导致的偏差就越小,断点回归处理效应估计的方差越大,数据驱动的带宽选择方法就在试图解决这一问题。在基于连续性的RDD框架中,最常用的带宽选择方法是MSE标准(Imbens and Kalyanaraman, 2012;Calonico et al., 2014, 2019;Arai and Ichimura, 2018),即选择带宽hMSE,使得断点回归估计的均方误差(Mean Square Error, MSE)最小化,在应用中,对于断点两侧的样本,也可以分别选择不同的带宽。
根据MSE标准得到的hMSE对断点回归的点估计而言是最优的,但在构造估计的置信区间时,更好的带宽选择方法是CER标准,即选择带宽hCER,使得覆盖误差率(Coverage Error Rate, CER)最小化①(Calonico et al., 2018, 2021)。需要注意的是,使用带宽hCER进行点估计往往不是MSE最优的。所以在实际应用中,更适合的方式是使用带宽hMSE对断点回归进行MSE最优点估计,然后研究者可以选择使用带宽hMSE或使用hCER来构建置信区间②。
1.1.4断点回归处理效应的统计推断
利用OLS 法进行统计推断依赖于t统计量在大样本中近似标准正态分布这一性质,但在基于hMSE的断点回归估计中并未考虑相关统计量的分布特性,因此直接通过OLS法来估计断点回归处理效应的置信区间可能会导致无效的统计推断。
常见的构造置信区间的方法有两种:一种方法是在估计置信区间时选择一个比断点回归点估计使用的带宽hMSE更小的带宽hCER,但这种方法会使得用以进行断点回归点估计的观测量比进行统计推断时多,从而损失统计效力。另一种更常用的方法是稳健偏差校正法(Robust Bias Correction Method),即在断点回归点估计和推断时使用相同的带宽hMSE,对估计的偏差进行校正(这一偏差项形成于MSE最优的带宽选择过程),消除由于带宽较大而导致的模型错误设定的影响,同时对标准误进行调整以处理偏差校正导致的其他样本误差,构造以偏差校正的点估计为中心的置信区间,这一方法的优点是在估计和推断中使用相同的观测,从而统计效力更高(Calonico et al., 2014)。
1.1.5模型拓展: 引入协变量
在实证中,研究者可能希望在RDD中进一步引入协变量。记个体i的协变量向量为Zi,Zi(1)和Zi(0)分别代表处理组和控制组样本的潜在协变量向量,有
。如果协变量的值是在个体受处理前给定的(Pre-determined),则对于所有观测样本i,应该满足Zi(1)=Zi(0)。常用的引入协变量的方法有两种:一种方法适用于仅在模型中加入几个离散协变量的情况,只需根据使用的协变量将数据分成不同子样本,然后沿用前述提到的方法进行断点回归估计。另一种方法是加入协变量调整的断点回归估计,在这一方法中,协变量可以是离散的,也可以是连续的,如果协变量Zi是在个体受处理前给定的,那么经协变量调整的断点回归估计值
的一致估计。
1.1.6实证应用
综上,连续性的RDD框架在应用时主要分为参数和非参数两种方法。在参数方法中,带宽h和多项式阶数p由研究者基于经验、研究问题特点和数据特性等情况事先给定;而在非参数方法中,给定阶数p,带宽h是通过MSE标准或CER标准等最优带宽选择标准得到的。应用基于连续性的RDD分析框架,除了报告系数的点估计值及其显著性、观测量N等常规指标外,往往还需要报告以下几个参数:带宽h、多项式阶数p、使用的核函数K(x)类型等,使用非参数方法时还需要报告带宽选择标准。
此外,研究者需要进行以下几个步骤的工作:第一,通过绘制散点图和拟合线等方式观察结果变量在断点处是否存在跳跃;第二,使用rddensity命令检验配置变量的概率密度函数,判断配置变量是否被操纵;第三,进行局部平滑性检验,确认除结果变量外,其他前定协变量在断点附近不存在跳跃,研究者可以通过绘制散点图加以检验,也可以将其他前定协变量作为结果变量,通过断点回归方法进行检验;第四,选取虚拟断点进行安慰剂检验,如果虚拟断点处检验的结果是连续的,则能够更好地表明原断点的真实性。
1.2基于局部随机性的RDD框架(The Local Randomization Frame-work)
1.2.1基本假设
不同于基于连续性的RDD框架,基于局部随机性的RDD框架不要求观测样本是从无穷大的整体中随机抽取的,因此这一方法特别适用于对小样本的研究。此外,这一方法也不要求回归函数或配置变量在断点处的连续性,因此适用于配置变量为离散值的情况。
局部随机性的RDD分析框架的基本思想是,在断点附近的一个小区间内(称为“观测窗口”,Window),一个观测对象是否受到处理是完全随机的,结果变量仅受处理状态的影响,而与配置变量无关。为了保证这一随机性,样本需要满足以下两个假设:
假设1:在观测窗口W0内,样本的分布函数FXi|Xi∈(W0)(X)已知,对所有样本点都相同,与结果变量Yi无关,即分布函数可以被表示为FXi|Xi∈(W0)X=F(X)。
假设2:在观测窗口W0内,配置变量Xi仅通过处理状态影响结果变量Yi,即Yi(Xi,Di(Xi))=Yi(Di)。
上述两个假设成立的条件下,在观测窗口W0内,个体是否受到处理与其结果变量的值无关,保证了“受处理”本身的外生性,因此接近于随机实验。在观测窗口内,结果变量的期望可以视为常数,即有E(Yi|Xi≥c)=Y(1),E(Yi|Xi)=Y(0),而在观测窗口外,函数可以是任意形式,不过这一方法无需对观测窗口外的函数做出估计。
如图3所示,W1是满足两条基本假设的最大观测窗口,即最优观测窗口;当观测窗口为W2时,不满足“结果变量仅由处理状态决定,与配置变量无关”的基本假设;当观测窗口为W3时,虽然满足两条基本假设,但样本量相比于W1更少,会降低估计效力①。
局部随机性的RDD分析框架无须估计结果变量与配置变量之间的函数关系,可以直接得出处理效应τ的估计结果。在实证应用中,直接将处理组和控制组的结果变量平均值相减,就可以得到使用这一方法估计出的处理效应。
基于局部随机性的RDD框架的第二条假设可以进一步放松,允许Yi与Xi有关,但要求在观测窗口内存在一个变换ϕ,使得
,而处理效应
。在实际应用中,通常使用关于Xi的p阶多项式φ(Xi)来构造变换ϕ,即
,而且断点两侧的函数可以不同,这使得本方法在形式上接近于基于连续性的RDD框架。尽管形式上类似,但在估计方法上,两种框架是截然不同的。
1.2.2估计方法
基于局部随机性的RDD框架要求在观测窗口内观测样本的结果变量与配置变量无关,只与处理状态Di有关,往往满足这一假设的观测窗口很小,窗口内样本量较少,因此,在估计时通常使用适用于有限样本的费雪推断法(Fisherian Inference Approach)。
费雪推断法认为,结果变量的期望不是随机变量,而是只与处理状态有关的固定值Yi(0)和Yi(1),由此提出不存在处理效应的原假设:
如果原假设成立,则观测窗口内的样本是否受处理都不会影响观测值,因此,将样本以任何方式分为两组,处理组与控制组结果变量的平均值都应当相等。如果在观测窗口W0内,样本数为nW0,其中处理组样本数为nW0,+,控制组样本数为
种分组方法,每种分组方法被取到的概率为
。如果实际分组得到的处理组与控制组结果变量的平均值之差在所有可能的分组方法中排序第m大,则原假设成立的概率为
,那么如果单边拒绝原假设,则有Yi(1)>Yi(0)的置信度为
①。
例如,如果观测窗口内共有5个观测值,分别记为a1,a2,…,a5,其中第1、2、3个为控制组,第4、5个为处理组,结果变量分别为1,1,1,2,2。则如果随机分组,分组方法一共有
种,分别记为t1,t2,…,t10,其中实际分组方法为t10,每种分组方法下处理组与控制组结果变量的平均值之差如表1所示。
从表1中可以看出,实际分组方法t10得到的差值在10种分组方法中最大,从而原假设成立的概率
,因此以
的置信度认为Yi(1)>Yi(0)。
在实际应用中,估计方法又可分为小样本、较大样本和大样本三种。小样本估计方法与上述例子相同,分为以下两步:
(1) 按照观测窗口W0内处理组和控制组的数量,将样本按照全部可能的组合分组,所有分组方法tW0的集合记为TW0,计算每个分组方法中处理组与控制组结果变量的平均值之差
,实际分组方法的差值记为Sobs。
(2) 若预期处理效应为正,计算原假设成立的概率
,其中分子
表示平均值之差大于实际分组方法的个数,由此可得到处理效应大于0的置信度1-pF;预期处理效应为负时,不等号的方向相反。
当观测窗口内样本量较大时,随着样本量的增加,计算所有可能的分组方法结果的计算量将以阶乘的速度增加,因此常常使用随机抽样模拟的方法来减小计算量,具体有以下三步:
(1) 计算实际分组方法中处理组与控制组结果变量的平均值之差Sobs。
(2) 随机选取B种分组方法,分组方法j中处理组与控制组的差值记为
。
(3) 若预期处理效应为正,原假设成立的概率
,其中Ⅱ表示若括号内不等式成立则取1,否则取0。由此可得到处理效应大于0的置信度1-pF;预期处理效应为负时,不等号的方向相反。
在大样本的情况下,设实际处理效应为τ,可以认为处理组与控制组结果变量的平均值之差
服从均值为τ、标准差为σ的正态分布,标准差σ的估计量
为处理组的样本结果变量方差,
为控制组的样本结果变量方差,由此可以计算原假设HF0:τ=0成立的概率。
1.2.3置信区间
在统计推断中,除原假设是否成立外,研究者往往还关心处理效应置信度为(1-α)的置信区间。原假设为HFτ0:τ=τ0,设调整后的结果变量
。在有限样本的情况下,分别使用调整后的结果变量按照1.2.2中的方法计算每个分组方法中处理组与控制组结果变量的平均值之差
和实际分组方法得到的差值
。置信区间的下界τmin为满足
≤α的τ0最大值,上界τmax为满足
在大样本的情况下,由于平均值之差
服从正态分布,可以直接使用正态分布表得到置信区间。例如,置信度为95%的置信区间为
。
1.2.4选择合适的观测窗口
从1.2.2和1.2.3中可以看出,局部随机性的RDD框架非常依赖于观测窗口的具体范围:窗口太大,很有可能不满足本方法的两个基本假设;窗口太小,则会导致观测值过少。研究者除了根据经验在断点附近取一个合适大小的窗口进行估计外,还可以利用协变量得到合适大小的观测窗口。
为了能够利用协变量得到合适大小的观测窗口,被选择的协变量Z需要满足以下两个条件:第一,Z的取值不受处理状态影响,即Z为前定变量;第二,在用以估计的全样本中,至少某些观测的Z与X需要存在相关性。
只有当协变量满足上述两个条件时,研究者才能利用它们寻找合适大小的观测窗口。由于Z是前定变量,因此在断点处的处理状态不会影响Z的取值,即有Zi(0)=Zi(1)。但是,因为Z需要满足第二个条件,所以当观测窗口足够大时,一定有某些观测的Z与X之间存在相关性,而由于处理组与控制组的X显著不同,使得两组的Z也产生显著差别,从而拒绝原假设HF0:Zi(0)=Zi(1)。因此,只有当选择的观测窗口足够小,使得处理组与控制组的X没有显著差别,即使Z与X存在相关性,也不会影响两组中Z的均值,从而保证Zi(0)=Zi(1)。由此可以进一步推测,在这一足够小的观测窗口中,即使X与结果变量Y存在相关性,由于处理组与控制组的X没有显著差别,这一相关性也不会显著影响两组Y的取值,因而可以认为在该观测窗口内,Yi(0)与Yi(1)的差异仅由处理状态引起,满足1.2.1中的假设2,即Yi(Xi,DiXi))=Yi(Di)。
在实际应用中,选取协变量后,在观测窗口W0内对原假设HF0:Zi(0)=Zi(1)使用1.2.2中的方法进行检验。如果无法拒绝原假设,表明所选的观测窗口能够使用基于局部随机性的RDD框架进行研究;如果拒绝原假设,则表明在该观测窗口内,Zi的取值受到Xi的影响,局部随机性的假设不成立,选定的观测窗口可能过大。正如1.2.1中所述,观测窗口过小会降低估计效力,因此最合适的窗口大小是刚好不能拒绝原假设的临界值(Cattaneo et al., 2022)①。
1.2.5配置变量为离散变量的情况
当配置变量为离散变量时,由于函数μ(x)的连续性不再成立,更适合使用基于局部随机性的RDD框架。为了保证局部随机性框架的两条假设成立,在选择观测窗口时,通常选择最小的观测窗口,即只包含控制组配置变量的最大值和处理组配置变量的最小值(即断点两侧,距离断点最近的观测的取值)。通常而言,当配置变量为离散变量时,不同取值的配置变量都能够对应一定数量的观测样本,而且基于局部随机性的RDD框架在估计时所需的样本量较少,因此即使观测窗口只包含控制组配置变量的最大值和处理组配置变量的最小值,一般也能够满足估计所需的样本量要求①。如果存在一个满足假设的观测窗口,那么最小观测窗口(该窗口本身或该窗口的子集)一定满足假设。选择最小的观测窗口能够尽可能地减少Xi对Yi的影响,保证在观测窗口内Yi(0)与Yi(1)的差异是由处理状态引起的。
在观测窗口内部,如果局部随机性假设成立,即,一个观测值是否受到处理与其配置变量值无关,使得离散型配置变量的不连续跳跃不会影响估计结果。因此,需要按照1.2.4中的方法,使用协变量来检验最小观测窗口是否满足局部随机性。
1.2.6实证应用
综上,在汇报结果时,建议汇报处理效应R、原假设成立概率pF、95%置信区间及观测窗口W0。如果没有对结果变量进行变换,则最好通过散点图等形式表明,在观测窗口内结果变量与配置变量无关;如果对结果变量进行了变换,则需要汇报变换阶数及核函数形式。如果使用了协变量来确定观测窗口,还需要汇报不同观测窗口下对协变量进行费雪推断时原假设成立的概率pF。
此外,可以进行以下四项证伪(falsification)和稳健性(robustness)检验,来检验数据是否符合本方法的基本假设:第一,选择与处理状态无关的协变量,使用费雪推断法或直接画图来说明,在观测窗口内,处理组与控制组的协变量值没有显著差别;第二,检验观测窗口内,被观测对象能否通过操纵自己的配置变量来改变自己的处理状态,通常检验观测窗口内样本点的处理状态(0或1)是否符合成功概率为0.5的伯努利分布,如果不能拒绝符合成功概率为0.5的伯努利分布的原假设,则通过该检验;第三,在观测窗口外,选择虚拟断点和相同宽度的虚拟观测窗口,检验是否有处理效应,预期结果为没有处理效应;第四,选择宽度小于最优观测窗口的多个观测窗口,检验估计结果对观测窗口大小的敏感性。
1.3两种RDD分析框架的对比
表2给出了两种分析框架在理论和应用上的差别。值得注意的是,尽管目前的实证研究较少单独使用基于局部随机性的RDD框架,但是已有文献在稳健性检验中使用这一分析框架来增强结论的可信性。例如,Santoleri et al.(2021)在稳健性检验部分使用了局部随机性的RDD框架,发现与使用基于连续性的RDD框架相比,大部分处理效应的估计值具有相同的显著性。
为了进一步比较两种方法的异同,本文以Nekoei and Weber(2017)的数据为例,分别应用两种分析框架进行了估计。该研究的背景是奥地利通过了一项关于延长失业补助发放周期的政策,在这一政策下,对于年龄在40岁及以上且近10年内工作总时长大于等于6年的失业者,其可以领取失业补助的时长将从30周延长至39周。我们以这一政策为例,首先基于连续性的RDD分析框架,复现了Nekoei and Weber(2017)的研究,表3报告了这一结果。其中,表3(a)及表3(b)的第(2)列复现了Nekoei and Weber(2017)的基准回归结果①,即延长失业补助时间会延长失业者的失业时长,但也会提高其下一份工作的薪酬。表3的其他部分则报告了我们根据Nekoei and Weber(2017)的方法,进一步在给定不同的阶数p和带宽h下的估计结果。在此基础上,我们采用了非参数方法,表4给出了在Stata软件中使用rdrobust命令,给定不同阶数p、使用不同核函数K(x)进行非参估计的结果。
对比表3和表4可以看出,非参数方法确定的带宽值远小于Nekoei and Weber(2017)使用的带宽值。由于更小的带宽使得真正进入回归的样本数变少,所得结果的显著性也有所降低。因此,在实证分析中,往往需要根据数据的具体情况和研究背景来选择合适的带宽,对于样本量不够大的数据样本,使用数据驱动的非参数方法不一定能得到更准确的结果。
在Stata软件中进行基于局部随机性的RDD估计,可以使用rdlocrand命令包①中的rdrandinf命令(Cattaneo et al., 2016a)。表5给出了使用局部随机性的RDD分析框架得到的结果。由于局部随机性的分析框架主要适用于小样本,当选择的观测窗口较大、样本数较多时,现有程序将花费较长的时间处理数据。
表5(a)和(b)的第(1)列使用全样本数据进行估计,从图4可以看出,全样本并不满足局部随机性框架下“结果变量的变化完全由处理状态决定”的假设,因此直接使用全样本数据进行估计得到的结果并不可靠,需要对Yi进行变换。表5(a)和(b)的第(2)及第(3)列对结果变量进行了
的变换,其中第(2)列中φ(Xi)为1阶多项式,第(3)列中φ(Xi)为2阶多项式。如前文所述,对Yi进行多项式变换,形式上与基于连续性的断点分析框架较为相似,即类似于表3(a)和(b)中的第(1)和第(2)列。在估计结果上,变换后的结果也与表3(a)和(b)的第(1)和第(2)列较为接近。
在Nekoei and Weber(2017)的研究中,年龄是一个具体到日的离散变量,因此表5(a)和(b)的第(4)列使用前文所述的对离散变量的处理方法,即选择只包含控制组的最大值和处理组最小值的观测窗口,将两组的均值之差作为估计结果,发现估计结果是负向的,且不显著。图5刻画了观测窗口内的结果变量分布状况,从图5可以看出,在断点两侧,结果变量的取值较为分散,极端值对均值的影响可能会掩盖处理状态对处理组均值的影响。由此可见,基于局部随机性的断点分析框架的两条基本假设对数据本身提出了较高要求,这也制约了这一分析框架的应用范围。
2理论拓展与新的应用场景
在使用RDD方法时,经常会遇到上述一般分析框架无法解决的问题。例如,配置变量有多个、断点有多个(Cattaneo et al., 2020c);抑或,在断点前后,结果变量没有发生跳跃,但结果变量关于配置变量的变化斜率发生弯折等。本部分将介绍利用RDD解决这些场景的前沿理论进展。
2.1多重配置变量
在实证研究中,处理状态可能由多个配置变量共同决定。例如,在研究奖学金对学生未来表现的影响时,获得奖学金的条件是各科成绩都达到优秀。此时,控制组与处理组的分界是由各科成绩共同决定的,断点由点变为连续的边界。假设语文、数学、英语三科都是成绩达80分为优秀(满分为100分),将三科成绩分别设为X1、X2、X3,则在三维坐标系中,边界由三个小平面组成:X1=80,80≤X2≤100,80≤X3≤100, 80≤X1≤100,X2=80,80≤X3≤100,80≤X1≤100,80≤X2≤100,X3=80,即图6中的斜线、浅色和深色部分。
类似于单一配置变量的断点回归设计,在多重配置变量的情形下,研究者仍然关注处理状态对结果变量的影响。设边界B∈Rd,其中Rd表示由d个配置变量组成的d维向量空间,处理组与控制组分别记为Bt和Bc,则对于边界上的点b,处理效应为:
由于对边界上任何一点b,都可以计算出对应的τSRD(b)值,因此,得到的处理效应τSRD(b)是关于b的函数。在实证研究中,Cattaneo et al.(2020c)在Stata软件中开发了rdms命令,可以估计配置变量数量为2个时,不同b的取值下的处理效应,在使用时需输入两个配置变量名,及需要估计的边界上的点的二维坐标值。不过rdms存在一定的局限性:通常情况下,研究者希望得到平均处理效应,但是rdms命令无法得到平均处理效应;此外,rdms命令只能应用于配置变量个数为2的情形①。
在单一配置变量的情形下,可以通过观测值到断点的距离(Xi-c)来进行局部多项式估计,从而得到局部平均处理效应。在多重配置变量的情形下,可以计算各观测点到边界的距离,以距离值进行局部多项式估计,来得到局部平均处理效应。Feigenbaum et al.(2017)将计算观测点到边界距离的方法归纳为以下两种:
(1) 欧几里得距离,即计算到边界的最短直线距离。设观测值Xi∈Rd,则
,其中k表示使观测值由控制组变为处理组(反之亦然)所需的最少的配置变量个数。假设一名学生的成绩分别为76、77、90,则他到边界的欧几里得距离为
;假设一名学生的成绩分别为86、87、90,则他到边界的欧几里得距离为
。该方法的优点是较为简单,但缺点是难以解释距离的直观含义,反事实对照组不明确。
(2) 最小垂直距离,即将每个配置变量到边界距离的绝对值相加。设观测值
,k的含义同上。假设一名学生的成绩分别为76、77、90,则他到边界的最小垂直距离为|76-80|+|77-80|=7;假设一名学生的成绩分别为86、87、90,则他到边界的最小垂直距离为|86-80|=6。该方法可以较为直观地说明距离的含义,如在这一例子中,到边界的距离即为学生改变分组所需的最小总分的变化。
如果各个配置变量的单位不同,例如配置变量分别为某家公司的资产负债率、营业收入、净利润和现金短债比,在使用上述方法计算距离之前,通常还需要在带宽内对配置变量进行标准化,将各个配置变量都调整成断点为0、取值范围为[-1,1] 的连续变量。
计算到边界的距离本质上是将多重维度的配置变量降低到一维① 。因此,除计算距离外,也可以通过降维的方法使多重配置变量变为单一配置变量。Choi and Lee(2017)归纳了三种常用的降维方法:
(1) 构建新的变量。如果配置变量的断点值之间存在相关关系,则可以利用相关关系构建新变量。例如,在一项马萨诸塞州公立大学的奖学金政策中,高中生获得奖学金需满足三个条件:数学和英语成绩至少有一门在260分以上,另一门在250分以上,且在本学区排名达到前25%。Hinnerich and Pettersson-Lidbom(2014)在研究奖学金对学生的影响时,构建了一个新的变量:给定学生的学区和英语成绩,他的数学成绩与能拿到奖学金的数学成绩之间的差值。
(2) 当断点值为固定值时,可以使用标准化后的配置变量的最大值(或最小值)作为新变量。例如,英国证监会要求上市公司在进行并购时,被并购公司与原公司的资产比、被并购公司与原公司的利润比、被并购公司的收购价与原公司市值的比值、被并购公司与原公司的资本比,任意一个达到25%,需提交股东大会表决,Becht et al.(2016)在研究中使用了标准化后的四个配置变量值的最大值M作为配置变量,研究召开股东大会对股票收益率的影响。
(3) 对子样本进行研究。当处理状态由两个配置变量X1≥b1、X2≥b2决定时,可以在X2≥b2和X2这两个子样本中研究X1=b1的断点导致的处理状态变化的影响;同样,也可以在X1≥b1和X1这两个子样本中研究X2=b2的断点带来的影响(Schmieder et al., 2012;Caliendo et al., 2013)。当配置变量较多时,对子样本逐个进行研究可能较为烦琐,这时可以根据研究需要,选择几个子样本进行研究。例如,德国认定受控外国公司(CFC)的四个条件为外国税率低于30%、消极投资所得超过10%、消极投资总额超过80000欧元、德国母公司所有海外子公司的消极投资超过80000欧元,同时满足税率条件和至少一个投资条件即为CFC。Egger and Wamser(2015)按照各公司满足的条件,将全部样本分为24=16组,其中7组为处理组,然后研究了其中几个处理组被认定为CFC后企业固定资产规模的变化。
除了以上方法之外,在特定情境下,研究者也可以使用特殊的降维方法。例如,西方国家选举中,每个选区选出一个议会议席,而控制议会半数以上议席的党派成为多数党,成为多数党这一“处理状态”由n个选区的选举结果,即n个配置变量共同决定。Fiva et al.(2018)假定同一党派在各个选区选举中的得票率具有高度相关性,若某党派差s个议席成为多数党,则直接将选举失败选区中得票率第s高的选区结果作为配置变量。
目前,国内利用多重配置变量进行断点回归分析的研究还比较少。鄢伟波等(2019)在研究中没有使用上文所述的降维方法,而是参照Becker et al.的研究(2013),直接使用线性空间中的多项式函数进行局部多项式估计,该方法的思路如下:
在精确断点回归设计中,若配置变量为n维向量xi,协变量为m维向量zi,断点向量为c0,直接在n维和m维向量空间中,选取带宽h进行线性回归(或使用1.1中的非参数估计方法):
其中,f0和f1是n维向量空间中的k阶多项式,g0和g1是m维向量空间中的k阶多项式,E(z)是协变量在带宽内样本中的均值。
这一方法的优点在于无需对观测值数据进行降维等预处理,但缺点是,该方法实际上估计的是在点xi=c0周围h范围内的处理效应,而非整个边界上的处理效应。因此,在进行多重配置变量的断点回归设计时,本文更推荐采用降维的方法。
多重配置变量RDD的一个常见应用情形是使用地理边界作为断点。在利用地理断点的研究中,边界往往是地图上的地理分界线,如行政边界、河流、山脉等,由于地图上的每个点都可以用二维坐标的经纬度表示,因此类似于二维配置变量的情形。例如,Dell(2010)使用行政边界作为地理断点,以经纬度作为配置变量,研究历史上强迫当地劳动力采矿的制度对经济发展的长期影响;除经纬度外,Dell(2010)还使用到边界的距离作为配置变量。在计算距离时,通常直接使用最短地理距离,即欧几里得距离,许多学者将欧几里得距离作为配置变量进行了研究。如Young et al.(2016)以美国的州边界作为地理断点,以到边界距离作为配置变量,研究不同州税率差距对富豪在各州之间迁居的影响;Rozenas et al.(2017)以苏联行政边界作为地理断点,研究了历史政策对当今政党支持率的影响;Giua(2017)利用地区行政边界估计了欧盟区域政策对就业的影响。也有学者基于中国的行政边界,利用地理断点进行了一系列研究(黄新飞等,2014;Lu et al., 2019;田文佳等,2019)。除行政边界外,山脉和河流等自然边界也可以作为地理断点。例如,许多研究使用了我国特有的“秦岭-淮河”南北方分界线作为地理断点(Chen et al., 2013;晋晶等,2020;Ito and Zhang,2020;杨金玉,2021),或者使用澜沧江作为地理断点(李楠和林友宏,2016)。
2.2多重断点
在多重断点的情形下,配置变量只有一个,但断点值有多个。例如,Cerqua and Pellegrini(2014)的研究中,意大利对企业的补贴方式为:政府给每个地区分配补贴配额,并对每个提交申请的企业进行综合评分,按照得分从高到低向企业分配定额补贴,直至所在地区的补贴用尽。因此,在每个地区内,都有受补贴和不受补贴两类企业,但划分这两类企业的得分值因地区而异,这种情形被称为“非累积型多重断点”。再如,席鹏辉和梁若冰(2015)的研究中,我国的空气质量指数被50、100、150、200、300等断点分为若干等级,前一个断点的处理效应可能会累积到后一个断点的处理效应上,这种情形被称为“累积型多重断点”。
2.2.1非累积型多重断点
非累积型多重断点指的是,处理状态D只有0与1这两个取值,但样本被分为n组,在不同组中,断点值Ci不相同,即Di=Ⅱ(Xi≥Ci),其中Ⅱ表示若括号内不等式成立则取1,否则取0;Ci表示样本所属组的断点值。此时可以计算汇总(Pooled)的平均处理效应(Cattaneo et al., 2016b):
假设各组的断点组成集合C,对于任意断点c∈C,首先,在每个组内,计算处理效应:
Cattaneo et al.(2020c)在Stata软件中开发了rdmc命令,用于非累积型多重断点的估计。非累积型多重断点已经广泛应用于教育(Francis-Tan and Tannuri-Pianto, 2018;Zimmerman, 2019;Aguirre and Matta, 2021)、商业分析(Liu et al., 2019)、医疗(Fort et al., 2020)等领域的研究中。
在更深入的研究中,Cattaneo et al.(2021)拓展了非累积型多重断点的应用场景。当不同断点组的样本在处理前或处理后的回归函数满足“平行性”时,可以借鉴双重差分法的思想,估计远离断点样本的平均处理效应。如图7所示,若样本存在两组断点c1和c2,各个样本组的回归函数μd,c(x)是连续的,μd,c(x)=E[Yi(d)|Xi=x,Ci=c],其中d=0,1表示处理状态,c=c1,c2。待估计的c1样本组中配置变量取值为
处的平均处理效应记为
,即
。当
时,可以观测到c1样本组的结果变量期望位于e点。X时,两组样本都没有受到处理,如果μ0,c1(x)和μ0,c2(x)满足平行性,则有|ab|=|cd|=|fg|,从而得到e点的反事实f点,由于a,b,e,g四点都可被观测到,从而
。
同理,如图8所示,X≥c2时,如果μ1,c1(x)和μ1,c2(x)满足平行性,对于c2样本组中远离断点的控制组样本
(结果变量的期望位于图8中g点),可得到g点的反事实f点,进而计算出该点样本的平均处理效应
|ab|。
从图7和图8中可以看出,Cattaneo et al.(2021)提出的估计方法需要对不同断点组样本处理前或处理后回归函数的平行性进行检验,类似于双重差分法的平行趋势检验。通常采用局部多项式回归进行检验,方法如下:
以处理前平行性为例,选取X的样本,进行局部多项式回归:
其中,rp(Xi)为Xi的p阶多项式。如果无法拒绝δ=0的原假设,则可以认为满足处理前的平行性。
2.2.2累积型多重断点
累积性多重断点是指,处理状态有n个取值,被n-1个断点分隔。在该情形下,可以直接对n-1个断点进行n-1次断点回归设计,得到n-1个处理效应值。例如,图9中,共有X=4、X=8、X=11、X=15、X=19五个断点,将样本分为六组,每个断点处都有对应的处理效应,在研究中往往需要逐个进行分析。
值得注意的是,在累积型多重断点的情形下,一个观测值可能既作为前一个断点回归设计的处理组,又作为后一个断点回归设计的控制组,使得相邻两个断点的处理效应具有累积性。在实证研究中,可以通过缩小各断点回归的带宽,使得相邻两个断点回归设计的样本不发生重叠,以消除估计结果的累积性,保证各个断点回归分析估计结果的独立性。
前文所述的Stata软件中的rdms命令(Cattaneo et al.,2020c)也可以用于累积型多重断点的估计,在使用时,只输入一个配置变量及断点向量,即可估计各个断点处的处理效应。累积型多重断点在教育(Smith et al., 2017)、劳动(Dube et al., 2019)、住房(Eerola and Lyytikäinen, 2021)、金融(Chen et al., 2019)等领域的实证研究中也已经得到了较为广泛的应用。
2.3拐点回归设计(Regression Kink Design, RKD)
在断点回归设计(RDD)中,我们主要利用结果变量和处理状态D在断点c处的跳跃进行因果推断,但是当两者在断点c处是连续变量时,RDD就难以识别因果效应,这种问题在研究现实问题时经常会出现,导致无法使用RDD来估计因果效应。在这种情况下,如果两者在断点c处存在拐点/弯折(Kink),即斜率存在变化,则可以通过与RDD类似的思路,利用拐点来识别因果效应,这一方法就是拐点回归设计(Regression Kink Design, RKD)。例如,在美国的一项政策中,失业救济金水平是关于个体申领失业救济金前一年收入的函数,该政策并不具备使用RDD所需的变量在断点处的跳跃,但是根据失业救济金总额的公式,个体可以领取的失业救济金总额在断点处存在斜率的变化(即存在弯折),因此研究者可以使用RKD来研究失业救济金水平对失业持续时间的影响(Card et al., 2015a)。
在拐点回归设计(RKD)中,结果变量和处理状态D在断点c处可以存在跳跃,也可以是连续的,但要求它们相对于配置变量X的导数在断点c处存在跳跃,从而RKD就可以利用断点c处的导数变化(即斜率变化)来进行因果识别。图10提供了RKD的基本原理示意图。简言之,RKD就是将结果变量在断点c处的弯折归因于处理状态D在断点c处的弯折,相当于结果变量和处理状态D相对于配置变量X导数的断点回归设计。
在RKD中,处理状态D可以是二元变量(Dong,2018),也可以是关于配置变量X的连续函数(Card et al., 2015a),后者具有更一般化的形式,因此在本文中,我们主要介绍当处理状态D为关于配置变量X的连续函数时的RKD情况。
我们首先考虑精确拐点回归设计(Sharp RKD):记
,其中,Y是结果变量,D是处理状态,X是配置变量,Z是其他影响结果变量的未观测因素,d(X)是处理状态D关于配置变量X的已知的连续函数,函数y(D,X,Z)是潜在结果方程。拐点回归设计(RKD)需要满足以下几个基本假设:
与基于连续性的RDD分析框架类似,在精确拐点回归设计中也可以采用局部多项式进行估计。给定带宽h、多项式阶数p以及核函数K(x),精确RKD的局部多项式估计主要也包含以下三个步骤:
在实证研究中,观测到的处理状态分配规则可能是由配置变量和其他未观测因素共同决定的,因此,与模糊断点设计(Fuzzy RDD)类似,也存在模糊拐点设计(Fuzzy RKD)。Card et al.(2015a)在精确RKD假设的基础上,引入了单调性假设,证明通过拐点可以识别局部平均处理效应。
由于在模糊RKD中,处理状态的分配规则d(·)不是已知确定的,因此需要估计在断点c两侧分配函数斜率的变化,即需要进一步在断点c两侧分别求解以下两个最优化问题:
Dong(2018)讨论了当处理状态D为二元变量时对处理效应的识别,Card et al.(2015a)则讨论了处理状态D是关于配置变量X的连续函数时的情况,在这两篇文章的基础上,Chen et al.(2020)和Chiang and Sasaki(2019)分别探讨了当处理状态D为二元变量和连续时对因果的分位数效应(Quantile-wise effects)的识别。RKD模型的进一步拓展包括当断点未知时的RKD(Hansen et al., 2017)以及当断点是关于协变量的函数时的情况(Yang et al., 2021)。
在RDD估计中可能存在由于模型错误设定导致的偏差(Calonico et al., 2014),与之类似,RKD估计中也可能出现这一问题。在RKD的诸多应用场景中,结果变量和配置变量之间普遍存在非线性关系,而这一非线性关系可能导致基于常规标准误的RKD估计是有偏的(Ando, 2017),从而估计值在统计意义上的显著性不可信(Ganong and Jäger, 2018)。Ganong and Jger(2018)提出了一种置换检验(Permutation Test)方法来处理这一模型错误设定问题,补充现有的RKD和RDD推断方法。研究者可以通过分别对存在和不存在政策弯折的地区进行安慰剂检验,构造安慰剂估计值的分布,并利用这一分布来衡量基准模型系数在统计意义上的显著性(Ganong and Jäger, 2018),对RKD估计进行稳健性检验。
在利用Stata软件进行RKD估计时,首先可以通过绘制散点图及拟合线来确认被干预可能性的斜率是否在拐点处发生变化、结果变量关于配置变量的弯折是否在同一点发生。在此基础上,可以使用rdrobust命令进行RKD估计,还可以通过调整rdrobust可选项中的scalepar来指定感兴趣的参数的调整项。其他关于假设的检验和稳健性检验与RDD估计基本类似。
在现实生活中,一些政策设计和数据结构虽然在断点处不存在跳跃,但正如我们在本部分开头提到的失业救济金政策(Card et al., 2015a),这些数据很多都在断点处存在弯折。因此,自被提出以来,拐点回归设计(RKD)已被应用于经济学实证研究的诸多领域,例如公共债务与经济增长(Yang and Su, 2018;Bentour, 2021)、税收(Dobridge, 2015;Engström et al., 2015;Jacob, 2016;Paetzold, 2019)、社会保险(Gelber et al., 2017;Johnston, 2021;Lurie et al., 2021)、失业救济金(Card et al., 2015b;Landais, 2015;Kyyrä and Pesola, 2020)、医疗保险(Menezes-Filho and Politi, 2020)、养老金(Messacar, 2018)、教育(Manoli and Turner, 2018;Marx and Turner, 2018;Sohn and Lee, 2019;Eng and Matsudaira, 2021)、IPO定价(Busaba and Restrepo, 2022)、处方药需求的价格敏感性(Simonsen et al., 2016)等等。
3总结与展望
RDD方法在各种因果推断方法中最接近随机实验,能够得出更可靠的结论(Shadish et al., 2002;Lee and Lemieux, 2010;Athey and Imbens, 2017),因此近年来在经济学实证研究中得到了广泛应用。RDD方法最常用的估计框架是基于连续性的分析框架,另一个分析框架是基于局部随机性的分析框架。在使用两种框架时,需要特别注意所使用的数据能否支持所用到的RDD方法的基本假设,使断点两侧的观测样本满足“可比性”,否则得到的估计结果将缺乏可信性。
在两种估计框架的基础上,一系列前沿理论已经将多重配置变量、多重断点、拐点回归等特殊场景纳入了RDD分析框架。除本文给出的这三种特殊场景外,计量经济学界仍在不断探索RDD方法的新应用场景,如模糊断点回归下的外部有效性(Bertanha and Imbens, 2020)、离散配置变量(
and Rothe, 2018)、结果变量取值不同时的异质性处理效应(Shen and Zhang, 2016)等,为拓展实证研究的可行性边界提供理论支撑。
在RDD理论发展的基础上,研究者还在实证分析中探索将断点回归方法与其他因果识别方法结合使用,其中较为常见的是RDD-DID法(Fremigacci, 2010;Bilotkach et al., 2019;Fisher and Zhu, 2019;Barnes et al., 2020;Brodeur et al., 2021)及RKD-DID法(Landais, 2015;Messacar, 2018),将断点回归法与双重差分法结合。例如,Fisher and Zhu(2019)利用RDD-DID法探究了改变财务激励对重新合伙的影响;Messacar(2018)将拐点回归模型扩展为双重差分形式,利用RKD-DID研究了雇主养老金缴费对工人退休储蓄和总财富积累的影响。RDD-DID法也在国内的研究中得到应用,如梁平汉等(2020)研究了无纸化申报改革对企业出口行为的影响。
目前,国内部分实证研究在使用RDD方法时,存在缺乏细致讨论识别假设能否成立,以及带宽选取方式误用等问题,导致由此得出的结论缺乏可靠性,从而进行科学的政策评估,形成高质量的学术论文或研究报告,讲好中国故事、服务科学决策。
本文转载自微信公众号“经济学报”。
转自:“刘西川阅读写作课”微信公众号
如有侵权,请联系本站删除!