投稿问答最小化  关闭

万维书刊APP下载

【香樟推文2919】ES,启动!——事件研究法入门指南

2023/8/11 10:33:46  阅读:37 发布者:

原文信息:Miller, Douglas L. 2023. "An Introductory Guide to Event Study Models." Journal of Economic Perspectives, 37 (2): 203-30.

事件研究法的参数需要限制吗?

删除-1期系数有什么影响?

事件研究法的结果应该如何报告?

把从未受到处理的个体作为控制组会有什么问题?

事件存在不同的强度,或者个体经历多个事件该如何处理?

事件研究法作为当下流行的计量经济学工具,运用广泛。也许您也会和初学计量的推文作者一样在运用事件研究法时遇到各种细节问题,今天推送的事件研究法入门指南(Miller2023)也许能帮助您处理一些运用事件研究法事时面临的问题。

01

引言

1)事件研究模型(event study model)是一种强大的计量经济学工具,用于估计动态处理效应。它最吸引人的功能之一是创建了一个简洁的结果图形。

2)经济学中的事件研究模型始于金融应用:对早期金融事件研究的研究。

3)近年来,事件研究模型越来越受欢迎。通常,事件研究模型是在简约式的“处理效应”中估计的。事件研究模型的应用范围广泛,从工作调动到学校财政改革,再到贸易自由化,都有相关的应用。

4CurrieKlevenZwiers2020年,图1)总结了美国国家经济研究局(1980-2018年)和发表在顶级经济学期刊上(2004-2019年)的工作论文中使用事件研究的发展趋势。他们记录了使用事件研究方法的论文在2012年快速增加。

1

5JacobsonLaLonde Sullivan1993)在劳动经济学中最早尝试使用事件研究法,图2估计了失业后的收入损失,x轴以事件来衡量,零时事件被称为“Treatment”, y轴是每个时期相对于基准期的比较收入。理想情况下,事件发生前的估计线段是无趋势的,趋势表明事件可能有预期的,或者有其他因素在发挥作用。

事件研究模型的两个关键要素

02

2.1 估计方程

系数解释:

yit:结果变量

γj:事件系数,事后的系数能显示了事件处理的动态效果,事前的系数能提供安慰剂检验。

Dit-j:事件时间的指示变量

j :事件发生在观测的日历时间之前的第j个时段

αi和δt:双向固定效应。

Xit:其他潜在影响yit的因素.

2.2数据结构

两个维度:

1)是否有“从未经历处理”的单位?

2)不同单位的受到处理的事件日期是否存在较大差异?

1

根据两种类型可以分为表1展示的四种类型:

N/A:无法将事件与日历时间内发生的其他混杂因素分开,因此无法识别处理效果。

DiD-type:从未受到处理的单位能更好识别跨日历时间的反事实结果变化。

Timing-based:所有单元皆被处理但事件时间不相同

Hybrid:同时包括“处理单元和控制单元的比较”和“事件时间”两种变化。

如果事件研究类型为Hybrid/Timing-base类型,应该让读者了解样本中事件日期的变化。

3展示了一个Timing-base的数据结构。最早接受处理的单位的事件日期在第5期,最晚的事件日期是第15期,此时所有单位都已接受处理。右侧的图表显示了相同的信息,这些信息以事件日期为单位。

4展示了一个Hybrid的数据结构。一半的单位从未得到处理。在接受处理的个体中,有一个早期区块,事件日期为5-7,还有一个后期区块,事件时间为10-12

3

4

2.3 参数限制

参数限制的原因:

事件研究模型包含了很多参数估计。不仅包括每个时段内的处理效应参数γ,还有个体和时间固定效应参数α和δ。如果包括额外的控制变量,就可能产生更多的参数。事件时间虚拟变量与具有个体(例如,州这一水平)和时间(例如,日历年)固定效应的组合存在多重共线性。

因此需要对这些参数有一些限制。可以将这些限制分为三类(可能会有潜在重叠):

(1)面板固定效应参数的标准限制;

(2)有助于定义想要的反事实的限制;

(3)解决多重共线性问题的潜在附加限制。

在一个事件研究模型中,事件-时间系数是主要的系数,参数估计了处理后的效应。估计这种效应需要参照一个具体的反事实进行定义。

1)最常见的方法是选择一个特定的事前时间,并将相应的系数归一化,使平均值为零。例如,通常可以选择设置-1期的系数为0

2)对处理个体和控制个体进行匹配。假设未被处理的个体可以作为接受处理的个体的对照组。但省略个体固定效应的参数要设置为0

多重共线性问题在Timing-based”的数据结构中尤其普遍,在该结构中,所有个体都被处理,但它们的事件日期并不相同。在这个数据结构中,事件-时间虚拟变量、个体虚拟变量和日历时间虚拟变量都将具有多重共线性,因此需要额外的限制才能继续进行。

直接添加特定的时间趋势控制时,会面临更严重多重共线性问题。如何实现附加的参数限制?

1)一种常见的方法是让软件(如Stata)自动选择一些共线性变量,但这可能存在未知与潜在的问题。应该避免使用这种方法,建议仔细检查回归输出,以确保没有任何变量被意外删除。

2)另一种常见的方法是通过将尾部的几个处理变量γ分组为相等的组来汇集一些数据。在传统的事件研究方程中,这将意味着构建一个“end-cap”虚拟变量,表明“事件将在未来m期或更多的时间段发生”。这种方法有时是可以的,但如果存在不受控制的情况,比如存在潜在的趋势,或者如果处理效应本身有趋势,就可能会有问题。

需要施加额外的限制来识别模型时,应该记住以下几点:

1)估计的处理效应系数γ直接依赖于所施加的限制。

2)至少部分限制是不可检验的。

3)希望这些限制尽可能无争议和“明显正确”。

4)由于某些事件研究数据结构的“多重共线性”的性质,估计可能会出乎意料地对这些额外的限制很敏感。

5Small bits of noise以意想不到的方式通过模型进行传播。这可以用来证明在最低限度之外应当使用额外的限制。

事件研究应该清楚地报告:

1)每组虚拟变量、事件研究系数的类别数量,包括总的以及实际估计中的类别数据。

2)直接或通过删除项对估计施加的约束。

3)直接评估数据结构中的变化(例如,通过计算相关比例中X矩阵的秩)。

03

事件研究规范选择

3.1 事件前参考期的选择

删除-1期?还需要考虑更多:

选择事前参考期的常见做法是“处理前1期”归一化,使系数在事件发生之前的时间段内设为零。在前面提出的传统事件研究方程中,这是通过删除-1事件时间虚拟变量来实现的。

但是,与其盲目地选择事前时间进行标准化,最好的做法是判断什么是合理的事前窗口期(pre-event window),这需要:

1)权衡“使事前窗口成为合适的反事实基准”和“越多的数据事前窗口的估计越精确”。

2)可以加入所有的事件虚拟变量

3)使系数在事前窗口期内的平均值为零。

研究人员应该选择多长时间的事件前窗口期?

这是没有硬性规定的。只选择了一个事件前的时间段,可能会带来额外的统计误差。而事件前窗口期扩展到更远的时候,这些时段会变得不太适合作为事件的反事实参考。将多个事件时间归一化为零,而不仅仅是事件发生前的时间段,对规范的事件研究图表有两个影响。(参考图5

1)首先选择一个较长的时间段会使整个系数在保持相同形状的同时有向上或向下移动的趋势。

2)当将一个更长的时期归一化到零时,标准误可以明显地更小。原因是使用单一的时期时候,数据噪音本身就会产生额外的不确定性,这往往会使标准误更大。

5

3.2 不限于处理效应估计

事件研究模型的结果应该如何更好地报告?

事件研究模型能展示处理效应的估计结果(这体系为一组数字)。但通过为每种个体类型分别报告实际和反事实平均结果来使之与原始数据更加接近是一种更好的做法。这些图表将根据所提供的信息相互补充。事件研究允许比较处理和未被处理的个体时,该结果将允许读者评估在处理状态不变的期间,平行趋势是否存在。

6展示了在原始数据旁边显示反事实的图示。下图中的数据结构是DID数据结构,有两种单元类型:(1)共享一个事件日期的处理组,以及(2)控制组。第一个图表显示了估计的事件研究处理效应;其中真实的处理效应叠加在绿色空心点中。第二张图显示了处理组(蓝色)和对照组(红色)的原始平均值,还显示了该组(橙色空心点)的反事实未处理预测值。反事实值是通过从治疗组的原始平均值中减去估计的事件研究效应来计算的。图7显示了Timing-based的数据结构的类似图表。有两个处理组,第一组的事件日期为8,第二组的事件时间为12

6

7

3.3 控制组的选择:选择与再加权

把从未受到处理的个体作为控制组会有什么问题?

Jacobson, LaLonde, and Sullivan (1993)为例子。在1993年的论文中,该事件是“第一次观察到的裁员”;因此,从未被处理过的个体是从未经历过裁员的个体。然而,随后的裁员只能发生在处理组中。

1)与对照组相比,处理组的未来收入存在机制上的潜在差异。

2)对照组可能在不可观测到的技能、劳动力依恋以及工作匹配质量方面存在自选择。

在这种情况下,那些从未被解雇的个体可能不会为接受处理的个体提供一个很好的反事实证据。

处理方法:

1)排除控制组里面的子集,例如控制组经历了特殊的冲击所以他们在某种程度上不具有代表性。又或者例如,如果正在使用一个城市年份面板,并且处理过的城市都是中型或大型的,那么可以考虑将小城市排除在使用的控制组之外。

2)对于事件发生之前的时间段,可以检验控制组个体和处理组个体之间的平行趋势。

3)可以使用协变量多维度考察处理个体和控制个体之间的相似程度。

4)在估计之前使用重新加权(reweighting)或匹配过程(matching procedure)。重新加权法将对未处理的个体施加不同的权重,利用协变量与处理的个体匹配。另一种选择是为每个处理过的个体选择一个或多个从未处理过的“匹配项”。这些匹配通常是基于可观测的协变量,这可能包括一些事前结果的,然后再结合为每个控制个体分配一个安慰事件时间(pseudo-event time)的方法,以努力呈现一个更可信的反事实结果路径。

5)如果一个事件研究具有Hybrid数据结构,可以选择剔除未被处理组的数据。

这种方法将基于这样一种信念:即“在那些接受处理的个体中,处理的时间是随机的”,这会比“控制个体能体现反事实的时间变化”假设更可信。另一方面,使用从未受到处理的个体将拥有更多的数据,这通常会提高统计的势,并且只需要更少的参数限制来识别模型。这两种考虑因素之间的权衡将根据具体情况而有所不同。无论选择什么方法来处理从未处理过的个体,显示结果的敏感性都是有用的。

3.4 事件窗口的选择

如何选择一个合适的事件窗口?

1)事件窗口尽可能长的优点:可以看到动态处理效应的长期变化,对于事件前系数,长的事件窗口更好检验其中问题。

2)理想情况下,时间系数都是从同一组个体中估计出来。例如,在Jacobson, LaLonde, and Sullivan (1993)中,事件(裁员)发生在1980年至1986年之间,并观察了1974-1986年期间的结果(收入)数据。图1中“自裁员以来的零年”的事件时间系数是基于所有裁员的时间。但是,“裁员后5年”的系数只能对发生在1980年或1981年的裁员进行估计(如1982年发生裁员的事件中,同一组个体的系数(端点为1986年)最多为裁员后四年)。这意味着,裁员后的事件-时间系数(选择5为窗口端点)是根据不同的个体来估计的。如果早期或晚期裁员个体有系统的不同,这可能会对系数的解释力造成挑战。即使没有系统的差异,也会失去统计的势,因为更少的个体识别了距离事件本身更远的系数。

(3) 因此如何合理地选择事件窗口的端点,以便从一组平衡的个体中中识别出大部分或所有的系数,是一个值得考虑的问题。

假设事件日期的跨度在一个10年的窗口内,在该窗口的两边都有至少20年的数据。那么,就很容易关注20年内的事件时间端点,并使每个事件时间系数有一组完全平衡的个体。但即使在这种情况下,如果你观察到有趣的动态处理效应在前五年的处理,它可能有意义限制事件窗口是八到十年这一区间。

如果数据设置不允许直接解决问题,那么需要自己进行判断来解决这个问题。在这种情况下,稳健性检验将会很有用(例如一个更宽的事件窗口)。

最后,对于事件研究的读者来说,了解可用来识别事件系数的个体数量的平衡或不平衡程度是很重要的。这可以按事件时间j显示个体的数量在正文中讨论,也可以放在附录里面。

3.5 特别注意端点

事件窗口的端点如何处理,归并的利弊?

在事件研究中,通常会在事件窗口前或后有某些个体的数据。在传统事件研究回归方程的符号中,这些数据将在j≤−mjn的数据集中。如何解决这个问题?

1)创建和包含尽可能多的事件虚拟变量。通过直接估计每个事件时间的系数来解决这个问题。当数据结构的处理个体和未被处理个体都在日历时间内达到平衡时,这种方法是自然和合适的。

2)在传统的事件研究方程中创建“end-cap”变量。例如,之前和包含“pre”端点的数据可以给出一个公共的虚拟变量。类似地,“post”端点之后的数据点也可以共享一个公共的虚拟变量。这个选择是最常见的一个方法,而且通常它是一个很好的选择。

Schmidheiny and Siegloch (2023)推荐了这种方法(他们称之为“归并(binning)”)。创建“end-cap”的主要风险来自于趋势的反事实和处理效应。如果处理效应有可能随着事件时间的推移而改变,可能难以处理包含“post-end-cap”的数据。

3)一种可能的方法是删除在窗口之外的事件时间里的观察结果。该选项保持规范简单,并在的分析样本中创建了事件时间的平衡数据。

数据的丢失可能会削弱统计的势。当只使用曾经处理过的个体时,还需要考虑另一个因素:使用此数据结构,可以平衡日历时间或事件时间,但不能两者都平衡。如果将样本限制在事件时间上的平衡,则会造成日历时间上的不平衡。

最后一个选择是不包括这些离基期很远的观测值。通过这种方式,遥远的观察结果被集中在一起,作为事件没有发生时的参考组的一部分。

4)当呈现事件时间系数图时,端点将捕获与“内部”项不同的平均值,这有时似乎与图的其他部分有点偏移。这可能会分散读者对更接近事件时间零点的注意力。另一方面,在图中包含这些端点可以提供模型的全貌;事实上,包括它们有时可以帮助诊断与规范数据有关的问题。最佳的做法通常应该是绘制端点系数,并在图中指出,这些估计与其他事件研究系数不同。总的来说,需要明确地决定如何处理端点,并告知读者。

3.6 汇集事件时间以获得统计的势

把事件系数合并汇集的利与弊?

多数事件研究模型对每个主要的系数都有相当宽的置信区间。重新获得更高统计的势的一个策略是对两个或多个相邻的事件时间虚拟变量合并在一起的模型进行估计,然后将这些合并的变量纳入模型中。

这种方法在灵活性和统计的势之间谋求平衡。这种做法可能会掩盖实证结果的特征,最好同时显示未汇集系数模型的结果作为稳健性检验的步骤。

有多种方法来汇集事件时间。

例如,可以通过限制模型使其在例如周期12、周期34中的系数相同,Goodman-Bacon2018)使用汇集事件时间虚拟变量以表格格式来呈现结果。

一个更复杂的方法是将事件研究系数限制在点之间的样条函数(spline function)上,但允许有一个灵活的函数形式(在分段线性样条曲线中,事件研究系数被迫位于一组连通的直线上)。例如,Bailey等人(2020年)和Rothstein, and Schanzenbach (2018)使用样条限制来提高统计的势。然而,这种方法带来了一些错误描述处理效应模型的风险,特别是如果所实施的模型不够灵活便不能反映现实的情况。当使用样条时,需要允许样条从预处理到处理后过渡到样条的跳跃或中断。

8左上角面板显示了一个标准事件研究模型,每个事件时间有一个参数。蓝点显示估计的系数,红点显示真实的治疗效果。右上角的面板将事件研究系数进行两个时期的汇集。左下角面板三个时期汇集的组,右下角面板则四个时期汇集的组合。

8

事件研究的趋势问题

04

趋势可以以两种不同的方式造成问题。

1)就处理个体类型的未处理的潜在结果而言,处理个体类型可能与未处理类型存在不同的趋势,这可能会混淆估计的处理效应。

2)处理效应本身可能在处理后的时间上呈变化趋势。第二种可能性对于事件研究模型来说并不一定是一个问题:毕竟,这些模型的重点是考虑到处理效应随时间的变化而变化的。但是趋势的处理效应可能会对某些估计造成问题。

4.1 以事前系数诊断趋势

(1)估计事前项可作为诊断趋势的工具适合哪种类型数据:

这通常是通过检查事前系数图来非正式地完成的。该工具最适合于使用DID模型或Hybrid数据结构,其中包括从未处理过的个体。如果使用的是一个没有控制个体的基于Timing-based的数据结构,则需要考虑另一个问题。在这种情况下,BorusyakJaravelSpiess2022)表明,由于事件时间、日历时间和个体固定效应存在多重共线性,因此不可能在处理效应(或预处理系数)中确定线性趋势。在这种情况下,最好的方法就是寻找非线性的事前趋势。

(2) Timing-based结构的数据如何检验事前趋势:

对于这种数据结构,建议将一个额外的预处理系数设置为零。这一步施加了一个零的预趋势,并允许对其他预处理系数进行可视化或统计检验来检查是否存在非线性预趋势。Schmidheiny and Siegloch (2023)认为,使用end-cap可以在Timing-based的数据结构中识别当前时间系数。

3)估计事前项作为诊断趋势的潜在问题与解决方案:

如果事前处理的时间太少,可能很难区分实际的事情趋势和统计噪声。这里的一个简单的额外步骤是添加更多的事前处理周期,并进一步延长到事件时间。

Dobkin等人(2018)在显示事件研究系数的参数模型中绘制了线性事前趋势。使用事前趋势作为诊断工具会造成一些潜在问题。Roth2022)指出,“将无关紧要的事前趋势舍入为零”的广泛的非正式做法可能会导致“事前偏差(pre-test bias)”。即使是无法通过视觉或统计检测到的轻微的事前趋势,仍然会影响估计的事后效应。Roth认为,如果对趋势的函数形式有信心(例如,趋势在时间上是线性的),应该始终计划来控制趋势,无论是否存在强烈明显的前趋势。他还提出了基于Hansen, and Shapiro (2019) Rambachan and Roth (2023)的趋势控制方法,这将允许研究在对趋势的函数形式较弱的假设下进行。

Sun and Abraham (2021)研究了由具有不同处理效应的不同个体类型引起错误假设的案例——例如,如果那些在日历时间内较早接受处理的个体比那些在日历时间内较晚接受处理的个体有更大的处理效应。例如,假设在 Jacobson, LaLonde, and Sullivan (1993)中,样本早期(1980-1982)面临裁员的个人比样本后期(1983-1986)面临裁员的个人影响更大。这种处理效应的差异可能导致估计的事件前系数出现明显的趋势。在这种情况下,事前趋势的出现表明模型具有问题。

De HaultfœuilleDHaultfœuille2022)提出了替代的事情趋势估计量,它们对具有不同处理效应的不同个体类型具有稳健性。

4.2 控制特定单位趋势

1)诊断趋势情况的另外一种方法:

除了控制事前趋势,还可以控制一个特定个体的趋势,包括与个体(例如州)虚拟变量相互的(连续)时间变量。如果事前趋势反映了趋势的遗漏变量,可能会使处理的主要估计产生偏误,这是合适的。控制特定个体的趋势旨在消除这种省略的变量偏误。

文章附录展示了不同数据结构的数据添加交互项的情况,参考图A.11-A.15

2)使用事前趋势作为诊断和控制特定个体的趋势之间的主要权衡:

首先,控制个体趋势会改变事件研究法基于反事实的思路。

其次,反事实控制了这些趋势,事前趋势在结构上看起来应该是平的。因此,失去了事前趋势在基本模型中提供的基本证伪检验能力。

3)增加个体趋势控制也可能与事件研究中“太多的变量”和“严重多重共线性”的挑战产生相互作用。

个体特定的时间趋势项将与个体虚拟变量、时间虚拟变量和事件时间变量存在多重共线性。这意味着有必要再添加(至少)一个额外的参数限制。

让软件通过单独删除一个变量来解决共线性问题是轻率的,因为它删除的内容可能会破坏结果估计的解释力。选择适用哪种限制遵循与前文相同的原则:附加的限制是不可检验的,但趋势项上估计系数将受到施加限制的影响,所以希望它尽可能“明显正确”。

额外限制应用于事件研究系数,这样不会破坏估计中面板固定效应的控制。一个常见的选择使两个事件系数相等。趋势估计将在两个事件系数相等背景下进行估计,但处理效应系数估计可能会由于施加这种限制而发生“转向”。

4.3 趋势与事前趋势

如果处理效应有上升趋势?

假设事件研究方程中,处理效应随着事件时间的增加而增加:然后,对特定趋势的估计可能存在事前趋势和处理效应趋势。这反过来又会使估计的事件研究系数产生偏差。如果参数限制包括事后项,例如post-event end cap,则可能会发生此问题。post-event end cap强制所有估计的当前时间效应都应该相同。如果趋势存在,这可能会导致问题。极端情况是DID模型,它限制所有事件后处理效应是相同的。

解决方案:

1)防止这一问题的一个选择是只关注控制“前趋势”。然而,这可能需要通过自定义编程来实现。

2)另一种选择是建模事件研究项,这样个体特定的时间趋势就不会被有趋势的处理效应混淆。例如,可以通过包括所有的事后事件时间虚拟变量,并且没有 post end cap,来删除对事后处理的事件研究参数的所有限制。这一步将确保仅根据事件发生前的数据来估计趋势系数。

4.4 控制趋势的建议

1)不要让事后的参数限制影响估计的趋势,除非非常确信处理效应不是在这个范围内的趋势。

2) 如果额外参数限制的形式是使两个事件系数相等,考虑将这些系数间隔得更远。因为如果两个系数更接近,它们之间的统计“噪声”的影响会更大。作为一种替代方法,可以重点限制事件研究的参数,允许在不同个体之间进行更多的平均。

考虑上述因素的一个限制——对于DID模型和Hybrid数据结构——将“参考期”事件研究系数的趋势限制为零。这种方法的优点是平均了几个系数,并减少任何一个或两个噪声的影响,还尊重了在标准化限制中体现参考期的概念,并提供了一个自然的反事实解释:“与参考期的水平和趋势相比,以及与控制个体的日历时间变化相比,预期结果是什么?”

3)如果使用Timing-based的数据结构,控制趋势可能会产生严重问题。添加线性趋势控制(以及所需的额外参数限制)可以在估计的事件研究系数中引入二次趋势,这是因为事件虚拟变量与模型中的其他变量共线。

要对趋势控制和Timing-based的数据结构的结合格外谨慎。与一般做法相比,有一种方法通常可以简化对趋势的调整:关注单位类型的趋势,而不是单位特定的趋势。也就是说,可以为共享一个事件日期的每一组单位设计一个共享的趋势参数。

05

事件研究法的统计推断

5.1 聚类稳健推断

事件研究法为什么要聚类?如何聚类?

为何聚类:

对于事件研究模型,目前的做法主要是计算个体(i-level units)的聚类稳健标准误,事件研究中的关键右侧变量(事件研究法方程等式的右端)具有一定程度的自相关性,事件研究模型中个体的误差项在时间维度上存在正自相关,所以需要在个体层面进行聚类。

如何聚类:

1)聚类一般的经验法则是:如果个体之间在一个聚类(cluster)存在相关性时,建议在这个聚类的维度上进行聚类。事件存在跨个体聚类影响的,那么这就需要在更高的层次上进行聚类。例如,如果数据集是一组个体,但事件是一个州级的政策变化,那么可能要在州层面进行聚类。

2)标准的聚类稳健方法只有在聚类的数量“足够大”时才会提供准确的标准误,不对于过“足够大”的数量并没有硬性规定。经验法则一般是4250个聚类。但在某些情况下,这是不够的,而在其他情况下,一个较小的数字就足够了。当聚类太少时,传统的聚类稳健方法可能会被过度拒绝。

3)当聚类的规模不对称或受处理个体很少时,聚类数量过少的问题会更严重。在此类情况下,Imbens and Kolesar (2016), Carter, Schnepel, and Steigerwald (2017), MacKinnon and Webb (2017)中提供的调整方法可能是一个不错的选择。

5.2 空间相关问题

事件日期存在空间相关会怎样?

聚类稳健推断的基本前提要求聚类之间相互独立。事件日期中的空间相关性削弱了这一前提,这能会导致对零假设的过度拒绝。

事件是政治进程的结果或受经济环境的影响时,邻近的个体(如邻近的州)在事件日期上可能比更遥远的个体更加接近。通常,经济结果也是在空间上相关的。在大多数情况下,目前的实证文献忽略了这个问题,但有一些潜在的方法来解决它;例如,参见Conley1999)的空间稳健标准误。

另一种可能性是允许在一个聚类内的观察样本中允许有任意程度的相关性,同时允许在附近时间段的日历时间中有衰减的相关性,无论它们属于哪个个体(如Driscoll and Kraay 1998)。这种方法比当前的标准方法在观测样本之间允许有更大的依赖性。但是这些方法没有“按钮”让你来按下(“button to push”),所以需要自定义编程。

此外,考虑到空间自相关很可能会使“聚类数量过少”的问题更加突出。短期内,预防此类问题的基本方法是检查数据在事件日期空间相关的可能性,尽管空间自相关水平应该要关注哪一些问题还缺乏共识。

拓展与挑战

06

6.1 强度可变的事件

存在影响强度不同的事件该如何处理?

处理方法:事件的虚拟变量*事件的规模大小。

美国各州在20世纪60年代引入了医疗补助计划。在引入医疗补助计划时,各州引入的影响随着接受援助的人口比例而有所不同。这使得事件整体包括了时间和事件强度的变化。考虑到事件日期与事件发生前的趋势相关,Goodman-Bacon (2018)通过按日历年(calendar year)控制事件日期,从时间维度分离了不同处理强度的变化。

最近的论文集中在“移动”策略(“moverstrategies)的事件研究模型。这些因素包括消费者在不同地点移动时改变购买模式,以及医生或患者从一个地区转移到另一个地区,拥有不同的医疗保健实践模式。这些移动的设计通常与不同强度的处理相结合。此类事件的变化强度是由不同目的地和出发的区域实践模式的差异决定的。

6.2 每个单位有多个事件

个体在事件窗口内发生多次事件如何处理?

比如一位员工在一段时间内被反复裁员(真惨)。

1)允许时间可以在同一单位在不同时间段发生。

可以同时设置多个事件-时间虚拟变量。这种方法的估计系数可以解释为“部分效应”(“partial effects”),部分效应假设保持后续事件的潜在影响(包括那些存在可能依次受到当前事件影响的事件)不变,但可能异于“总效应”(“total effect”, 包括当前事件对未来事件的可能性影响)。

2)调整事件定义,只允许时间内同一单位发生一次事件。

方法的实现是基于“最大事件(“biggest event”)”或“大事件是第一个(“first big event”)”的思想。

这种方法将后续事件(及其动态影响)捆绑到“处理效应”,这会使解释结果系数时现问题。

这种方法与使用“从未被处理”的组作为对照组相结合。这种组合可以引入前面提到的选择问题——也就是说,对照组现在可能在未被观察到的方式上存在差异。另外,该方法的对外部有效性具有影响。

6.3 异质性处理效应

如果异质性处理效应效应不仅在“事件发生后的时间”上发生变化,而且还系统地取决于个体类型、时间或环境,那该怎么办呢?

1)基于影响处理效应的协变量来构建一组交互项。例如,如果协变量是时变的,则包括对它们进行直接控制。这些交互项可能会吸收数据中的大量变化,作为应对方法,对交互项进行参数简化可能是有用的,允许协变量在事件发生的不同时期产生不同的斜率。

2)在事件日期不同情况下,动态处理效应取决于采用的事件时间的可能性。例如,早期采纳一项政策的美国各州可能是从该政策中受益最大的州;晚采纳者可能有更少甚至相反的效应。一种方法是将实际事件日期视为一个可观测变量,并根据该日期估计处理效应,或者可能使用“早期”/“晚期”采纳作为虚拟变量。

最近文献研究了事件研究中不同个体的异质处理效应,以及在不知道具体函数形式下的估计,提出了类似于在工具变量背景下的局部平均处理效应(LATE)的问题。其中主要的估计方法是潜在处理效应的加权平均值。通常,这些权重可能不符合常识性直觉或所期望的权重。

Sun and Abraham (2021)指出,总体效应是不同类型异质性处理效应的加权平均值,辅助回归可以计算隐含的权重,并提出了另一种替代估计方法,以复原目标的平均处理效应。

de Chaisemartin and DHaultfœuille (2022)提出,依靠使用尚未受到处理的个体和平行趋势假设来复原每种处理个体类型的处理效应估计,然后取平均值。

6.4 当“时间”不是“日历时间”

如果时间变量不是日历时间怎么办?这种情况可能出现在队列研究(cohort studies)中。

例如Duflo2001)根据地区和出生年份研究印度尼西亚儿童接触学校对他们的影响。这是标准的事件研究分析,只是时间变量是“出生年份”,而不是日历时间。这里的挑战是如何最好地处理队列(cohort)、年龄和时间的影响。基本事件研究规范需要以非线性计算年龄的方式加入队列固定效应。但这可能有重要的日历时间效应(例如,如果一些数据是在经济衰退中收集到的)。同时可能存在年龄-队列-时间多重共线性,虽然建议加入对应的三组虚拟变量,但这仍可能受到多重共线性的影响。

一个主要的方案是加入一组双向交互的虚拟变量:年龄队列固定效应,队列时间固定效应,或年龄时间固定效应。任何一组双向交互固定效应控制更多,但也“吸收”更多的数据变化。

最后一个问题是,在产生一个总体估计时,需要确保每个队列的加权与其人口成比例,因为模型的思想是以队列为中心。然而,数据可能不能自然地反映这些权重,特别是当组合来自不同大小的数据集的数据时。这需要在改进统计的势(基于样本中的数据加权)和改进代表性(基于队列规模加权)之间选择。

 Abstract

The event study model is a powerful econometric tool used for the purpose of estimating dynamic treatment effects. One of its most appealing features is that it provides a built-in graphical summary of results, which can reveal rich patterns of behavior. Another value of the picture is the estimated pre-event pseudo-"effects", which provide a type of placebo test. In this essay I aim to provide a framework for a shared understanding of these models. There are several (sometimes subtle) decisions and choices faced by users of these models, and I offer guidance for these decisions.

转自:“香樟经济学术圈”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com