一、写在前面
上个月,江艇老师在《中国工业经济》发表了一篇论文,里面详细讨论了当前“中介效应”和“调节效应”分析在经济学研究中的误用。世上万事万物,有因就有果,有果必有因,因果推断,是计量经济学一直在秉持的方法。它包含着因果识别(causal identification)和统计推断(statistical inference)两个部分,前者的目的在于确定总体是否存在因果关系,后者的目的在于识别样本数据能否代表总体数据。其完整流程如下图所示:
随着我们的认知以及方法的不断提高与升级,在因果推断的论文中,无论是审稿人还是作者,都越来越追求基准回归中对因果关系的净效应的识别,在此引用江老师的一句话——“推是推心置腹的推,断是清官难断的断”。这篇论文一方面强调了调节效应要为因果关系的作用机制服务,夯实因果识别,强化论证;另一方面指出了中介效应逐步法检验的局限性,应该说对未来论文的写作内容和论证方法都提供了一些思路,具有很大的理论意义和现实意义。
二、引言
当前,在经济学因果推断的经验研究范式重视研究设计,强调运用实验和准实验数据、外生的特定冲击、通过挖掘研究情境的制度蕴含和理论蕴含而非仅依赖统计方法进行因果关系论证。在因果关系被研究者使用数据初步验证后,往往会进一步关心因果关系的作用渠道和作用机制。
作用渠道(channel)是指,因果关系之间的逻辑链条并非直接,因此有必要探究是链条中的哪个或者哪些变量导致原因作用于了结果;作用机制(mechanism)是指,因果关系一般不会同一不变地作用于所有个体和所有时点,因此有必要考察因果强度随对象特征和现实条件地不同所产生的差异。针对作用渠道的分析,研究者往往使用中介效应的分析方法;针对作用机制的分析,研究者往往使用调节效应的分析方法。
然而,目前对中介效应和调节效应的使用分别存在着问题。一方面,中介效应存在着对嫁接自心理学的中介效应逐步法检验的滥用问题,研究者并未关心是否可信;另一方面,调节效应存在着对实证结果的理论阐发不充分问题,研究者对调节效应在因果识别上的重要性认识不足,不知用处何在。
由于原论文的结构安排比较多,为了使各位读者阅读起来更加清晰,我将分别对中介效应和调节效应的介绍、反思及操作建议进行介绍。
三、中介效应的介绍、反思及操作建议
(一)中介效应的介绍
中介效应是指原因通过一个或几个中间变量影响结果。其基本模型如下图所示(Y是结果变量,D是处理变量,M是中介变量)。
(1)式表示D对Y有因果影响;(2)式表示M对Y有因果影响,同时还反映了在M之外,D对Y的独立影响。因此,α1为D对Y的总效应,β1为D对Y的直接效应,β2γ1为D经由M中介后对Y的间接效应。
在论文的写作过程中,中介效应一般有四个要求:(1)α1不为0(意味着存在可以“被中介”的效应);(2)γ1不为0(意味着处理影响了中介);(3)β2不为0(意味着中介影响了结果);(4)β1为0(意味着M是D与Y关系的“完全中介”)或β1绝对值小于α1(意味着M是D与Y关系的“部分中介”)。在这里,作者介绍了可以采用堆叠数据的方法检验间接效应β2γ1,感兴趣的读者可以阅读文章中的这一部分。
(二)中介效应的反思
中介效应的问题主要来自于统计检验的功效较低以及效应的估计可能存在偏误。
具体而言,低统计功效来自于处理变量和中介变量高度相关,这就容易导致高度共线性,增加系数估计的标准误,降低统计显著性。此外,中介变量和结果变量均可能存在测量误差,这同样会降低统计功效。
估计偏误则是由于中介变量难以干预从而保证外生性,这就导致可能存在同时影响中介变量和结果变量的混淆因素被遗漏,最终产生偏误。此外,中介变量的测量误差以及中介变量与结果变量的互为因果也同样会导致该问题的发生。
在经济学的因果推断研究中,我们对考察处理变量对结果变量的因果影响过于关注,始终都在选择合适研究情境,运用经济学理论论证关键假设,提高研究手段的因果识别力,这就导致对中介变量的内生性问题不自觉地忽略了。
为了验证理论推导的正确性,作者进行了数据模拟实验分析,考察了部分中介、完全中介和无中介三种情况,具体如下图所示。
上图中左图没有出现偏误,而右图中处理对结果的直接效应β1、中介对结果的效应β2以及处理对结果的间接效应β2γ1均出现了偏离其真实值1的偏误。
上图中两图均出现了处理对结果的直接效应β1以及处理对结果的间接效应β2γ1的偏误。
不过,并非所有研究中出现类似中介效应检验逐步法的思路都是有问题的。下面两种情况值得大家反思和学习:
第一,考察Y对D的回归中加入中介变量M后D的系数估计绝对值是否减少,以此论证M是否为D作用于Y的渠道。此时,无需过于强调论证力度,将此视作某种试探性的证据即可。
第二,在竞争性排除假设中采取类似的做法(“赛马”式分析比较)。关于D如何影响Y,先有一个基准理论,然后提出一个竞争性理论,再构造能够刻画这种竞争性理论的控制变量X放入基准回归,如果发现竞争性理论不能完全解释D和Y的相关性(存在“直接效应”),则说明基准理论很可能是对的。此时的这种做法实际上是用来强化因果关系论证的。
(三)中介效应的操作建议
因果关系的作用渠道研究中,常见做法是提出一个或几个中介变量M,这些变量和Y的因果关系在理论上比较直观,在逻辑和时空关系上都比较接近,以至于不必采用正式的因果推断手段来研究从M到Y的因果关系;然后仅看D对M的影响,即只考察(1)式和(3)式,从而避免正式区分出在间接效应之外是否还有无法解释的直接效应。
尤为注意的是,如果要考察D对Y的效应在多大程度上可以被M这一作用渠道所捕捉,可以尝试在Y对D的回归中控制M,但必须先弄清楚这种考察对理解D对Y的因果关系有何帮助,并审慎解释回归结果。如有可能,尽量论证这一结果受到M的潜在内生性的影响是有限的(当存在多个M时,尤其要谨慎采用这种做法)。
四、 调节效应的介绍、反思及操作建议
(一)调节效应的介绍
调节效应分析和异质性分析这两者是一回事。它是指原因对结果的影响强度会因个体特征或环境条件而异。下面将介绍四种情形(两个处理变量、一个处理变量、调节变量为虚拟变量、处理变量和调节变量均为虚拟变量)。
1、两个处理变量的情形
在该情形下,两个解释变量都是核心解释变量。
此时,需要注意对系数β3的解释:如果β3>0,则说明D1和D2之间具有互补性;如果β3<0,则说明D1和D2之间具有替代性。
2、一个处理变量的情形
在该情形下,D为处理变量,M为调节变量。
此时,D对Y的影响受到M的调节。如果β3>0,则说明D对Y的正面(负面)影响随着M的增大而增强(减弱);如果β3<0,则说明D对Y的正面(负面)影响随着M的增大而减弱(增强)。此时也可以理解为,D对Y的因果效应在高M组和低M组之间存在异质性。
一般而言,论文写作中都会报告β3的系数大小以及统计显著性,具体如下图所示。
截距项反映了当M=0时的因果效应,斜率反映了M对Y的调节效应变化情况。区间[0,m1] 表示D对Y的因果效应为负向且显著,区间[m1,m2]表示D对Y的因果效应为负向但不显著,区间[m2,m3]表示D对Y的因果效应为正向但不显著,区间[m1,m2]表示D对Y的因果效应为正向且显著。
有时,也会对调节变量进行中心化(去均值)处理。此时,δ1反映了平均观测个体的D对Y的因果效应。
3、调节变量为虚拟变量的情形
在该情形下,有三种结果的呈现方式。第一种为(8)式,二、三种如(12)式和(13)式所示。
(8)式的好处在于直接显示了D对Y的因果效应的组间异质性,缺陷是M=1组的因果效应没有直接显示(因为模型未允许不同组别的截距项不同)。(12)式是分组回归,好处在于直接显示了两个组的因果效应,缺陷是因果效应的组间异质性额外需要(8)式进行检验。(13)式的好处也是直接显示了两个组的因果效应,缺陷是因果效应的组间差异未检验,但可以方便地通过检验H0:γ2=γ3来实现。
4、处理变量和调节变量均为虚拟变量的情形
在该情形下,交互项系数β3的解释为处理组(D=0)与控制组(D=1)的结果均值的组间差异之差异,即双重差分。特别地,当D为处理实施后的虚拟变量,M为是否最终接受处理的虚拟变量,这种特殊的调节效应模型就是双重差分模型。
接下来,我们通过双重差分的意义下理解上述几种情形:当D和M均为虚拟变量时,β3表示处理的实施对结果的影响;当M为连续变量时,表述为当M增加一个标准差σM时,处理的实施对结果的影响会提高β3σM。当D和M均为连续变量时,表述尤其需要小心,作者以研究金融市场的发展是否影响产业增长进行举例,感兴趣的读者可以阅读文章中这一部分。
(二)调节效应的反思
在一些文献中,研究者往往只是出于扩充文章篇幅的需要,在基准回归之外,出于某种“八股本能”,按地区、规模、所有制等进行一些异质性分析。反正这样做很安全,不管系数是否有差异,不管差异的方向是正是反,都有话可说。这种缺乏事前理论分析与预期,完全根据事后估计结果强行附会理论解释的做法,无异于数据挖掘。
在论文写作中,如果我们想要主张D是Y的原因,那么可以通过检验D影响Y的某个具体机制来对从D到Y的因果关系进行论证。这种论证分为强论证和弱论证,具体如下图所示(理论T源于D影响Y;理论R为导致D与Y出现相关性的竞争性解释,即反向因果;理论C为同时影响D和Y的混淆因素,即遗漏变量)。
本质上,强论证与弱论证的区别在于D与Y相关性的数据检验是否在M=1和M=0中可以被区分。这是因为当两组中D与Y的相关性都存在的情况下,我们并不能证明不存在反向因果以及遗漏变量,但幸运的是,我们至少证实了作用机制理论T的存在,也在因果论证上迈出了一大步。
类似地,处理内生性问题也不一定要完全依赖于寻找合适的控制变量和控制策略。可以参考调节效应的做法,尝试挖掘因果模型的新的可验证含义——处理变量和结果变量之间更丰富的相关性。如果这种相关性是其他因果“故事”所不能解释的,那么即便内生性仍然存在,但至少证明论文所研究的因果关系也存在。
最后,一定要选择好的调节变量。好的调节变量本身应该比较稳定,或者其变动是外生的,不受处理变量或结果变量的影响。如果调节变量具有自选择性(内生性),那么就会使得估计出来的系数具有偏误(如下图中,圆圈3出现了自选择性,导致真实效应被高估)。
(三)调节效应的操作建议
因果推断经验研究文章的重点永远是正确识别处理变量对结果变量的因果影响,文章中的每一字每一句都应该为这一目标服务。异质性分析更重要的作用正是通过分析因果关系的作用机制来强化因果关系论证。因此,在论文写作中尽量正式地讨论调节效应如何有助于强化对文章主题(从D到Y的因果关系)的论证。
因果推断,理论先行。在使用调节效应时,首先应该要有一个说得通的理论,然后再构建相应的交互项模型去验证理论:数据不会“躺”着等待被发现,而是应该先根据理论去构造。在论文写作中,尽量在研究设计部分就详细阐述调节变量与调节效应的理论依据,而不是等到报告实证结果时再附会解释。
最后,要规范地运用调节效应。一方面,要注意调节效应比较的是组间的差异是否在统计上显著;另一方面,要讨论其数值大小在经济上的重要性,说明这种异质性的经济意义。
五、总结
中介效应分析和调节效应分析是我们积极探索和深入理解因果关系的重要研究手段,但是目前在运用的规范性上分别还存在着问题:中介效应分析方法使用过度,调节效应分析方法发挥不足。
值得注意的是,作用机制和作用渠道具有不同的写作目的,因此,不宜安排在同一章节下。一些论文中,调节变量也是中介变量,这是不对的(调节效应要求把变量控制在回归中,但是这种控制在中介效应中又会造成估计偏误)。
六、写在最后
其实这些现象的出现本质还是来自于对统计方法的过度追求(盼“星星”),导致忽视了对社会科学理论资源构建理解世界的正确调用。好的定量社会科学因果推断的重点不是对技术方法的盲目追求,也不是对数据的盲目挖掘,而是其背后的经济思想和经济理论,最终形成完整有意义的经济故事。
Abstract
中介效应分析与调节效应分析是国内经济学因果推断经验研究中被广泛采用的两种研究手段,但是存在不同程度的误用。前者的主要问题在于过度使用中介效应逐步法检验,后者的主要问题是对其在因果识别中的作用阐发不足。为此,本文深入讨论了中介效应检验的偏误、如何正确开展中介效应分析,以及如何使用调节效应分析来强化因果关系论证,并针对当前的使用现状提出了相应的操作建议。
推文作者:杨杰,华中师范大学经济与工商管理学院本科生,现已保送至中国人民大学应用经济学院硕博直通。推文可能存在纰漏与不足,非常欢迎大家批评和指正!交流方式:yangjie__2000@163.com
转自:香樟经济学术圈
如有侵权,请联系本站删除!