投稿问答最小化  关闭

万维书刊APP下载

方法 | 统计学中的“固定效应”与“随机效应”

2024/2/21 16:26:47  阅读:58 发布者:

固定效应和随机效应是在面板数据回归模型中使用的两种常见的模型类型,它们主要用于解决面板数据中的异质性问题。本文主要介绍:(1)固定效应的有关知识;(2)随机效应的有关知识;(3)固定效应与随机效应的异同。

一、固定效应的有关知识

1、什么是固定效应

固定效应是在面板数据分析中的一种估计方法,主要是用于解决个体固有特性对模型结果带来的影响。在固定效应模中,个体或单位的特性会被视为固定的,而只考时间或其他可能影响结果的因素。具体来说,在面板数据中,我们可以通过观察相同个体在不同时间、不同环境下的变化来估计结果。然而,如果个体之间存在某些不可观察的固有特性(比如个体人口属性、文化背景等),这将对实证结果造成系统性偏误。这时,固定效应模型可以帮助我们将这种个体间异质性解释掉,并更准确地估计其他时间或环境下的变化对结果的影响。整而言,固定效应模型能够提高模型的稳健性,是面板数据分析中常用的方法之一。

2、什么是固定效应模型

固定效应模型是一种面板数据分析方法,用于控制个体或单位固有特性对模型结果的影响。它假设个体固定特性对于结果是稳定的,只考虑时间或其他影响因素的变化对模型结果的影响。固定效应模型可以通过个体固定效应的虚拟变量来估计,并以此消除个体固有特性对结果的影响。这种模型适用于有多个时间点和多个个体(或单位)的数据集,能够提高模型的准确性和稳健性,减少估计结果的偏误。

在固定效应模型中,个体间的异质性是通过控制变量来捕捉的,固定效应模型适用于个体间的异质性固定的情况,例如在研究不同工厂的生产效率时,每个工厂的生产效率是固定的。

3、怎么估计固定效应?

本文介绍两种比较常用的方法:①虚拟变量法、②组内离差法。

假设模型是Yit=b*Xit+di+uiti是个体如企业,t是年份,这里的di就是个体固定效应——企业独一无二的不随时间变化的影响解释变量和被解释变量的因素。

要么就把di个体固定效应给估计出来,要么就把di个体固定效应给去掉后再估计。

①虚拟变量法——直接估计出来

个体固定效应是每个企业独一无二的不随时间变化的影响因素,那么可以放入虚拟变量来估计,在没有常数项时,一个企业就放入一个虚拟变量,如果个体是i,那么虚拟变量Di=1,如果是其他个体,那么虚拟变量Di=0。通过估计出虚拟变量的系数,就可以得到个体固定效应。

②组内离差法——先剔除后估计

每个个体都具有一种固有特性,这种特性不随时间变化而变化。当一个个体有很多时间维度,可以通过将数据按个体分组,对解释变量、解释变量和控制变量分别在每个组内求均值,形成一个组内均值,然后将每个数据点减去其所在组的均值,形成一个新变量,从而消除了个体固有特性的影响。

原来模型:Yit=bXit+di+uit,每组求均值后:Yi=bXi+di+ui,相减后:Yit-Yi=bXit-Xi+uit-ui。直接用ols就可以估计出来b

4、固定效应模型stata操作

Stata 中,可以使用 xtreg 命令来估计固定效应模型。

下面是一个示例:

我们假设要探究个人收入与教育程度、工作经验和性别之间的关系。为此,我们使用PSID数据集进行分析,其中包括了多年的追踪调查数据,并且每个个体都有多个时间点的观测值。我们将教育程度、工作经验和性别视为解释变量,将个人收入为因变量。为了进行面板数据分析,我们使用xtset命令对数据进行设置,并在这基础上利用xtreg命令来估计固定效应模型。具体操作详情如下:

1、导入数据:

use psid.dta

2、将数据转化为面板数据:

xtset id year

3、估计固定效应模型:

xtreg income education experience gender, fe

(在这里,income 是因变量,educationexperience gender 是自变量,fe 选项表示使用固定效应方法。)

4、根据输出结果进行模型解释和效果评估

需要注意的是,在进行固定效应模型估计之前,需要对面板数据进行平稳性检验,以确保数据满足面板数据模型的假设,并且需要根据研究问题选择恰当的控制变量。

来源于网络)

二、随机效应的有关知识

1、什么是随机效应

随机效应是面板数据分析中的一个概念,表示不同个体之间存在差异,这种差异是随机的,不可观测的。通常在面板数据中,通过分析同一组个体在不同时间和不同情境下的变化,来研究变量之间的关系。在这个过程中,随机效应是指在多个个体(单位)之间的差异是随机的,不能够被观察、测量的个体特征或环境因素解释。

随机效应的存在会导致观测数据的异方差性,使得面板数据的分析结果结果的有效性受到干扰,因此需要考虑随机效应对数据的影响。为此,通常需要采用随机效应模型来估计面板数据中的随机效应,并将其纳入分析中,以提高模型的准确性和稳定性。

2、什么是随机效应模型

随机效应模型是一种应用于面板数据分析的统计模型,主要用于解决个体或单位的固有特性对模型结果带来的随机影响的问题。它假定每个个体或单位的随机效应是服从一定概率分布的。因此,面板数据中不同个体或单位之间的差异可以被随机效应模型捕捉,从而提高模型的准确性和稳定性。

在随机效应模型中,个体或单位的随机效应通常被建模为一个服从正态分布的随机变量,随机效应可以解释个体或单位间的异质性,而时间或其他外部因素则用于描述个体或单位内部的变化,以此来描述变量间的关系。与固定效应模型不同的是,随机效应模型将固有特性视为随机的,并将其与时间和其他外部变量一起解释,从而更全面、准确地描述分析结果。同时,随机效应模型能够消除随机效应对数据分析的影响,避免了误差项的异方差性和自相关性等问题,是面板数据分中常用的方法之一。

3、怎么估计随机效应?

估计随机效应通常使用随机效应模型来处理随机性。在随机效应模型中,需要假设个体或单位服从一定的分布(通常是正态分布),然后利用最大似然估计或受限最小二乘法估计模型参数来得到随机效应的估计值。

通常,可以使用统计软件中的随机效应模型函数来进行估计。例如,在Stata中,使用xtreg命令,并指定random选项和随机效应变量,就可以得到随机效应模型的估计结果。

利用Stata软件估计随机效应模型的命令为:

xtreg depvar [indepvars] [if] [in], [re RE_options]

其中,depvar表示因变量,varslist表示自变量,inif用于选择样本或者选择范围,weight用于添加权重,re表示fixed effect随机效应。

4、随机效应模型stata操作

Stata 中,可以使用 xtreg 命令来估计随机效应模型。

下面是一个示例:

我们想要探究公司的利润与公司规模、行业性质和管理水平之间的相关性。因此,我们使用 NLSY79 数据集进行研究,该数据集包含了多年的追踪调查数据,并且每个公司有多个时间点的观值。我们将公司规模、行业性质和管理水平视为解释变量,将公司利润作为因变量。为了进行面板数据分析,使用xtset命令对数据集进行面板数据设置,并在此基础上使用xtreg命令估计随机效应模型。具体操作如下:

1、导入数据:

use nlsy79.dta

2、将数据转化为面板数据:

xtset firmid year

3、估计随机效应模型:

xtreg profit size industry management, re

(在这里,profit 是因变量,sizeindustry management 是自变量,re 选项表示使用随机效应方法。)

4、根据输出结果进行模型解释和效果评估

需要注意的是,在进行随机效应模型估计之前,需要对面板数据进行平稳性检验,并且需要根据研究问题选择恰当的控制变量和模型结构。

来源于网络)

三、固定效应与随机效应的异同

1、不同点:

①模型形式差异:固定效应模型将个体/单位的固有特性视为定值,随机效应模型将其视为随机值。

②变量解释不同:在固定效应模型中控制变量分为时间不变量和时间变量两部分;而在随机效应模型中,控制变量主要包含时间不变的因素,在面板数据中的随机成分则通过随机效应进行解释。

③含义不同:固定效应模型中个体效应代表样本中各个个体自身的特征,随机效应模型中个体效应代表特定因素对某个个体的影响。

2、相同点:

①目的相同:固定效应模型和随机效应模型都是用来探究面板数据分析中对不同个体/单位之间异质性可能导致的影响的情况进行分析。

②都适用于面板数据分析:两种模型都适用于面板数据的分析,帮助研究人员揭示时间变量与其他变量之间的关系。

③控制变量的共性:在两种模型中,都要控制其他可能影响因变量的变量,以便更好地揭示模型的参数及其统计意义。

总的来说,固定效应模型和随机效应模型是面板数据分析中重要的方法,它们通过对时间和个体/单位特征对分析结果的影响进行讨论,使得面板数据的分析结果更具说力。但是在实际应用中,需要根据具体情况来选择适合的模型,也需要对模型的参数和假设进行严谨的检验解释。

转自“毅懂学术”微信公众号,本文仅作为学术交流分享,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com