投稿问答最小化  关闭

万维书刊APP下载

方法日课 | 事件史分析法及CSSCI范文15篇

2023/3/1 14:02:07  阅读:209 发布者:

01 基本概念

事件史分析方法(Event History Analysis,简称EHA)是近年来应用广泛的一种小样本分析技术。本文从事件史分析方法的源流、概念及方法等方面对此作了比较全面的介绍,并举例说明了事件史分析方法的应用。根据山口一雄(1991)的定义,事件史分析专门研究“事件发生的方式及其相关因素”。

事件史分析在不同学科有不同的称谓,在生物医学研究领域(如癌症患者存活时间),它被称为“生存分析”,而在工程研究领域(如灯泡的寿命),又被称为“失败分析”。事件发生的方式可以用很多形式表达,比如风险函数、生存函数、概率密度函数、累计分布函数。它们都是事件发生方式的时间函数。其实,从数学上来说这四个概念是等价的。也就是说,要是我们知道这四个函数中的一个,就可以推导出其他所有函数。然而所有的事件史分析的统计模型都倾向于使用风险函数,而不用其他函数,这是因为其使用方便和易于解释。

02 发展历史

事件史分析方法的源流主要有三个,其一是生物医学统计方法的生存分析(survivalan alysis)学派;其二是可靠性技术的“失效时间分析”(failure time analysis)学派;其三是数理社会学中的马尔科夫(Markov)学派。

生命表方法是人口学最早出现的,也是最著名的,应用最广泛的分析方法。自18世纪以来在社会学及生物医学等领域被广泛的采用。直到本世纪50年代末60年代初逐渐被更为先进的方法———事件史分析方法所替代。在生物医学中,用来处理其实际问题的方法又可称为生存数据的分析方法,的确,大多数事件史方法的文献是用生存分析和生命分析的名称而写成的。例如,在实验室进行的动物实验中,通过让动物吃不同剂量的、毒性不一的药物,实验人员可以观察到在不同的过程中动物是如何存活的。在这里,“事件”就是特指动物的死亡,“截断”的出现则是因为该实验通常是在所有动物死亡以前而结束。生物统计学家已经写了大量的文献说明如何分析这些数据的有效的方法,这些方法已经变成为研究与分析癌症病人存活的数据的主要工具。其中,由该领域中所发展起来的最有影响的回归方法———部分似然估计方法成为事件史分析方法中的重要的核心技术之一。可靠性分析技术是工程上研究与分析机器和电子元件故障数据所发展起来的重要方法。该领域里所发展起来失效时间分析技术,在过去的十几年里已经被有效的应用于事件史分析之中,并形成了新的流派。

另外,自本世纪6070年代以来,马尔科夫过程理论在社会科学的应用有了长足的进步和发展,这一方法的转折点是Tuma将解释变量引入连续时间的马尔科夫模型,这可以说是沟通生物统计和工程学方法的一座桥梁。其中,用马尔科夫模型研究社会科学现象变化过程中不同状态的个体事件的分布构成了事件史分析中的重要方法。

03 操作步骤

EHA是对风险率(hazard/odds)或其对数进行建模,模型的选择取决于时间数据的精度和对具体问题的判断。

事件史分析的核心是时间变量t的建构,如果在一个时间区间中t无限小,那么我们可以将其视为连续型时间变量,拟合的模型称为连续型时间模型(continuous time models);但是在社会学中很多事件的发生是单一性的,即描述事件发生的时间是单位型的离散变量,可以是周、月或者年等,比如研究离婚事件,那么这时拟合的模型则是离散型时间模型(discrete time models)。

04 连续事件模型

1.构建数据;2.告诉软件这是事件史数据;3.用生存函数或风险函数做图;4.模型估计

连续型事件史分析的比例风险模型(proportional harzards model)为:

logh(t)=a(t)+b1x1+b2x2.......+bnxn+u

这里h(t)是连续时间风险率,xi(i=1.......n)是相互独立的解释变量,ab1b2.......bnu是一个独立于xi(i=1...n)的随机分布项。

对于给定u以不同的分布,可以得到连续型风险率将适合诸如指数(exponential)分布,威布尔(weibull)分布,冈帕兹(Gompertz)分布,伽马(gamma)分布等的情形。

之所以将该模型称为比例风险模型是因为在该模型中在任意时点上的两个个体所处的风险概率之比(hi(t)/hi(t)=c)c仅依赖于解释变量,而与时间无关。

05 离散事件模型

1.构建“人——时间记录”数据集(如“人——年”,“人——日”);2.针对每个人的记录,构建时变和非时变变量;3.应用logit模型

P(t)为一个体在时刻t发生的风险概率。又假定有n个相互独立解释变量是x1(t)x2(t)......Xn(t)

作为粗略的估计,可以认为P(t)x1(t)x2(t)......xn(t)的线性方程,即:

P(t)=a+b1x1(t)+b2x2(t)+.......+bnxn(t)

t=12......5

然而,这里要注意的一个问题是,由于P(t)是一个概率,因此,它不应大于1和小于零。但上式的右端显然可以是任意实数。因此,这一模型是不可能用来进行预测的,且带来计算和解释的复杂性。但这一问题可以通过对P(t)进行logit变换避免,即:

Log{P(t)/[1-P(t)]}=a+b1x1(t)+b2a2(t)+......+bnxn(t)

P(t)01之间变化时;方程的左边从负无穷大到正无穷大。尽管还有其它一些形式的变换,但logit变换是最方便的和熟悉的形式。回归系数bi(i=1.......n)则表示当xi(i=1......n)分别变化一个单位时,logit所变化的数量。

在上述离散模型中,通过让参数a随时间而变化,这样,可以得到描述离散型事件史分析方法的核心模型,即:

Log{P(t)/[1-P(t)]}=a(t)+b1x1(t)+b2x2(t)+......+bnxn(t)

而关于参数a(t)b1b2......bn的估计将通过极大似然估计的方法来进行。

以上概念部分参考了郭志刚《历时研究与事件史分析》一文,操作步骤模型推导引用自公众号君泉计量《一文读懂事件史分析方法》一文,有删节。

06 范文推荐

1.《历时研究与事件史分析》,郭志刚,《中国人口科学》,2001-02-01

2.《“效能建设”十年扩散:面向中国省份的事件史分析》,吴建南、张攀、刘张立,《中国行政管理》,2014-01-01

3.《身不由己还是心甘情愿:社会责任报告鉴证决策的事件史分析》,沈洪涛、陈涛、黄楠,《会计研究》,2016-03-15

4.《制度环境、府际竞争与开放政府数据政策扩散研究》,吴金鹏、韩啸,《现代情报》,2019-03-01

5.《知识产权保护、创新政策与中国研发企业生存风险——一个事件史分析法》,鲍宗客,《财贸经济》,2017-05-15

6.《产业联盟的组织复杂度、牵头单位类型与合作创新率》,杨伟、周青、方刚,《科学学研究》,2015-05-15

7.《地方政府间的政策创新扩散——以城市生活垃圾分类制度为例》,雷叙川、王娜,《地方治理研究》,2019-10-10

8.PPP落地快慢:地方政府能力、领导者特征与项目特点——基于项目的连续时间事件史分析》,谈婕、郁建兴、赵志荣,《公共管理学报》,2019-08-09

9.《地方政府绩效评价的扩散:面向广东省的事件史分析》,李文彬、王佳利,《行政论坛》,2018-11-28

10.《地方人才政策创新扩散的动因分析——基于中国城市“人才新政”的实证研究》,陈新明、萧鸣政、史洪阳,《企业经济》,2020-06-25

11.《政府信息公开制度扩散的多重逻辑——面向中国省份的事件史分析》,韩啸、吴金鹏,《东北大学学报(社会科学版)》,2019-09-10

12.《政府网上政务服务政策创新扩散研究——基于32个地级市数据的事件史分析》,嵇江夏、宋迎法,《情报杂志》,2020-11-10

13.《中国地级以上城市智慧城市建设动因探寻——基于268个城市的事件史分析方法》,楚金华,《统计与信息论坛》,2018-12-10

14.《住房限购政策扩散:内部诉求还是外部压力》,刘琼、职朋、佴玲莉、张绍阳,《中国土地科学》,2019-02-15

15.《制度压力如何影响地方政府公共服务创新的扩散?——以城市网格化管理为例》,赵强,《公共行政评论》,2015-06-15

作者:李岩

转自:“科研写作研究所”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com