投稿问答最小化  关闭

万维书刊APP下载

论文写作中想要做规范的实证研究

2024/10/16 10:31:39  阅读:2 发布者:

计量理论与现实数据

计量经济学的理论总是建立于一些理想化的假定基础之上,而现实的经济数据常常或多或少的不符合这个或那个的假定。事实上,无论多么高深的计量方法,如果原始数据的质量有问题,也只能是“垃圾进去,垃圾出来”。

实证研究的主要步骤

计量经济学是实证研究的工具,只有站在实证研究的框架上才能更好的回答“如何使用计量知识”这一问题,一般来说主要包括几个步骤。

1.提出问题

 对实证分析而言,研究问题通常是“关于xy有何影响之类的问题”,其中,X为自变量,可以包含多个变量;Y为因变量。

研究问题可以来源于理论(检验资产定价模型CAPM是否成立),也可以来自对经济现象的观察(媒体的热点问题报道,社会调研),可以研究某个政策的效应(新劳动法对失业率的影响),也可以对文献已有论文进行改进。

什么是好的研究问题?

研究问题越具体、越有趣、越新颖、越有可行性,则越好。

1)具体。明确XY具体是什么?

2)有趣。研究问题他人感兴趣吗?为什么他们要在乎你的问题?知道你的问题的答案后,能影响人们对世界的某个方面的看法吗?研究问题为什么重要?

3)新颖。论文的核心价值在于它的创新性,即做出了文献中所没有的边际贡献。边际贡献包括:新现象、新方法和新数据集等。

4)可行。有相应的数据,并且是可以得到的数据。

有了潜在研究问题后可以进行初步的探索性研究,看是否符合以上标准。通过查找与阅读文献,看别人是否已经做过类似的研究,或大致了解数据是否可得。备选的研究问题或想法越多越好,通常存活下来的选题并不多。

2.文献回顾

要想做出新的边际贡献,当然可以在前人的基础上继续拓展与改进(改进计量方法、增加变量、使用新数据)。也可以完全撇开前人,去研究全新的现象。即使是前人已经研究过的现象,也常常可以用新的眼光、新的视角去观察。重要的是,要有敏锐的观察力,并且“像经济学家那样去思考”。同时,要尽量避免已经被研究得很烂或过于有挑战性的题目。

什么时候看文献?

只有当自己已经有了一定的想法后,再去系统地看文献。这样才会知道自己究竟想看什么,也更能带着批判的眼光去阅读文献。同时,阅读文献的态度应该是虚心地从经典论文中汲取营养,才能“站在巨人的肩膀上”,并应该带着某种批判性的眼光。任何论文都有一定的缺点或者改进的空间,应该使用逻辑与实证的方法对不同的观点进行甄别与质疑。

3.建立理论模型

虽然实证研究可以没有理论模型,但如果有好的理论模型作为基础,则更有说服力。具体来说,回归分析一般只能说明变量之间的相关性,要对变量之间的因果关系作出判断,常常需要依赖经济理论。因此,即使无法提供完整的理论模型,也应该进行一定的理论分析。最理想的情形是从理论模型中推导期计量模型,即待估计的回归方程。

4.收集数据

在正式开始研究之前,应大致知道所需要的数据是存在的,并且可以得到的。总体来说,数据要么是别人提供的,要么是自己收集的。如果使用他人提供的数据,要注意其数据是如何定义、计算的(统计口径),是否是与你的理论模型中的变量相对应。如果确实不知道该从哪里找数据,可以看文献中同类研究的数据来源,并追溯其本源。对于非电子版的数据,则需要自己耐心地手动输入数据,并注意检查,防止出错。

5.使用适当的计量方法

有了数据之后,就可以根据数据的类型与特点,来决定使用的计量方法。

如果被解释变量为二元变量,则可以使用probitlogit

如果是非负整数,则可以使用泊松回归;

如果是面板数据,则可以考虑固定效应、随机效应、时间效应、动态面板等;

如果是时间序列,则应先判断是否含单位根(如果样本容量太小,则可以不进行单位根检验,因为单位根检验是大样本检验,不适用于小样本。),再决定使用相应的计量方法。

对于一般的数据,通常先做OLS,看看结果,作为一个参照系。做完OLS以后,可以画残差图,大致看看扰动项是否合经典假设,然后进行严格的检验。如果有所违背,比如存在异方差、自相关等,则做相应的处理。对于时间序列,还可以检验是否存在结构变动(邹检验)。

另外,应该对数据的质量进行检验,判断是否存在多重共线性、极端值、弱工具变量等,并做出相应的调整。

对于回归函数的具体形式,可以考虑线性、对数(如果解释变量只取正数且有指数增长趋势)、双对数、非线性(边际效应不是常数)等。

由于受数据可获得性的限制,遗漏变量几乎不可避免。因此,很有必要在实证论文中对此进行分析讨论。

不外呼两种情况,第一,存在遗漏变量,但与解释变量不相关,则需要说明为什么不相关,故可以不做处理;

第二,存在遗漏变量且与解释变量相关,则必须进行处理,处理方法包括增加控制变量、寻找代理变量、使用工具变量、使用面板数据等。

另一常见问题是内生解释变量。此时,一般需要找到有效的工具变量才能得到一致的估计。

由于面板数据可以在一定程度上克服遗漏变量问题,故比横截面数据和时间序列更有说服力。因此,如果可以获得面板数据,则应尽力争取。

大多数时间论文都希望说明xy的因果作用,而从回归分析的相关关系到因果关系是一个很大的飞跃。

实证论文的结构

实证论文的一般结构如下:

1)引言

2)文献回顾

3)理论框架

4)计量模型

5)数据说明

6)计量方法

7)回归结果

8)结论

《经济研究》《经济学(季刊)》《中国农村观察》《中国农村经济》等,多观察经典论文的文章结构与风格(包括如何用表格来汇报回归结果)。

计量实践的十诫

1.运用常识与理论

在进行模型设定时,应尽量使用常识与经济理论。比如,将“人均变量”(加人均消费)与“人均变量”(如人均GDP)相匹配;使用实际汇率来解释实际进出口;避免使用带时间趋势的变量来解释不带时间趋势的变量。

2.避免第lll类错误

在作统计检验时,要尽量减少第l类错误与第ll类错误。而第lll类错误则指的是,对错误的问题给出了正确的答案。比如,考虑FDI对经济增长的作用。由于FDI 起作用需要时间,如果仅把当年的增长率对当年的FDI进行回归,则可能没有太大意义。比较适当的做法是,考虑期初的FDI对随后5(或若干年)经济增长率的作用。

3.熟悉经济现象

实证研究者应该知道所研究现象的历史、制度与文化背景,以及数据的来源与产生过程。换言之,你应该知道得比计算机更多。比如,如果你研究中国的失业问题,那么你应该知道,中国的失业率指的是"城镇登记失业率",其统计口径与标准教科书中以及西方国家的失业率概念很不相同。

4.查看数据

研究者的一个常见误区是,只知道按计算机键盘,而不去熟悉原始数据。查看数据的方法包括,计算数据的主要统计量。比如,均值、最大最小值、标准差、相关系数等;画图;以及增加对数据的感觉。在查看数据的过程中,还要注称观察数据中是否存在不一致的地方。比如,出现了不可能、不现实或可疑的取值。如果发现,则要进行处理(比如可能是数据输入误),这被称为“数据清理”。

5.模型应尽量简洁

尽量不要把模型搞得太复杂。“从小到大”的建模方法简单易行,但可能偏差较大(因为存在遗漏变量)。而“从大到小”的建模方法偏差小,但却不易执行。通常的折中方案是,选择简单而有解释力的模型。

6.理解计量结果

计算机输出的计量结果常常很多页,包含密密麻麻的表格与数字。如果你尝试了各种不同的计量方法与控制变量,则结果就会更复杂。如何看这些结果?只能用双眼一个字一个字地看,直到看明白为止。比如,系数的符号对吗?大小合理吗?主要变量在统计上显著吗?与经济理论矛盾吗?如果把你的结果告诉外行,对方会发笑吗?

7.理解数据挖掘的成本与收益

不好的“数据挖掘”指的是,根据数据的特征来设定计量模型。这种数据挖掘之所以不好,是因为模型设定是由数据产生的,如果再用这个数据去检验由它产生的模型,那么就不是客观的检验。比如,进行回归之后,发现主要变量的系数不显著,有些研究者就想使用“何种方法”,能使得它变得显著。事实上,“系数不显著”本身也是一种结果,也可以在论文中汇报。如果数据本身没有问题,则它或许预示着实证数据与理论相矛盾,故可能需要对理论进行修正。

好的“数据挖掘”指的是,对数据进行各种“实验”,以期发现数据中的某种规律性,发现模型设定的错误,以此改进理论。

事实上,一定程度的数据挖掘是不可避免的,而这两种形式的数据挖掘的界限并不清晰,正如Heckman2000)指出,尽管使用数据来检验受到该数据启发的理论存在严重问题,但如果拒绝从数据中学习并修改理论,则会导致更严重的问题。

8.权衡理论与现实

在一般情况下,计量实践中的问题与理论计量经济学中最接近的情形会有一定的距离。比如,使用的代理变量,是否满足教科书中对代理变量的要求?内生解释变量问题是否严重?单位根检验的结果是否可信?因此,通常需要在现实与理论之间找到一个适当的妥协。

9.区分统计显著性与经济显著性

通常,样本容量越大,则估计值的标准误越小,该系数的“统计显著性” 就越高。但如果该系数估计值为0.001,则可能不具有“经济显著性”,即这个解释变量的变化对被解释变量的影响不大,尽管这种影响的幅度被估计得很精确。

10.进行敏感度分析

为了得到论文的结果,研究者通常需要做一系列的假定。问题是,论文的主要结果是否对这些假定很敏感?为此,有必要放松论文的假定,看结果是否稳健(基本不变),这被称为“敏感反分析”。比如,改变样本区间、函数形式、控制变量等。只有稳健的结果才是有说服力的。

结束语

在很多情况下,经济理论并不能给我们这些的答案。比如,有关“中国的内需不足问题”,学界与媒体已经提出了不下十种解释,莫衷一是。究竟哪个或哪些因素是导致内需不足的主要原因呢?要真正回答这个问题,则必须仔细收集数据,进行深入的实证分析。在一定意义上或许可以说是理论是灰度的,而实证之树常青。

转自云创辅导咨询微信公众号,仅作学习交流,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com