实证研究的13个深层问题（二）

2022/12/23 9:06:02　阅读：305　发布者：

4. 为什么制度背景是重要的？请确定你讲的故事不是发生在印度

在很多场合，我都强调过，在做中国研究的时候，特别是那种具有重大的现实含义的研究——有的是政策研究——的时候，要特别注意中国制度背景的特殊性。如果不把制度背景交代清楚，那么对于中国的相关研究来讲，就可能出现一些误区，甚至可能对一些结果的解读就可能出现偏差。

今天我来给大家举一个例子，其实这个例子我已经举了很多次了，但是由于它比较有代表性，我宁愿再重复一下。比如说曾经有过一篇论文，发表在一本非常不错的经济学杂志上，它讲的这个故事跟金融是否能够有效促进企业家创业有关。

长期以来在经济学学术界对于金融作用有不同的看法，有的人认为金融对实体经济没有什么太多作用，它只是在分配资源。

而另外一种观点就认为，金融其实对实体经济的发展是有作用的，如果能够提供一个证据证明金融能够促进企业家创业，那么它就是金融能够对实体经济产生真实作用的经验证据。

于是在我讲到的这件论文里，作者讲了这样一个故事，用的是中国的数据。在上世纪90年代中期的时候，国有企业进行了一场住房制度改革，当时很多公有的住房就以非常低廉的价格，送给了（或者半送给了）国有企业的职工，于是作者就相应的发现，有大量来自于国有企业的员工，开始去做了创业，其中很多其实就是自我雇用形式的创业。

有趣的是，在同样的时期，来自于非国有企业的人，似乎没有出现这种大量创业的现象。那么为什么会出现这样的反差呢？

作者提供了一个解释，认为来自于国有企业的职工，因为经历了住房体制的改革，几乎免费或者低价的拿到了一套住房，于是他们就可以把这套住房拿到金融体系里去抵押贷款，然后再用这笔钱进行创业。

如果这个故事是成立的，那么就可以解释为什么来自于非国有部门的人做不到这一点，因为他们没有享受到住房制度改革给他们的一个廉价的或者免费的资产所得，没有办法用房子去做抵押物进行贷款和创业。如果这个故事是成立的，就证明了金融其实有促进企业家创业的作用。

故事真的是这样吗？作者在自己的文章当中也讲到了另外一种可能性，那就是，是不是因为90年代中期的时候，国有企业也出现了大量职工下岗的现象，于是职工下岗也会去创业、自我雇用。

为了排除这样的可能性，作者讲了这样一段话，说国有企业的下岗这件事情，是在1996年之后才开始的，而住房体制改革大约在1994年前后就开始了，所以如果早在1994年的时候就看到有大量来自于国有企业的员工去进行了创业，就不是因为大规模的下岗所导致的，而是因为当时的住房体制改革导致了企业员工用房子去做抵押贷款。

这样听起来似乎也挺有道理的，而且可能很多人甚至会认为，这个作者考虑问题还挺仔细的，想到了另外一种解释自己的研究发现的可能机制，而且去做了排除。

但是我要指出的是，在这篇文章里，由于缺乏对于制度背景的了解，恐怕就出现了非常严重的逻辑漏洞。第一个制度背景是，其实在1990年代，1996年之后只是从上海开始成立了大量的再就业服务中心，开始帮助下岗员工再就业。

但是其实并不是从1996年开始才有企业员工下岗这一回事，其实早在1992年、1993年、1994年这些更早的年份就已经出现了下岗员工的现象，而且规模还并不小，这些都是有统计数据的，大家只要查一查相关的年鉴就知道了。（也可以看我的《劳动与人力资源经济学》教材。）

所以作者看到1994年的时候就出现国有企业的员工开始大量进行创业，转向自我雇用，其实很可能只不过是因为他们下岗了，找了一份新工作而已。

更有意思的是，作者认为当时国有企业的员工会拿自己的房子去做抵押物来贷款创业，可是大家想一想，在1990年年代中期，真的中国的金融市场那么支持住房抵押贷款来进行创业吗？

当时我读到这篇文章的时候，我人正在美国，于是我就迫不及待的打了一个电话给我在上海的朋友，我有朋友在上海的农业银行工作，我当时就问，全上海用房产来做抵押进行创业或者企业投资的有多少，当时是2011年，全上海的农业银行系统大约只有一万起，通过住房的抵押贷款来进行融资和创业的。

大家想一想，在1990年代中期，当时严格说来中国根本就没有一个住房的市场，或者说住房市场发育才刚刚起步，更不要说在金融领域里用住房抵押贷款来进行投资这件事情了。

如果大家稍微问一问今天年龄大约在60岁，甚至65岁这个年龄群体，他们就是当年经历过下岗的那个群体，大家去问一问他们，他们会不会把自己的房子用来抵押去创业，你就会知道了，这个事情就算能做，在90年代中期，这个人数也就是凤毛麟角。

所以在我看来，经济学很难说是一门真正的科学，对同样一个数据分析的结果，其实基于不同的制度背景的理解，所能够得到的结论完全两样。如果忽略中国的制度背景，或者说对中国历史上的制度背景并不够了解的话，在我刚才所讲的故事里，你可能就认为中国的历史提供了一个金融能够帮助企业家进行创业的证据。

而根据我对制度的理解，其实这只不过是因为有大量的国有企业员工当时下岗了，转而自我雇用，到底谁更对？其实也很难说我们到底有没有更丰富的证据来证明我是对的，而别人是错的，或者至少要有更多的证据来证明这一点才行。

但是至少在没有更多的证据之前，根据我对历史的了解，我认为作者恐怕犯了一个错误。

接下来我再给大家举另外一个例子，是来自于我自己的研究，我想用这个例子来说明，其实对于制度背景的了解，对于我们如何利用中国的制度背景来做研究，其实也是非常有帮助的。

如果比较熟悉我的研究的朋友可能注意到，一段时间以来，我对中国房价的决定及其后果有一些非常有特点的看法。

这件事情要从中国的土地政策开始说起，中国的土地制度非常有特点，因为在我们国家，土地是公有的而不是私有的。一个城市的土地供应，在多大程度上把土地可以由农业用途转为城市的用途，包括工业用途、住宅、商业、基础设施，其实都是受制于一个所谓“建设用地指标”这样一个制度。

于是在2003年之后，中国的中央政府就开始使用建设用地指标这样一个调控手段，对于东部沿海地区，特别是东南沿海地区开始收紧城市的土地供应，相应来讲，他们就把大量的建设用地指标投向了中国的中西部，特别是中小城市。

试图用这样的办法来平衡区域间的发展，当然这种平衡是不是一种真正的平衡，这是我在别的课程里（喜马拉雅《中国经济72讲》）里面已经详细分析过的。

当时的逻辑是想说，如果我给了中国的中西部一些建设用地指标，他就可以用这个指标来建设工业园、新城来发展自己。

结果在客观上，就导致了一个后果，那就是在东部沿海地区，特别是东南沿海地区，又尤其是在北京、上海这样的大城市出现了一个矛盾，那就是人口大量流入的同时，土地和住房的供应跟不上需求了，结果就出现了房价持续上涨的现象。

同样在这个逻辑之下，我在2015年的《中国社会科学》上发表了一篇文章，我探讨了房价上涨对于劳动工资的影响，我大概讲了这样一个逻辑，那就是在东部沿海地区，收紧土地供应，同时人口又在流入，结果就会导致房价上涨，而房价上涨的时候，房价是老百姓生活当中非常重要的生活成本，当这个生活成本上升的时候，就会推动当地的工资上涨。

在这样的逻辑之下我们就可以比较好的解释，为什么在2003年、2004年之后，中国的东部沿海地区出现了比较快速的劳动工资上涨的现象。

如果要是不把这样的一个非常具有中国特色的逻辑给讲清楚的话，我想对于中国的房价和工资上涨的解读，恐怕就有其他的解释了。比如说很多人认为中国的房价高，特别是在北京和上海这样的地方房价高，体现的是房地产的泡沫。

但是根据我的一些研究，我讲到，房地产的泡沫是否存在，永远是从需求方定义的，但是在中国，像北京和上海这样的大城市的房价高启，在很大程度上是因为政策控制了这些地方的土地供应所导致的，是一个住房的相对短缺现象。

同样的道理，如果离开了我上述所讲的那些逻辑，当你看到中国东部的这些城市的工资上涨，恐怕你会把它理解为是一个劳动力短缺的现象，很多人就把这个当做是一种“刘易斯拐点”出现的现象，但是在我刚才所讲的逻辑里，它其实只是体现出了在土地供应收紧的时候，房价上涨导致了生活成本上涨而出现的一个结果，恐怕并不是劳动力短缺所导致的。

这个研究里还有一个细节，就是当我想讲房价上升会进一步推升工资水平的话，这个时候房价是一个内生变量，你既可以说房价影响了工资，也可以反过来说，工资上涨引起了房价上升。

为了解决逻辑上的难题，经济学里就有一个办法，我们去找一个所谓“工具变量”，这个变量是一个外生的变量，它直接影响房价，但是不会直接影响工资，如果这个变量找到的话，就可以用来比较清楚的说明由房价影响工资这样的逻辑机制。

那么这个工具变量是什么？在我的2015年《中国社会科学》这篇文章里面，我就用了城市层面的土地供应。因为根据我刚才所讲的制度背景，城市层面的土地供应是由中央政府（或上级政府）所决定的，它是建设用地指标这么一个配额所决定的。

我的文章发表以后，就有读者问我，包括一些同行，说陆老师你是不是做错了，因为影响房价的显然不是土地总的供应量，而是住宅用地的供应量。这听起来似乎也是对的，但是我要告诉大家，这里面又有一个小细节，其实是跟制度背景有关的。

那就是在一个城市里，它的建设用地供应总量是由中央所决定的，它基本上不能被地方政府所控制，但是给定了一个地方的土地供应的总量，其中有多少用地用在工业用途，多少用在商业或者住宅的用途，这个比例关系其实是由地方政府所决定的。

所以真正满足外生条件的，其实是土地供应的总量而不是住宅用地的数量。所以，如果不明白这个制度背景，就会把一个看似合理的一个变量（比如住宅用地）当做外生变量来使用，其实又犯了一个逻辑上的错误。

我今天给大家举的这两个例子，其实是要从做研究，还有如何做好应用性的政策研究角度给大家解释。

应用性研究它首先是必须反映真实世界的，所以我强烈建议大家，为了做好研究，平常一定要养成一个习惯，那就是在看到一个数据，或者做了一个数据的结果的时候，不要在心里总想着那些具有一般意义的理论。

尽管在经济学里已经形成了一个风潮，就是希望我们用国别的数据来验证所谓一般的理论，但是对于一项应用性研究，首先要求的是它要反映真实世界。

这里就要扣这一次课程的主题了，我希望大家在做研究的时候，多多去做调研，问一问在中国真实发生的制度背景到底是什么。甚至大家也不妨问这样一个问题，把你所做的研究，称之为是印度的研究是不是也可以，哪怕你用的数据是中国的数据，是不是我也可以说，同样这个结果其实我也可以认为是在印度发生的。

养成了这样一个习惯，经常问问自己，恐怕就比较容易把自己的研究更多的、有意识的建立在中国真实发生的制度背景基础之上，而不会犯那些常识性的错误，或者违背真实世界的错误。

5. 理论对于经验研究到底意味着什么？理论不是经验研究的遮羞布

在我们这一系列的讲座当中，我们讲到了经验研究，主要是用数据和事实来说话的那些研究。那么相比之下，理论模型则主要来讲一个逻辑关系，特别是对于经济学研究来讲，理论模型其实特指是用数学来写的一些模型。

现在数学方法的应用，不仅在经济学当中非常流行，而且越来越多的在政治学、社会学这样的其他社会科学门类当中也在使用数学的工具。

由于数学工具的流行，就给很多的读者和年轻学生朋友们造成了一个印象，一个研究如果离开了数学就不好。是不是那些没有数学来表述的模型的文章就不好呢？既然这样的话，我们又实际上看到了很多其实没有数学模型的文章，这又是怎么回事呢？

我今天所讲的话题里要讲到理论的重要性，以及应用理论模型的时候出现的一些误区。关于理论模型对于实证研究的重要性，我想就不用再多说了，正好非常巧的是，美国的克拉克大学的华人学者张俊富教授最近有一篇文章，题目就叫理论模型有多重要。

在这篇文章当中他讲的已经非常清楚了，哪怕是对于实证的研究、经验的研究，理论模型有的时候都是非常重要的。比如说对于有一些实证研究来说，可以用一个理论模型来讲述他研究的目的和意义。

再比如说有一些非常重要的经验研究发现的现象，是基于数字和统计的。

那么这时候如果有一个理论模型，可以把这些现象背后的逻辑能够有一个非常严谨的表述和解释。

再比如在做实证研究的时候，我们经常要用一些回归分析技术，那么对于这样一些回归模型，函数是怎么设定的，变量是怎么选取的，如果有一个理论模型加以说明的话，那也会好很多。

最后再比如说，在社会科学研究里，我们都希望能够对不同变量之间的因果关系和机制能够有所解释，那么这个时候，数学模型也能够帮助我们更加清楚的认识到因果关系和它们的作用机制。

在讲明了理论模型、数学模型对于经验研究的重要性后，是不是每一篇实证的研究都需要去写一个数学模型呢？这个其实也不一定，从而也就可以解释为什么哪怕是在国际、国内的顶尖杂志上发表的很多文章，其实它里面也并不一定有一个数学模型。这至少有两种情况。

第一种就是变量和变量之间的作用机制其实非常直接。举一个例子来说，在经济学和社会科学的研究当中，有一个概念非常重要叫peer effects，翻成中文我把它叫“同群效应”，也就是说他要研究一个人的行为是不是会受到周围其他人的影响。

这件事情在理论上非常简单，他主要的问题来自于人和人之间的行为是否相互影响，是不是有经验证据。所以如果要做一个经验研究去验证同群效应是否存在，或者说有多大的话，那么大多数的研究恐怕就不会去写一个数学模型把这个事情搞的特别复杂。

第二种情况是关于有一些问题，已经有太多的理论了。有些理论说X和Y这两个变量之间是正相关的，有的理论说它们是负相关的，那么到底是正相关还是负相关，就需要通过实证研究、经验研究用数据进行检验，这个时候理论和经验研究之间的关系，就好比在物理学里面讲的理论物理和实验物理之间的关系。

做实验物理的学者，并不一定要去发明一个新的物理理论，而只需要在实验室里对于既有的物理理论进行检验就可以了。在社会科学里，如果已经有的理论非常多，只需要去检验一下到底哪个更对，那么这个时候就并不一定需要去建立一个新的理论模型。

比如说以前我自己做过关于收入差距和经济增长之间的关系，这个问题的理论已经非常多了，我自己的工作也并不是要去提供一个关于收入差距和经济增长之间关系的新的理论机制，而只是要回答一下两者之间的关系到底是正的还是负的，以及他们作用的相互渠道。

而且我还用了中国的数据，这样的话就可以为我们理解在中国经济当中这两个变量之间的关系增加一个新的证据，这个时候我们也就没有去写一个理论的模型来说这件事。

再接下来我就要回答关于理论研究和经验研究之间的关系有几个疑问，也是大家经常会存在的困惑，我谈一点自己的看法。

首先，很多人可能误认为，如果要是有一个文章，他是既有理论，又有数据和实证研究，就一定好于没有写理论的实证研究。其实这是一个很大的误解。对于社会科学研究来讲，如果我们能够用一个实证的方法。

比如说大家都知道有一些实证的方法，像工具变量法，像双差分的方法，断点估计这样的方法，都能够比较好的识别两个变量之间的因果关系，那么相比之下，如果有一篇文章他写了一个数学模型，但是在实证方面就做得不够好的话，恐怕就未见得是比纯粹的经验研究更加能够去说明变量之间的因果关系。

第二种误解，经常认为一篇文章如果没有一个理论在文章前面，就是没有理论。这句话本身就是有问题的，其实我们经常讲理论模型，在狭义上来讲，当然是指用数学方法写的理论模型，其实在理论这个词上面，本质上来讲，它要表述的其实就是一种逻辑关系。

而逻辑关系所构成的理论，并不一定要用数学来表述。比如说在我前面所讲到的同群效应这样一个例子当中，这个逻辑关系就并不一定需要借助一个数学模型写出来。

而且其实哪怕对于一个纯粹的经验研究来说，模型的形式、变量的选取，其实都是依赖于理论逻辑的，不能随便的构建实证的模型，包括选取变量。并不是说没有数学模型，就是没有理论。

第三种误解，经常有人认为，我们看一篇论文的时候，往往这篇论文里是先有一个理论模型，然后再出现经验证据去验证理论模型的逻辑机制，很多人就以为，在实际做研究的时候，都是要先写一个理论，然后再去找数据。

其实在研究中往往不是这样的。一个有经验的研究者，往往在心里面先要预估一下变量之间的理论逻辑关系，这个时候未见得他要用数学去写这个逻辑关系，而是要先去看看数据，如果数据最后得到验证了，然后再用数学把这个理论逻辑写下来。

实际研究当中经常发生的情况是，在看数据的时候，恐怕会发现，数据所呈现的结论，跟事先所想到的理论逻辑不太一致。

于是我们就要去想，为什么出现这样的情况，在你想的时候，其实你的心里就是在建立另外一套替代性的理论逻辑，然后再去看数据，直到心里所想的理论逻辑和数据最后呈现的结果一致，才停下来，然后你再用数学把这个理论逻辑写下来。

所以不能单纯的简单的理解，在做研究的时候都是一定先有理论再有经验研究的，而实际上这两者是互动的。

在写数学模型这个意义上，并不一定是先要写数学，然后再去看实际的数据，但是如果我们把理论理解为是一种逻辑的话，那么一定是先有理论逻辑，再去看经验的结果的。

最后，我想讲一个看法，有的时候还会有这样一种误解，我觉得是非常严重的，那就是有些人可能觉得当我在X和Y这样两个变量之间的逻辑关系在数据上看不太清楚的时候，我就去写一个理论模型来说明它，这样做是不是一个好的研究？我觉得不是。

因为在数据上X和Y这两个变量之间的关系，其实是有可能存在多个理论逻辑的，如果你离开数据本身，就只用一个数学模型来写X和Y之间为什么会发生这样的关系，除非你这是一个重大的新的发现，或者你的理论模型本身所讲的这个机制，也是一个非常重要的新的理论机制，这个时候，这篇文章本身其实它是一个理论文章，经验研究只是一个装点。

但是如果这些条件都不吻合，仅仅作为一个经验研究，你要讲一个逻辑，然后数据本身没有讲清楚，只是借助一个数学模型来讲的话，我看就不行了。

因为就像我之前所说的那样，数据上呈现出来的两个变量之间的关系，可能有N种解释，我怎么知道你所讲的那种解释就是那一个正确的、最好的理解变量之间关系的解释呢？有没有可能存在其他的机制或者其他的渠道呢？

在这个意义上我就用一句话来作为这一节的结尾，那就是，理论是重要的，但是对于那些迷信理论，甚至以为理论可以取代经验研究的学生和青年朋友来讲，请不要忘记，理论不是经验研究的遮羞布。

6. 横截面数据可以用来干什么？一大堆问题，来不及秀技术

我先从我自己的一项研究开始说起，这项研究是我和陈斌开、钟宁桦一起做的。

大家知道一段时间以来，中国经济有一个非常重要的现象，那就是消费占GDP的比率一直不高，而且在相当长的一段时间里，这个比率或者说消费率还持续下降。这个现象非常重要，因为它表明了中国经济存在一些结构性失衡的一种现象，如果经济增长当中靠消费来拉动的比率不高，并且持续下降的话，那么经济增长就更多的依赖投资和出口来拉动。

这不仅是一种中国经济国内结构失衡的一种表现，甚至成为中美贸易争端的一个非常重要的背景，因为中国经济一直在大量出口，形成了国际贸易的一些失衡的现象。

那么对于这样一个非常重要的现象，如何进行解释呢？如何中国经济的消费率一直低，甚至有些年份还在下降呢？于是就需要找一些解释。

那么我们自己的研究是怎么解释的呢？我们就从户籍身份和消费的关系开始入手。我们观察到，在城市里，有大量的外来人口，这些外来人口没有本地的户籍身份，他们的消费如果比一般的城市居民要来得少的话。

那么，由于外来人口在持续的增长，就可以解释为什么中国经济的消费率比较低，而且持续在下降了。

根据我们的研究，我们的确发现，在所有其他的因素都一样的情况下，一个城市的外来移民由于缺乏本地城镇户籍，他的消费就会比同样是生活在一个城市的城市本地居民要低17%-21%。

而这样的人口数量有多少？大约有2.6亿左右，平均每6个中国人，就有一个属于我们今天所讲的，在城市里生活和居住，但是却没有本地城镇户籍的这样一个人群。

这样我们就解释了中国的消费率一直很低，并且持续下降的现象。在政策上这个研究就有非常重要的意义，它成为推进中国户籍制度改革的一个非常重要的实证依据，尤其是当中国经济的内需一直不足时。

我们的研究说明，如果在未来的城镇化过程中，能够持续不断的给外来人口本地户籍身份和平等的待遇，那么就可以利用这样的城镇化进程，来启动内需。

在当前的国际环境日益有些恶化，中国和其他的以美国为代表的国家之间的经贸关系出现了一些争端的时候，启动内需对于未来得中国经济发展来讲，可谓意义重大。

我讲了我们自己研究的重要性，我们的研究有没有缺陷呢？有的，其中最为重要的一点，我们的研究用了所谓的叫截面数据，截面数据的意思就是说，给定一个既定的时间点，我们所用的数据是在同样的时间点里的不同的人之间的差异，来看一个变量和另外一个变量之间的关系。

但是这里就会碰到一个问题，我们想说的故事是说，没有城镇户籍的外来人口的消费要比城镇居民来得低，但是这里的户籍身份到底代表着什么呢？

我们想说的是，户籍身份代表的是制度歧视，但是从逻辑上来讲，其实当一个人没有城镇户籍的时候，他很可能在其他方面，也有一些跟城镇居民之间的差异。比如说消费的偏好，这一点就很难观察到，当你观察到一个农民工朋友，他不大到饭店里吃饭的时候，也很可能是因为这个农民工他不喜欢到外面吃饭，而不是因为他想省钱。

也就是说，如果我们所看到的户籍身份带来的消费差异，仅仅是因为偏好和文化的差异的话，那么即便你把户籍给了这个农民工朋友，他的消费行为也不会发生变化，那么相应来说政策的改革就没有效果。

那么既然存在这样的问题，我们怎么办呢？如果说从技术上来解决类似这样的问题，当然有一些办法，我们学过计量经济学的人都知道，有一些办法的确可以克服截面数据模型所存在的那些问题，比如说我举两个例子。

第一例子是用面板数据，所谓面板数据就是我们持续去跟踪一个个体，在不同的时间点里，我们能够看到同样一群人他的行为变化，具体到今天我们讲的户籍和消费的关系里，如果我们能够看到有些人今天没有户籍，而明天他就有了，我们来观察同样这个人，在其他一些因素，比如说偏好、习惯、文化都没有发生变化的时候，仅仅因为户籍身份发生了变化，我们来看一下他的消费有没有发生变化。

这个时候这种户籍对于消费的影响就不是因为类似于偏好或者习惯和文化这样的因素了。

但是遗憾的是，理想当中的数据在实际研究的生活当中，其实是没有的，即使有这样的面板数据，在这个面板数据里，发生了户籍身份变化的样本，也非常少，而且即便是那些发生了户籍身份变化的样本，他们的户籍身份的变化也不是随机的，而有可能是一些其他的因素导致的。

这个时候你看到的户籍身份的变化，对于消费的影响恐怕也不仅仅是因为户籍发生了变化，而可能是因为其他的原因导致的，这就很遗憾了。

还有一种可能想到的办法就是利用实验的办法，我们的文章投稿到一些杂志上的时候，的确就有审稿人建议我们用实验的方法，这里我想吐个槽。

什么叫实验方法？就是如果我们有办法对一群人进行一个随机的实验，改变这个人群当中一部分人的特征，我们来看这个特征的改变以后，对我们所关心的一些现象，比如说消费，产生什么样的影响，那么这个时候由于这个实验是可控的、随机的，我们就能够识别出来我们想看到的这个因素会产生什么样的影响。

但是我们所研究的问题，是户籍身份对于消费的影响，请大家想想看，在我们实际生活当中，存在着这样的随机的实验来改变人们的户籍身份吗？恐怕没有。

那么我们可以自己去做这样一个随机实验吗？不要开玩笑了，如果我真有本事这样做的话，我就发财了，那意味着我可以随机的给一部分外来农民工发户籍，而且就算我有这样的本事，这样的研究根本过不了所谓的道德审查。

我凭什么动用一个个人的权利，就给一部分人户籍身份，而另外一部分人没有这样的户籍身份，而且这个户籍身份的给和不给，要关系到一大群人一辈子的福利。

所以我通过刚刚讲的这两个看上去能够解决问题的办法，说明了，对于一个特定的研究问题来讲，恐怕在这个问题仍然是一个非常重要的问题的时候，能够使用的数据真的就只是截面的数据。

当然在实证研究当中，也存在一些其他的高科技手段，比如说非常流行的双差分模型，断点估计，这些东西都是非常依赖于数据所生成的制度背景。往往在一些特定的问题里也没法使用。

那么既然这些高科技手段都没法使用，我们是不是就不要去做那些重要的问题？我认为是不行的，对于一些重要的政策问题，或者说应用问题，如果我们能够用截面的数据来做出变量之间的关系，总比我们对这样的一些重要的问题毫无认识要来得好得多。

当然我这样说我也不希望给大家造成一种误解，那就是在做研究的时候，永远强调我做的研究非常重要，所以你不要管，我就用截面数据，我随便报告几个方程就OK了，我觉得也不是这样。

如果大家有机会去看一下我们发表的户籍和消费之间的关系的文章，我们这个文章有早期版本和晚期版本两个版本。比较早期的中文版本我们发表在《经济研究》2010年，后来我们有一个用了新的数据和新的估计方法的一个版本，发表在英文的World Development上面，大家如果有机会去看一下我们的文章就会发现。

我们虽然是用的截面回归的一个分析，但是我们仍然做了很大的努力，来尽量的排除是不是有可能因为其他的机制来影响我们的结果。

我这里也举一两个例子，比如说大家都会关心,是不是我们看到的外来人口少消费的现象，是因为文化的差异？换句话说，是因为外来移民不喜欢多消费，因为他们跟城镇居民的文化不一样。

如果这个逻辑是对的，我们可以想两个办法来解决，第一我们在拿外来人口跟本地城镇人口做比较的时候，我们不去比较那些出生在城市的城市居民，而去比较那些出生在农村，但是现在已经是城里户籍的这样一些居民。

如果我们相信出生在很大程度上是决定了一个人的文化和习惯的话，那么将外来人口跟出生在农村，并且已经获得城镇户籍的居民进行比较，就更加可以相信这种差异是来自于户籍制度造成的差异，而不是文化差异。

另外一个办法，我们就去观察一下那些在城市里居住时间比较长的人，如果真的是因为没有本地城镇户籍的人在文化上有差异的话，你应该相信随着时间的推移，他在城市里居住的时间越长，他越会像一个城市居民。

但是我可以告诉大家，这一点在数据里是看不出来的，不管你在城市里居住多长时间，只要你是一个没有本地城镇户籍的外来人口，你的消费就是要比本地的城镇居民要来得更低。通过这样的一种比较，我们也基本上可以排除这是因为文化差异所导致的。

所以通过今天我讲的这个例子，我给大家讲了在有一些非常重要的实证的应用研究当中，不要过于片面的追求高科技，有一大堆非常重要的问题，来不及秀技术。

类似像这样的问题实在是太多了，比如说在我长期关注的其他问题，包括留守儿童的问题，包括一段时间以来，由于我们的超大城市抬高了外来孩子进入本地公立学校的门槛，造成了一些返乡的儿童。

这样重要的问题，具有很强的政策含义，但是如果我们要想研究留守儿童和城市孩子之间有什么差别，我们想看一看返乡的儿童，是不是跟那些留在城市的儿童形成了一些差异，这些问题，恐怕当我们去研究它的时候，能够收集到的数据，在很大程度上就是一个截面的数据。

在这个意义上，我觉得中国真的是有一大堆的重要的政策问题，来不及等到数据已经完全完备了再去研究，也来不及去秀我们高科技的技术。

但是同时非常遗憾的是，现在我们的学术界，特别是一些年轻的学生，恐怕很多时候都首先看到了一篇文章的技术，却忽略了重要的问题。

7. 面板数据到底何用？有时候，重要的就是“固定不变”的

今天的话题是面板数据不能解决什么问题？我们先从一个例子开始讲起，现在大家都非常关心城市的经济增长，特别是对于那些欠发达地区，很多人出了很多的主意，希望对欠发达地区的发展能够起到一些促进作用。

比如说有人提出要促进欠发达地区的投资，要给予他们优惠的政策。还有人认为领导人的能力非常重要，所以要把比较有能力的领导人安排到欠发达地区，去当当地的行政长官。

还有人认为一个地方的行政级别如果高的话，可以带来很多的资源，所以把一些原来属于县的地区，如果提升为城市的话，也可以促进当地的经济发展。

但是所有这些因素讲完了之后，大家可能忽略了一个非常重要的，决定一个地区或者一个城市经济发展潜力的重要因素，那就是地理。

在我之前做过的研究里，我从两个维度来捕捉了影响一个地方经济发展的地理因素，一个就是到沿海大港口的距离，另外一个就是到区域性的中心大城市的距离。

在我的研究当中，如果我们把各种影响经济发展的因素全部都放在模型例如的话，那么在影响一个地方经济的那些因素当中，大概到港口的距离和到大城市的距离，可以解释城市与城市经济增长差异的大约25%左右。

而所有的解释经济增长因素全部放在一起，大概可以解释城市之间经济增长差异的50%，而剩下的一半我们就不知道是什么样的因素导致的了，也有可能是因为一些随机的度量误差的因素都是有可能的，反正我们不知道。

那么，在我们已经可以知道的可以解释城市间增长差异的因素当中，到港口的距离和到大城市的距离这两个地理因素，解释了大约一半。

这样就足以证明地理这个因素在决定一个城市的经济增长当中所起到的作用，几乎是决定性的，当然我们也不是说它是唯一决定性的，只是说它的重要性要远远远远的超过那些其他影响经济增长的因素。

举了这个例子之后，我们再来讨论一下面板数据到底可以用来解释什么问题。首先要解释一下什么是面板数据，面板数据同时有截面的维度，也有时间的维度，比如说我们观察一些城市，如果只在一年当中去观察这些城市的话，他所形成的数据就是截面数据。

但是如果我们在若干年当中，对同一群城市反复的进行观察，那么这个时候它就具有了时间的维度，就构成了一个叫“面板数据”的数据集。

通常来讲，如果我们想在截面上看解释变量对于被解释变量的影响，可能就不能很好的去分析一个经济问题，比如说我们想知道投资对于经济增长的影响，我们看到了投资能够促进经济增长，这个时候我们是不是就能够把投资对于经济增长影响的系数，当作投资对于增长影响大小的度量呢？

恐怕不一定的，因为一个地方投资多的时候，往往是由一些其他因素导致的，这个时候你就不能把投资这个变量之前的系数，完成理解为是投资对于增长的影响的大小。

这个例子就是非常著名的所谓叫“遗漏变量的偏误”，那么如果我们要是有一个面板数据的话，我们就可以去看解释变量的变化如何影响了被解释变量的变化。

仍然拿投资对于经济增长的影响作为例子，我们可以在面板数据里去看，同样的地方的投资的变化如何影响当地增长的变化，这个时候我们假设那些影响投资的因素是不随时间变化的，比如说像地理这样的因素，那么给定地理这样的因素以后，如果一个地方投资增长的快，它的经济增长率就会更高的话，那么我们就大概可以把这样的一个影响的程度，当作是投资对于经济增长的影响了。

但是在我刚刚举的这个例子里，请千万注意一个问题，如果我们的研究问题本身是想知道类似于像地理这样的因素，对于经济增长有多少影响的时候，面板数据恐怕就无能为力了，因为地理这样的因素，通常是不随时间变化的，由于它没有变化，所以你就很难通过解释变量的变化，来看被解释变量相应发生什么样的改变。

用经济学的术语来讲，那就是类似于像地理这样的因素，其实是不随时间变化的固定效应，而面板数据的长处，恰恰是控制住那些固定效应之后，看其他可变的因素对于被解释变量的影响。

在这个例子当中，我提醒我的朋友们，特别是年轻的学生，不要盲目的相信某种特定的方法，而是要看到这个特定的方法是不是有助于你回答你想关心的这些问题，甚至有没有可能当你去使用一个方法的时候，你可以看到一个变量对另外一个变量的影响。

但是，是不是有可能当你这样做的时候，遗漏掉了更为重要的影响因素，而那个影响因素可能在面板数据里就是不随时间变化的。

我们再举一个例子，在经济学文献当中有一个问题叫“资源诅咒”，它的意思就是说在不同的国家，有一些国家的经济增长恐怕在长期里是不可持续的，有一类国家就有这样的情况，那就是一些资源非常丰富的国家，由于这些国家有丰富的资源，比如说石油，于是这些国家的制度建设就不是很完善，往往到现在他们仍然都是一些威权国家，还有这些国家可能腐败也非常严重。

同时，由于资源实在太丰富了，大家很容易挣钱，结果这样的国家就不太重视教育和科技的发展。

所以，从长期来看，这样一些国家的经济发展的表现也不太好，这就叫“资源诅咒”，表面上看起来拥有资源是件好事，但是从比较长的时间来看，这似乎又成了一件坏事。

那么为了研究资源诅咒这样的一个故事是不是存在，于是就有人用中国年度的省级或市级面板数据来研究资源诅咒。

但是请大家注意一下，在资源诅咒的这组文献当中，其实他研究的本身就是一个长期的问题，他不是要研究今年跟去年相比较而言，我这里多了一些石油资源，于是今年是不是就会比去年的制度更差，腐败更严重，更加不重视教育和科技。

而是说资源诅咒这个问题，本身就是一个长期的经济发展问题，是要看至少10年，甚至几十年的时间跨度里，有些国家有比较丰富的自然资源，是不是会导致这些国家制度不好、腐败严重，以及不重视教育和科技。

所以对于这样一个特定的经济学研究的问题来讲，恐怕面板数据也不是一个好的研究这个问题的数据来源，而是说它可能比较适合在比较长的时间里，用截面的方式来看国家和国家之间的差异，是不是资源的丰腴程度，导致了这些国家的制度差异、腐败差异等等。

在今天我举的这两个例子里，我想告诉大家，面板数据可以解决一些问题，但是它不能解决所有的问题。

我建议大家在做研究的时候，还是要回到你所要研究的问题本身。有的时候对于一些特定的问题来讲，它的重要的问题本身就是截面的差异，比如说今天所举到的资源诅咒的例子。而另外一些问题，本身重要的问题就是那些固定不变的因素，到底怎样影响到了我们关心的被解释变量，比如说地理因素如何影响到了城市的经济发展。

所以我最后就用一句话来结束这一节，那就是，我们在研究一个问题的时候，首先要多想想，多想想，再多想想，要把自己想关心的问题和什么是重要的问题想清楚，然后再去想用什么样的数据和方法来研究我们的问题，而不是反过来让研究的方法和数据束缚我们的思想。

转自：“量化研究方法”微信公众号

如有侵权，请联系本站删除！

上一篇： 实证研究的13个深层问题（三）
下一篇： 实证研究的13个深层问题（一）

投稿问答最小化 关闭

实证研究的13个深层问题（二）

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

实证研究的13个深层问题（二）

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭