8. 交互项有什么用?看差异的差异
很多时候我们在讨论一些具体的现实问题的时候,就涉及到解释变量对被解释变量的影响是如何相互依赖的。我来举几个例子,比如说在城市发展当中,很多人都认为当城市长大了,特别是那些比较大的产业结构比较高端的城市,只需要高技能劳动者,而不需要低技能劳动者。
那么高技能劳动者和低技能劳动者之间的关系到底是怎样的?从经济理论角度来讲,有一种说法叫“技能互补性”,也就是说,当高技能劳动力增加的时候就会带来很多对于低技能劳动者的需求,来进行生产上的辅助性的工作,这时候增加雇佣一些低技能劳动力,其实是可以提高高技能劳动力的劳动生产率的。这个时候高技能劳动力对于生产的影响,其实就取决于低技能者的数量。
同样的道理,我刚才所说的高技能劳动力和低技能劳动力之间的相互依赖关系,其实也存在于本地劳动力和外来劳动力之间。因为往往本地劳动力平均来讲它的教育水平比较高,而外来劳动力的平均教育水平要相对来说低一点,他们所从事的工作岗位也有非常大的差异。
比如说在我们的城市生活当中,大量的环卫工人、送快递的、做早餐的,其实都是外来劳动力,这时候本地劳动力的生产力或者他们的生活质量也是取决于外来劳动力的数量,换句话说本地劳动力和外来劳动力之间,恐怕也是相互依赖的关系。
还有一个例子涉及到推迟退休年龄这样的问题,大家都知道中国现在出现了比较明显的老龄化的趋势,那么为了缓解养老金的压力,如果我们可以推迟退休年龄,这个时候就可以延长大家工作的时间,从而缓解劳动力供给不足和老龄化的问题。
但是这个时候大家可能会担心一种问题,那就是推迟退休年龄是不是会导致老年人口仍然占着工作岗位,从而导致年轻人失业,对于这个问题本身又取决于,相对来说比较老年的人口和年轻的劳动力的关系,是相互替代的还是互补的。如果担心推迟退休年龄会导致失业,本质上来说,就是认为老年人和年轻人之间是相互替代的,你有工作了,我就没工作了。
但其实可能还有另外一种可能性,那就是老年人和年轻人其实是互补的,一方面,老年人有经验,他们可以通过传帮带这样的做法,来提高年轻人的劳动生产率。反过来说,年轻劳动力如果从事一些辅助性的岗位,也有可能提高老年人的工作效率。那么他们到底是互相替代的还是互补的,本身就对于我们理解推迟退休年龄这样的公共政策会导致什么样的后果,具有非常重大的意义。
对于我刚刚讲的这些例子来说,在实证研究当中,都需要使用到交互项,也就是说在方程右边的解释变量里,可能我们需要把两个决定被解释变量的影响因素进行相乘,来看这样一个交互项或者交叉项的系数是正还是负。比如说在我刚刚所讲的几个例子里,如果高低技能劳动者,本地和外来劳动者,老年人和年轻人之间是互补的,那么它们之间的交互项对于产出的影响的系数,就应该是正的,如果是互替的,它们就应该是负的。
再比如说在我之前做的一个研究里,我研究了新城建设的问题,当时我发现,在中国大量建设了很多新城,而这些新城往往建得密度非常低,同时这些新城又建设在距离当地的老城非常远的地方。
于是我们发现,如果一个地方新城建设的密度非常低,同时又建得非常远的话,那这个地方的投资效率就比较低,从而带来债务负债率比较高这样的现象。当时我就问了一个问题,如果一个新城建得离老城非常远,在这种情况下,同时如果这个新城建设的密度比较高一点,是不是可以缓解远距离对于债务这种负面的影响呢?
于是我们在研究中也构造了一个密度和距离之间的交互项,这样我就可以回答是不是密度增加,可以有助于缓解距离远这样新城建设当中的负面影响,结果的确如此。
在上面这样一些例子当中,我都讲了一些关于交互项的实际运用的例子,但是我今天所想讲的另外一个意思可能更为重要,那就是交互项的巧妙运用,有的时候能够帮我们在没有很好的因果关系识别的方法的时候,能够帮我们靠近因果识别。
比如说在之前我举过一个例子,那就是户籍与消费之间的关系,我们当时想说的一个道理就是,在城市里居住但是却没有本地城镇户籍的外来劳动力,他会挣钱,但是相对来说消费就不会消费那么多。
换句话说,外来人口这样一个户籍身份,会对消费不利,但是可能你会反问我,这种农村户籍或者说外来人口户籍,它到底是一个制度的影响还是一个文化的因素?也就是说是不是因为农村居民有某种特定的文化或者消费习惯,他进到城里来,他也不太习惯增加消费。
这个问题其实是合理的,当时为了回答这个问题,我们就想了这样一个逻辑,如果农村户籍的身份,真的只代表文化的话,那么我们应该看到,当这些人在城市里居住的时间越来越长的时候,那么农村户籍对于消费的负面影响应该会逐渐的变小,因为它有一个在城市里逐渐适应城市文化的这样一个过程。
所以在做这个研究的时候,就可以在方程的右边放入农村户籍身份乘以在城市里居住时间这样一个因素,构成一个交叉项或者交互项,来看它的系数会怎样。
最后我再举一个例子,最近我和上海对外经贸大学的王丹利老师做了一个研究,我们想研究在中国农村教育有的时候水平比较低是由什么样的因素导致的?
其实我们想讲,在有些地方可能具有这样一种传统文化,那就是当宗族的势力比较强的时候,这个地方很容易产生宗族之间的冲突,如果宗族冲突非常激烈的话,就需要进行一些武力的斗争,比如说我们会发现有一些现象叫做“械斗”。
我们发现在一个地方械斗比较严重的话,这个地方就会产生武力的冲突,而大家就会少投资于教育,从而导致教育水平会比较偏低。
但这其中会有一个问题产生了,我们所看到的械斗这样一个现象,到底是不是真的代表了宗族的冲突,还是由于一些其他的因素所导致的,比如说是不是因为在械斗比较严重的地方,同时也是资源比较贫乏的地方呢。为了回答这样的问题我们想了很多办法。
其中有一个办法是跟交互项的使用有关的,那就是在逻辑上,如果械斗的确代表的是一种宗族冲突,大家可以想,这种影响主要会影响男性,因为男性是参与械斗的主力,女性不大会参与械斗的。
与此同时,这种影响估计主要会产生在农村地区,而对于城市地区来讲,恐怕就不大会通过械斗来进行宗族之间的冲突,从而影响教育。
所以我们就可以把械斗发生的度量指标和是否在农村地区以及个体是男性还是女性这样的变量进行交乘,从而观察这些交互项的作用,来看它是不是真正的是因为宗族冲突的作用影响了教育。
其实我讲到这里,如果一些熟悉微观实证研究方法的听众朋友就已经反应过来了,其实在我们使用交互项的时候,其实本质上就是在看difference in difference,或者说差异的差异。
比如说在刚才械斗这样一个例子里,我们就是想看械斗对于教育的影响是否在农村和城市之间存在差异,是否在男性和女性之间存在差异,这个本质上其实就是一个双差分的分析。
我要说的一个意思就是,交叉项可以帮助我们解释变量之间的相互依赖性,同时也可以近似的被认为是一个双差分的分析,来接近因果的识别。
9. 为什么要去做异质性分析?不要相信有普适的政策
这节的话题是为什么要做异质性分析?我们先从一个具体的例子开始谈起,那就是开发区政策,大家都知道在中国经济改革开放以来,沿海地区,特别是东南沿海地区,获得了相对好的、比较快速度的发展,尤其是长三角和珠三角。
相对来讲在中国的中西部,制造业的发展、经济发展的速度总体上来讲不尽如人意,于是就有了这样一种理解,认为中国的东部沿海地区,特别是东南沿海地区,他们的经济发展是因为享受了一些优惠的政策,其中就包括了开发区政策。
因为你如果回顾中国早期改革开放的历史的话就知道,中国的一些经济特区,比较大的经济技术开发区等等,都首先是从沿海地区,特别是东南沿海地区开始实施的。
既然是这样的话,是不是可以把同样的开发区政策,在广大的中西部进行实施,这样的话就可以促进中西部的发展呢,很多人就这样想的。可是如果要是你真的是这样相信的话,或者说像有一些有关开发区的研究所得到的结论那样,开发区的政策的确可以促进经济发展,甚至有的研究就直接认为开发区政策可以促进欠发达地区的经济发展。
那么我们就要问一个问题了,如果你真的相信开发区政策是无条件的可以应用在所有的地方的话,那么为什么我们今天在中西部的广大地区可以看到这样的现象,那就是开发区遍地开花,——以工业园为例,现在几乎每一个县都有一个以上的工业园,——如果开发区政策、工业园政策真的是无条件有用的话,那为什么看到在中西部大量的开发区现在出现闲置呢?为什么企业不搬迁到中西部的这些开发区去,然后把开发区填满呢?
我们在之前的一项研究里就说了这样一个道理,其实开发区政策是否能够促进当地的发展,实际上是取决于一个地方的地理条件的。中国改革开放以来,特别是上世纪90年代中期以后,开始全面发展开放经济,以及出口导向的制造业,这个时候,沿海地区因为拥有大港口,在国际贸易里的国际贸易成本可以借助海运降到比较低的水平,于是又在这个基础上形成了产业的集聚效应。
所以这个时候,如果你给一个当地经济发展的优惠政策,它就可以借助于集聚效应,能够更加有效的进行工业的发展。
而相反,在中国的广大中西部地区,它恰恰是远离沿海大港口的地区,运输成本比较高,同时因为当地的产业发展,没有形成集群,所以它的集聚效应也不够高。
也就是说如果你把同样的开发区政策,放在远离大港口的地方,本身的产业规模又比较小,人口密度又不够高,甚至有一些中小城市,它本身就远离大的经济集聚的中心城市,交通基础设施条件也不够好,那么当你把经济的资源和政策集中在这些地方的时候,其实它就不会产生在沿海地区同样的促进经济发展的作用。
换句话说,我们往往把一些政策想用来促进欠发达地区的发展,但是欠发达地区的一些地理条件、自然条件,往往又会局限这种政策的作用,这就是一个悖论。
也是因为同样的道理,在我的研究当中,还去考察了新城建设,中国现在很多地方都建有当地的新城,希望通过城市的扩张,新城的建设搞房地产开发、基础设施建设来推动当地的经济发展。
其实类似像这样的政策是否能够成功也是有条件的,在我的研究当中我告诉大家,如果一个新城建设在人口流出地,那么人口在流出,城市的建设却在扩张,这个时候这样的投资就比较无效率,甚至有可能因为大量的新城建设,依赖于地方政府的负债,结果导致增加负债的负面效果。
而这样人口流出地又是在什么地方呢?往往又同时是在中国的中西部,特别是一些中西部的中小城市,最后给他带来了巨大的债务负担,又尤其是当当地做新城建设的时候,把新城建设的特别大,远远超过实际需求,还有建设的地方又远离当地所在的地级市的市中心的时候,这样的新城建设效率就更加低,推动经济发展的作用就更小,带来的债务负担就更大。
在我今天举的例子里面我都提醒大家,做经济分析,特别是实证的研究的时候,要注重做一些异质性的分析,也就是说政策的效果往往是取决于其他的条件的,而在现实生活当中我们往往发现,一些自上而下推进的政策往往都有一刀切的嫌疑,往往会忽略政策实施的有效性的条件。
而地方政府在学习其他地方经验的时候,也往往会照搬其他地方的政策,也会忽略自己恐怕缺乏其他地方获得成功的条件。这些现实情况就提醒我们,在做政策的应用分析的时候,特别是要多做一点思考。
首先要做一些理论机制的分析和思考,来想一想是不是有可能在不同的样本里,不同的地区会产生同样政策效果的差异性。
但是我这样说,也同时提醒大家,在做实证研究的时候,不要过于机械的分组,比如说你看现在有关区域经济的一些研究,都会对自己的样本进行沿海、内地或者东中西部的分组。
可是你要进一步的问自己,在你的研究当中东中西到底代表了什么,到底它代表的是一个地理的条件、气候的条件,或者说它代表了到沿海大港口的距离,还是说它代表了人口流入还是人口流出,为什么会有这样的政策分析的差异性呢?这些问题不能不回答,不能只是简单的分分组结束了,否则你根本不知道自己这样的分组可以带来什么样的含义,以及为什么会这样。
同样,我还会提到另外一个我们在实证研究当中碰到的情况,特别是对于很多的初学者来讲,在做研究的时候,会在起步的时候碰到自己想要的解释变量对被解释变量的影响在统计上不够显著的问题,这个时候很多人会着急。
但是我想大家有的时候要冷静一下,你看到一个因素对一个被解释的因素的影响在统计上不显著,可能只是因为你看到的是一个平均效应,是所有样本的平均效应,但是其实可能你的X对于Y的影响其实只是在某一个子样本里面存在显著性,那么当你看总体上的平均效应的时候,它就可能不显著了。
甚至有可能在第一个子样本里它的效应是正的,而到了另外一个样本里它的效应是负的,这个时候当你在加总的样本里去看平均效应的时候,正效应和负效应就会相互的抵消,以使得你看到的总体效应不显著。
所以我特别提醒年轻的学生和刚刚起步的青年学者,在你们做实证研究的时候,特别是当碰到效应不显著的情况的时候,不妨看一看在不同子样本里面情况的差异,当然不要忘记事先做一些理论、逻辑的分析,为什么会可能存在这样的差异性。
好的,我用一句话来总结,那就是不要去相信会有普适的政策,尤其是在中国这样地域辽阔的大国家。
10. 经济的显著性为什么要评估?宰牛何用杀鸡刀
我们还是从一个现实的话题开始讲起。大家都知道我是研究城市相关问题的,在最近这些年,有一个跟城市相关的经济政策的讨论,引起了非常多的争论,那就是中国的一些大城市是不是人口已经太多了,所以需要管制城市的人口规模。
我们先不讨论管制城市人口规模这件事情本身是不是符合全世界普遍存在的惯例,我们今天仅仅从研究的角度来讨论这个问题。
在那些支持要对城市人口规模进行管制的那些人那里,一个非常重要的原因就是所谓“城市病”。他们认为城市人口规模增加了,就会引起很多的成本,比如说城市的拥堵和污染这样的问题,于是城市的生活质量就会下降。
这个观点听起来似乎是有一点道理的,但是很遗憾的是,当我们去检索文献的时候却发现,基本上没有什么像样的研究,用数据、实证的方法来回答中国城市人口规模和拥堵、污染之间的关系这样的问题。
于是我和我的团队就做了一组研究,来考察城市人口规模和拥堵、污染这样的城市病之间的关系,我们分别来说一说。
我们先来说拥堵问题。我们在自己的研究里有一个度量指标,那就是每一个城市的人均通勤时间。通过数据的估计我们发现,城市人口规模越大,人均的通勤时间的确是更加长了。
但是仅仅在统计意义上这两者有正相关性,是不是意味着人口增加就真的严重的增加了城市的通勤时间呢?我们发现,这两者的相关系数其实是非常小的。
根据我们的研究,如果一个城市的人口规模增加一倍,人均的通勤时间仅仅增加大约2.2分钟。而且有意思的是,这个系数不管是在中国的数据里,还是我们查的有关美国的相应的文献,都差不多。
大家都知道通勤时间跟两个因素有关,第一个因素就是通勤的距离,比如说我们每天上班的时候,要走很远的距离,第二个因素就是拥堵,也就是说同样的一个距离上面,我们要花的时间更多,车堵在那里开不动。在大城市里,通常我们都容易理解,我们可能通勤的距离会比较长,但是拥堵这个因素需要单独进行分析。
现在好在有一些大数据,比如说高德公司就公布了每一个城市的拥堵指数,所谓的拥堵指数你可以这么理解,就是在早高峰的时候,我们去测量一下一段路行驶的时间,然后我们在半夜12点的时候,路上没车的时候,我们也大概测试一下同样的距离我们需要花多少时间。这两个时间比一下,我们就知道了,一个城市在拥堵的时候所花的时间,是通畅的时候所花的时间大约多少倍,这个就叫拥堵指数。
根据我们的研究,的确在比较大的城市,拥堵的程度是要高一点,但是高多少呢?我要告诉大家,在中国规模最大的城市,平均来看,这个拥堵指数大约是1.7多一点,而在中国规模最小的城市,平均来看拥堵指数也是1.6左右。换句话说,在中国最大的城市,平均来说,拥堵的时候在路上所花的时间是完全通畅的时候的大约1.7倍多,而在哪怕最小的城市,拥堵的时候所花的时间,也要是通畅时候的1.6倍左右。
通过我刚刚的这个讲解,其实就要告诉大家,虽然在统计学意义上,大的城市的确有更拥堵的现象,上班的时候大家会花更长的时间,但是这个大城市和小城市之间的差别,或者说人口规模和城市拥堵之间关系的强弱,其实这个关系是非常小的。
接下来我们再来看看人口规模和污染之间的关系,在中国的城市统计年鉴上,有八种城市的污染物。
所以我们可以很容易的去看一看人口规模和污染之间的数量关系,在我们的研究中我们发现,在八个污染物当中,其中有三个是完全跟人口规模没有关系的,有四个人口规模和污染物之间的关系,是在统计上显著的,但是相关的系数其实并不大,也就是说随着人口规模的增加,污染物的排放的数量的增加程度其实没有那么大。
而仅仅只有一个污染物,它跟人口规模之间是有比较明显的相关关系的,那就是生活废水。但是这一点也不奇怪,因为如果要是一个城市人口增加,生活废水的增长很小,那倒反而应该觉得很奇怪了才对,但是即便对生活废水来讲,人口规模增加一个单位所带来的生活废水的增加幅度,仅仅是0.85,它是小于一的,也就是说其实生活废水的排放是存在着规模经济性的。更有意思的是,当我们在数量估计中,去同时控制一个城市的一些经济发展相关的变量以后,那么人口规模和污染物之间的相关性全都在统计上变得不显著了。
我今天举到的关于人口规模和拥堵、污染之间关系的实证研究,其实是想借着这样的例子告诉大家,大家在做研究的时候,不要只顾着做回归的分析,然后看到有一颗星、两颗星、三颗星所标识的统计显著性就结束了,一定要记住看一看经济的显著性。
特别是对于那些跟政策相关性非常大的问题,一定要看经济的显著性。因为在你做政策建议的时候,你说要去做一个政策还是不做一个政策,其实本质上都要涉及到成本收益分析。
就比如说在我们今天所讲到的拥堵和人口规模之间的关系,这个问题上,如果你主张通过控制人口来缓解拥堵,仅仅是基于在统计上两者有一些相关性的话,那么你就会犯一个极大的错误,因为通过控制人口所达到的减缓拥堵的效果其实是非常微弱。
但是反过来,你这样去做的时候,带来的成本是非常大的,比如说当那些被你管制了的人口没有留在像北京、上海这样的大城市,离开这个城市的时候,它的收入是会有大幅度的下降,那这笔损失,其实不管是对个人还是对国家来讲,都是一个巨大的损失。
与此同时,同样根据实证研究,如果在一个大城市里管制人口规模的话,那么这个大城市的生活成本就会上升,给每一个留在大城市的人,所带来的生活的不便利性也是加强的。所以这两者相比较而言,其实通过管制城市人口来缓解拥堵问题,可以说是得不偿失,而且是远远远远远远的得不偿失。
所以我提醒大家,必须在研究的时候看一看经济的显著性,而不只是看统计意义上的显著性。提政策建议的时候,也一定要非常非常小心,要注重成本收益分析,以使得一个政策建议不仅建立在科学的基础之上,而且建立在收益和成本的比较的基础之上。
好的,最后我用一个中国的古话稍微修改一下,来形容这里我们所讲的话题,那就是“宰牛何用杀鸡刀”。
11. 模型的解释力在什么情况下是重要的?别“拿着鸡毛当令箭”
模型的解释力度在实证研究当中我们通常会称之为模型的拟合优度,在计量经济学里它是用一个指标来表现的,那就是R平方值。
今天我们还是从一个具体的政策争论开始讲起,大家都知道我是研究关于城市方面的一些经济学问题的,在中国城市发展当中有一个问题有更多的争论,它关系到中国的城市是怎么长大,一种理解就是认为中国城市的规模长大了,主要是由一些市场的力量所导致的。
当然与之相反也有一些学者认为,中国城市的长大,在很大程度上是因为行政力量导致的,换言之就是,如果要是城市长大是因为行政力量导致的,那么这种结果就不是最好的结果,从政策含义上来讲,可能就需要通过相反的一个反作用力,通过行政力量管制城市的规模。
当然这里我必须要说明一下,今天我讲的话题里,所讲到的城市规模的长大还是长小,主要是讲人口规模不是在讲土地,如果说是土地的话,当然了,中国的城市规模是由行政力量决定的,这点是没有争议的,我主要讲的是人口规模。
那么在展开和这里的话题有关的分析之前,我们先不谈研究本身的事情,先说一说简单的背景。绝大多数的朋友我相信都可能不知道一个基本的事实,那就是中国的城市这个定义,如果放在国际视野里,其实它不是一个城市而是一组城市。
中国的城市有很多种级别,大到直辖市,小到地级市和县级市,它有很多级别。中国的这些级别的城市,其实如果跟国际上其他国家,主要是指欧美和日本这样的国家去相比的话,其实我们的县级市甚至比县级市还要小的地理单位,才相当于国外的城市的概念。
而中国地级市,更不要说直辖市,严格说来都不是一个城市,而是一组城市,在这个意义上,其实我们把中国的城市人口去跟别的国家的城市人口去做比较,就犯了一个基本的错误,那就是比较对象在统计口径上和尺度上,是完全不可比的。
也正是因为这样的原因,我们常常都认为中国的城市人口规模已经太大了,其实都是和中国的城市的定义跟国外都不一样有关系。
不仅如此,还要请大家注意到,中国是一个人口大国,截至目前为止,中国的人口都是世界上的第一大国,除了印度的人口跟中国可以有点比较之外,其他世界上绝大多数国家的人口要比中国小得多。
而从国土面积来讲,虽然中国的国土面积也比较大,但是有将近一半的国土面积其实是不宜于居住的。
也就是说中国是一个人地关系比较紧张的国家,那么在这样的国家发展城市,特别是大城市,因为它的人口密度比较高,所以就可以有效的节约用地,这些是我今天讲这个话题一些知识的背景。
我们接下来再来讲关于研究的问题。我给大家讲一个我自己的研究,大家如果去看我的一本书叫《空间的力量》里,我们研究了中国城市的土地利用效率,也就是说每平方公里上面GDP的产出,当然这里的GDP没有包括农业,仅仅包括制造业和服务业。
在我们的模型里,有一个非常重要的地理变量就是一个城市到沿海大港口的距离。我反复强调,因为中国发展制造业,特别是出口导向型的制造业,所以距离港口的远近就关系到一个城市做国际贸易的成本。在我的研究当中,仅仅到大港口的距离这样一个变量,大约就可以解释城市和城市之间土地利用效率差别的大约24%左右。
而所有的解释变量,大约超过10个解释变量全部放到模型里,对模型的解释力度其实大约是在50%左右。
换句话说,在我们所解释的土地利用效率的城市间差别里,有一半就来自于一个变量,那就是到沿海大港口的距离,而所有其他十几个变量加在一起,也只不过就能解释另外一半。
刚才我讲的土地利用效率还是城市和城市之间在水平之上的差别,如果我们看长期经济增长率的差别,大约有六分之一模型可以解释的部分就来自于地理的变量,其中有两个,一个是到沿海大港口的距离,另外一个是到临近的大城市的距离。
在这个意义上,虽然我们不能把我所讲的东西称之为叫地理决定论,但是我想说的是,地理因素在决定中国城市经济增长的表现的时候,它是一个绝对重要的因素。
我们讲完地理和市场的因素之外,我们再来看看行政力量的作用,有文献就把行政级别当做是一个解释城市经济增长差异的一个因素,大家如果去看文献的话就会发现,这个因素对于解释城市经济增长表现差异的贡献,如果用R平方来表示的话,它的贡献并不是很大。
即便如此我们来讨论一下,如果我举一个例子,是说我要在一个省里建博物馆或者国际机场,我们把这样的公共设施建在哪里?我想几乎是毫无争议的,这样的设施可能是建在省会城市,而省会城市又恰恰是一个行政级别相对来说比较高的城市。
那么在我刚刚举的例子里,建省博物馆或者建国际机场建在省会,到底是因为行政级别的效应,还是因为规模经济的效应呢?换句话说,即便我们用行政级别这样一个指标去度量行政力量,其实其中捕捉到的部分,有可能是仍然来自于市场经济的规模经济效应。
然后我们再来讨论另外一个跟历史有关的问题,今天我们在讨论到类似于像北京这样的城市的发展的时候,我们总是说北京集聚了全国过多的资源。这句话如果放在历史上是对的,因为在1949年新中国成立之后,中央政府的确动用行政力量把全国的一些优质资源,特别是医疗和教育集中到了北京。
一直到今天,北京拥有的高校的数量和质量在全国都是遥遥领先的,在这个意义上来讲,北京的发展的确得益于历史上的行政力量。但是如果给定了这样一个历史的起点,北京已经集聚了大量的高技能劳动力和创新的能力,那么之后这种资源和人口和经济活动,向北京的集中,其实在很大程度上已经是一个市场的力量。
所以我想提醒大家,在提政策建议的时候,如果我们基于自己的实证研究,之前我讲到过系数的大小,经济的显著性这样的因素是非常重要的,而在这里,我想告诉大家,其实模型的解释度也是非常重要的。
当一个实证研究有两个解释变量,它的政策含义是相反的时候,请大家要特别注意R平方,或者说这个因素的贡献度。如果你仅仅关注了一个相对来说比较次要的解释因素,根据这个来提政策建议,恐怕就非常危险了。
做过实证研究的朋友可能会问我,R平方是不是我们做实证研究的时候应该被追求的呢?这个要看你怎么看。
如果你做实证研究的目的是一个纯学术的研究,也就是说你关心的问题是你的核心解释变量的影响的大小,又尤其是当你关心的核心变量它是一个随机的、外生的变量的时候,那么这个时候你不需要太多的关注R平方这样的指标。
有的时候虽然你关心的核心的解释变量不是一个外生的,但是你有比较好的识别方法来识别因果关系,比如说我们反复提到的工具变量法、双差分的方法、断点估计这样的一些方法,如果你有这样的估计方法的话,那么R平方对于你所关注的问题来讲,也不是很重要。
这也是为什么在很多现在发表的一些学术论文里,R平方都低于10%,甚至低于1%都是有可能的,那就是因为你关注的问题本身仅仅集中于某一个因素的影响大小。
但是我们有时候做实证研究,不光是为了发表一篇学术论文,而是为了得到一些政策含义,或者说有一些文章发表的时候是学术论文,但是我们在用这些学术论文的时候,我们所希望得到的是一些政策含义,这个时候就碰到我今天所讲的问题了,请大家关注一下R平方,或者说模型的解释度。
特别是当不同的变量之间的政策含义,它是相反的时候,我们就要比较不同因素对于被解释变量的解释度的大小。
在这个意义上,我特别提醒做实证研究,特别是希望基于自己的实证研究得到一些政策含义的学生或者青年学者,要注意我今天所讲的问题。否则的话我同样用一句中国的古话结束这个话题,有可能你认为自己是在基于实证研究提出政策建议,但是你在做的事情其实是“拿着鸡毛当令箭”。
12. 为什么要做实地调研?高校真的是象牙塔啊
有一年冬天,我在一些朋友的组织下,一起到了中国西部一个省份里面的欠发达地区去做了为期一周的调研,这次调研只是我众多的调研活动当中给我印象最深的一次,我自己的感触也非常深。
任何的事物都是分两方面的,在我们这次调研中的主题就是政府帮助欠发达地区的政策,包括扶贫政策产生了什么样的效果。
从一方面来讲是积极的,的确我们看到现在中国政府对于贫困家庭,特别是贫困家庭孩子的教育有各种各样的补贴和扶持政策,这样就在很多程度上能够保证贫困家庭的孩子不会辍学。
但是在另一方面,我们的调研过程中也发现了一些问题,比如说在扶贫工作中有大量的投入,人力和物力的投入,比如说建档立卡。很多基层的扶贫干部,整天的工作就陷入到了填报各种各样的表格里去了,有些表格出现一点错误,就要全部推翻重新来填。结果实际上我们很多基层干部工作的精力,没有有效的发挥在真正帮助大家发展经济这方面。
还有一些项目,由于是政府推动的,缺乏市场的信息,最后导致生产出来的产品没有市场的需求,这样的政策也没有起到有效的作用,甚至导致了当地居民的一些反感。
也有一些政策在短期里看上去似乎是有效的,比如说把原来居住在深山老林里面的居民搬出来,搬到政府新建的一些扶贫点上,然后在附近建一个厂,这些政策在短期里的确可以帮助这些居民离开那些发展条件和居住条件非常差的地方,到能够获得收入的地方。
但是长期怎么办呢?有一些扶贫点的建设,距离当地的县城,更不要说城市的中心都非常远。所以这样的新建扶贫点恐怕过不了多久,当地的居民仍然是收入最低,最贫困的居民。
我讲的这样一些现象,是为了围绕我自己调研活动来谈谈研究。在之前也讲到过,现在随着教学的改进,大家对于实证研究各种所谓先进的方法都已经充分掌握了,然后就用这些方法去做一些所谓非常标准化的研究。
比如说在我今天所谈到的这个话题里,我就连续看到一些研究,去研究那些帮助欠发达地区的政策,包括扶贫的政策起到了什么样的效果,有一些研究就用到了所谓的断点估计或者双差分的估计,这些比较流行的而且似乎是比较标准的实证研究的方法。
大量的结果也得到了结论,就是帮助欠发达地区的政策,包括扶贫政策是有效的,那么这里我们就要讨论一下跟研究相关的一些问题了。
我们的讨论不是对于方法或者对于具体问题具体研究的讨论,我们分下面四个方面来谈问题。
首先,我觉得很多的文章没有去深入的讨论我们的政策到底是“有效的”,还是“有效率的”这样一个问题。
在最近我连续跟中国非常著名的有关收入分配和贫困问题的经济学家李实教授有几次深入的交谈,我非常钦佩李老师在他的报告里就讨论了有效和有效率的问题,相应的如果用英文词就是effective还是efficient。
我来举几个例子,比如说如果你要去评估帮助欠发达地区发展的政策,发现相对于对照组来讲,得到政策的地方经济增长高了80%,那你会说这样的政策是有效的,是effective的。
但是有没有看过投入呢?如果为了获得这80%的更高的经济增长,投入增加了120%,包括投资、银行贷款、政府的债务,那么明显投入的增长速度要超过经济增长的增长速度,那么这个时候我们能说这样的政策就真的是有效了吗?除非你完全用结果导向,不考虑成本和收益的分析。
第二,那有人会说,我们所讲的有效可能在短期里不一定有回报,但是长期会有回报,比如说基础设施建设和公共服务的提供,往往都是在长期里获得回报的。那么问题来了,长期是多长呢?
我们很多政策的实施已经快20年了,如果你看到我们新建的工业园、基础设施、新城到今天都仍然是在闲置状况,而且就像我反复所讲的,那些闲置的工业园、基础设施还有新城,大量新建在人口持续流出的地方,那么你认为要多少年才能获得所谓长期的回报呢?
第三,可能有人要说了,我们不能完全考虑经济,我们还是要考虑社会收益,比如说在一些政策之下,老百姓满意了,这是一个很大的政策的社会收益。
真的是这样吗?当你持这样的观点的时候,或者我们在讨论来自于别人的观点的时候,我真的想问一句,真的是这样吗?大家调研过吗?去问过老百姓的感受吗?
在我的调研里我问过类似这样的问题,有的时候我得到的回答的确是正面的,更加满意了,但并不总是如此。
更重要的是,我这里需要提醒大家,普通的群众当他说他更满意的时候,他往往是跟过去相比,所以只要比过去好了,他就更满意了。但是我们学者要做什么样的事情?
我们学者要讨论的是,和一个更加理想的参照系比,有没有更好的办法达到更好的政策效果,或者说让老百姓满意了,要不要更满意。如果这样思考问题你就会发现,在很多时候其实我们在不同的帮助欠发达地区发展的政策(或者说扶贫政策)当中,相对来讲,促进移民的政策是一个更好的政策。
有学者曾经跟我这样开玩笑说,其实最好的扶贫政策就是帮贫困家庭买几张车票去打工就可以了,因为打工收入远远高于贫困线。
一讲到这个问题可能有的朋友就要说,那你们恐怕调研不充分吧,现在在农村很多人都不愿意动,有的人是家里面因为有老人或者生病的家庭成员也不能动。说到这个问题,又回到我在之前所讲的一件事,就是我们谈任何问题要在边际上讨论问题,我们今天讨论问题的关键,不在于对于根本不愿意动,或者缺乏迁移能力的家庭我们应该怎么办,对于这些家庭进行补贴,我觉得是必要的。
我们今天要讨论的是在边际上,如果我们换一种政策,如果我们鼓励能够移动的那些居民出门去打工,甚至在外地定居,在经济发展条件、就业机会更充分的地方长期定居,这样的政策是不是一个更加有效的扶贫和促进欠发达地区那些人口进行发展的政策。
不仅如此,如果大家真的去做过调研,可能也会发现我们现在做的一些政策,其实也造成了一些让老百姓不满意的状况。
比如说在扶贫政策里,我们通常是划一条贫困线,在这个贫困线之上你就不是贫困家庭,在这个贫困线之下就是贫困家庭。
结果一条线就决定了很多其实经济状况差不了太多的家庭的命运,在扶贫线之下的家庭就得到了各种各样的补贴,结果却导致了事实上的一些不公正的结果,有些老百姓对此也颇有一些不满意。
第四方面我们又谈回研究,如果我们真正对有一些我们研究的对象做过深入的调研的话你就会发现,其实我们在用那些所谓标准的实证研究的方法的时候,现实情况恐怕并不适用于这些所谓标准的方法。
比如说我们想找一个对照组说那个组是没有得到扶贫政策的,然后我们去研究得到扶贫政策的这些地方,是不是能够得到扶贫政策的正面效果,但是你恐怕要知道,其实一个地区是否成为贫困县有很多人为因素,有一些地方为了能够获得来自上级政府的财政转移支付,即便他的收入水平已经脱贫了,仍然瞒报自己的收入,能够保持自己的贫困县的身份,来获得政府的补贴。
这个时候是或者不是获得扶贫政策的标准,其实就不是外生的,而是人为控制的。
道理类似,比如说当我们去评估欠发达地区的工业园政策、开发区政策是不是能够有效的起到帮助企业发展和当地经济发展作用的时候,你要知道,其实进不进工业园本身也不是随机或者外生的,非常明确的是各个地方的政府在工业园招商的时候,其实都有自己的标准。
几乎所有的地方政府在工业园里,都希望招商引资的时候能够有更多的大项目,投资多税收的贡献大,单位面积的产出大,有些地方就直接把这样的一些要求写到他的招商引资的政策里。
所以其实一个企业进不进工业园,本身就不是随机的或者外生的,当你看到工业园政策对企业发展有用的时候,恐怕那是因为进工业园的政策本身就被更好的企业享受到了,而这个现象往往在那些招商引资比较困难的地方,是普遍存在的。
我讲完了今天这样的一些结合调研的感受,我特别想提醒现在的青年学生和学者,在做研究、数据分析、回归模型之前,一定要多读文献,这里的文献不光是研究性的论文,因为很多大家现在读到的研究性论文本身可能就是有问题的,是对现实情况不够了解所导致的一些可能带有错误结论的。
多读文献恐怕要包括多读调研报告,多读一些新闻报道或者政府的文件。更重要的是,我希望大家能够更多的到实地去做调研,或者换句话说要用脚做学问,多跑跑,多看看,用自己所看到的,听到东西来检验自己的结论是不是正确。
如果你做过这样的工作,恐怕你就不会非常轻易的得到某一条政策对帮助欠发达地区的穷人能够产生正面的效果这样的结论了。套用以前毛主席曾经说过的一句话,没有调查就没有发言权,我真的很担心今天我们的高校是越来越像象牙塔了。
13. 我们做的研究真的有政策含义吗?好吧,你说的对
通常我们在做实证研究的时候,在论文的最后一个部分都会谈一谈它的政策含义,但是我们讲的政策含义真的有那么正确的政策含义吗?
我大概要讲三种情况。第一种,也是从一个例子开始讲起。大约10多年前,有一次我参加政府内部的政策咨询会,讨论上海经济的发展,就有一位当时与会的学者提出这样的政策建议,说上海应该加大创新推动经济发展这样的一些相关投入。
10多年过去了,就在不久前的另外一次也是一个内部的政策讨论会里,又有一位学者在谈到面对当前的国际贸易冲突的时候,也认为应该通过推动创新来推动中国经济的持续发展。
这些建议在10多年前一直到今天一直在被提出,我当然不是说通过创新来推动中国经济的发展这个政策是错的,但是我想告诉大家的是,创新推动经济发展这一件事情可能是大家都已经知道的事情。
而当前在中国可能面临的问题是,政府已经有大量的创新投入,用来支持各种企业、科研院校进行创新,但是资金的使用效率恐怕没有很好的评估。
甚至有研究发现,我们一些企业为了能够争取到来自于政府的财政资金的扶持,就虚报自己的研发投入,结果成了骗钱行为了。
跟这个例子有一点类似的是,在一些研讨会上,经常看到大家有这样的一种政策建议,比如说做了一个跟教育有关的研究就说,政策含义是政府应该加大对于教育的投入。也同样是这样的道理,现在关于教育的重要性和加大教育投入,这一点我想可能没有人有异议。
但是关键的问题是,在今天我们讨论教育政策的时候,讨论的是到底是什么样的人群缺少教育投入,投什么教育,是职业教育、基础教育、技能教育还是高等教育?投在哪里,是更多的投入在人口流入地还是投在人口流出地?这些问题才是当前的教育政策需要讨论的问题。
我要举的第二种情况是要说到没有一般均衡的思想,其实一般均衡的思想就是一个全面看问题的这么一个研究问题、思考问题的思路。
我也举两个最近碰到的研究的例子,第一个研究是在一次会议上,有一位年轻学者的研究发现,农村人口大量向外迁移之后,农村地区的公共品投入相应的减少了,所以他得到的政策建议就是要鼓励农村人口回到农村,减少农村公共品投入变少的趋势。
另外一个是研究一些扶贫政策的效果,发现得到扶贫政策扶持的那些地方,促进了当地的产业结构转型,制造业的比重有所提升。
在这两个研究里,其实共同存在这样的问题,就是我们所提出的这样一些政策建议,到底有没有有效的改善人民的福利。比如说如果农村人口减少,是为了追求更高的收入和更好的就业机会,那么难道我们应该通过鼓励农村人口回到农村,仅仅是为了增加农村的公共品提供吗?谁从这样的政策中得益了呢?谁又可能因为这样的政策而获得损失呢?
当我们讲到政策的时候,请大家千万注意,我们不能只看到一个政策建议的直接作用,而应该考虑到它的代价。而代价又有两种,一种是直接实施这个政策所带来的成本,比如说投资本身就需要投入,大量的政府推动的一些项目,本身还需要一个庞大的公务员系统去做工作,这些都是直接成本。
不仅如此,一些政策还有一些间接成本,其中最主要的间接成本就是同样的这笔钱,在用到你所推崇的这个用途的时候,那么它就没有被有效的用到别的用途上去,这实际上就是一个机会成本的概念。
但是我们很多人在提出政策建议的时候,却忘了这一点。在涉及到农村地区人口流出的问题的时候,我们往往忘记了其实为了达到社会福利最大化,提高农民收入的政策效果,有一个非常简单的政策,就是我反复讲到的促进那些愿意外出打工的人外出打工,而不是在他们的老家增加偏离比较优势的产业投入,比如说制造业。
第三种其实就跟我刚刚讲的缺乏一般均衡思维有关系,那就是没有从全社会福利最大化的角度来思考问题。
比如说最近这些年,有一些研究讨论了高铁开通以后所产生的后果,其中我就读到过这样的研究,说高铁开通了以后,加剧了人口向中心大城市的集中,由于很多人认为这种效果叫“虹吸效应”,所以相应的就认为高铁开通可能加大了地区之间的差距。
所以在政策建议部分就提出,政府对于开通高铁这样的政策要谨慎,言下之意,似乎高铁开通是使得欠发达地区的或者是中小城市的人受损了。其实大家想一想,增加地区之间的连通性,降低贸易成本,降低人员流动的成本,总的来讲是增加全社会福利的,反过来讲,如果我们不进行高铁的连通,阻碍的人口向中心大城市的集中,谁得益了呢?难道是通过人口留在中小城市,社会福利是更大的呢?
与此类似,我要稍微提一下北京大学国家发展研究院曾经做的一个关于吉林研究的吉林报告,曾经引起了全社会的广泛关注。在这个报告中有一个核心的观点,认为吉林应该发展劳动密集型的产业。
对于这个报告本身有很多讨论,我也不多加评述,但是我只讲一个观点,就算你静态的、局部的看,吉林这样一个地方存在劳动力多这样一个局面,似乎看起来好像吉林就应该发展劳动密集型的产业,比如说纺织业,但是你放在全国的角度来看,把纺织业放在吉林发展,还是放在安徽的长江沿线发展,更加有利于社会福利的最大化呢?
吉林的人口一定要在吉林呆着来发展劳动密集型的产业吗?还是说要在全国范围之内,把劳动密集型的产业放在最最能够有效生产,最最能够低成本出口的地方呢?这个实际上又是一个局部看问题还是最大化全社会福利的这样一个问题。
到此为止,我讲了大概有三个方面的问题,来讨论我们的研究如何和政策含义挂钩起来。在实际生活当中,其实我们还经常会碰到有这样的一些政策研究,往往是在为政策的结论找注脚,甚至可能存在先有结论再有研究这样的情况,对这种情况,我就不多加评论了,因为这本身已经超出了科学研究的范畴。
我们做研究经常喜欢得出一些建议,所以在我讲到研究如何得到正确的政策建议的时候,我也本身想给研究者提几个方面的建议:
第一,我们要了解社会需求,要知道政策讨论的前沿和争论点到底在哪里,以免我们提出的政策建议,看上去似乎是对的,但是其实恐怕也是大家都知道的事情。
第二,就是我刚才所说的,我们要有全面的、一般均衡的思维方式,不能只看到局部。也许对于很多的政策目标来讲,换一个思维方式,换一个投资的方向和结构,得到的结果要更好。
第三,就是一个研究的立场问题,我建议大家多多站在最大化全社会福利的立场上去讨论问题。
当然,我这里所讲的全社会福利最大化的立场主要是指国家的福利,因为涉及到跨国的问题,在全世界范围之内讨论问题的话恐怕就很难了,因为在全世界范围之内,每一个国家都有自己的独立的政策立场,每一个国家都要最大化自己的国家利益,而全球的社会福利最大化是一个遥遥无期的事情。
但是在一个国家内部讨论问题的话,就需要讨论如何最大化本国国民的全体社会福利的问题了。
结语
我最后想讲几句话,来进行整个课程内容的总结。很多时候,我们在课程里所讲的实证研究,实际上讲的就是以现代的实证经济学的研究方法,或者说计量经济学的研究方法,来做实证研究的一些相关问题。
虽然我举的很多例子都是经济学当中的一些例子,其实这些例子所得到的启示,也可以推广到社会学、政治学、人口学这样的一些其他同样运用计量经济学方法来进行研究的一些兄弟学科。
最后我想讲一句话来送给大家,那就是,我们做的这些用计量经济学研究的方法,它本身实际上做的是一个实证的研究,是一个社会科学的研究,它必须要讲究(经济学的)理论和逻辑。在这个意义上,——
我们做的是社会科学研究,而不是统计学。
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!