以下文章来源于学说平台 ,作者金凌
来源:学说平台
作者简介
金凌,经济学博士,中南财经政法大学金融学院准聘制副教授,研究方向为金融发展、金融危机管理、金融创新等,在《经济研究》、《经济学(季刊)》、《管理科学学报》、《金融研究》、《Pacific-Basin Finance Journal》等期刊发表论文多篇。相关研究曾获首届中国金融学术与政策国际论坛优秀论文奖、第十七届金融工程学年会优秀论文奖等。
本文从科研的前期准备、实证论文写作步骤和审稿意见关注重点三个方面进行分享,也方便大家之后在投稿的时候更加顺利。
本文整理自中南财经政法大学金融学院主办的“博士研究生如何做好学术研究”。
科研前准备
01 因果推断的重要性
因果推断是非常重要的。如2011年的诺贝尔经济学奖,如果我们单纯的将销量在计量软件里跑一个回归,肯定可以得出非常显著的结果。得出这样一个显著的结果之后,可以说, 把西瓜的销量提高了就可以提高冰淇淋的销量吗,这显然是不太科学的。再比如,先有鸡还是先有蛋的问题,所以这就是新的一个区别。
在做经济金融研究的时候,大部分的情况下要重视因果关系,而不是相关关系。
例如, 国家出台了某项政策——消费券,消费券出台的时候目的是为了促进居民的消费,但与其同时可能还会有其他的政策出台,我们观测到的结果是居民的消费,但这也体现了整个经营金融。
一些制度的改革或货币政策的制定和产生,而制定推断本身包含两个部分内容——因果识别、统计推断。
因果识别基本的逻辑是如果相关性不存在,那么因果性就不存在,如果相关性存在且只有一种因果模型,可以合理化相关性,即这种特定的因果性就存在。
从这个逻辑来看,举例来说, 今天在室内有个花瓶被打破了,那么今天在室内的所有人可能都跟花瓶的打碎相关,但是我们从花瓶打碎的时间分析,相关存在这个时点只有这么一个人来过,那么就只有唯一的因果关系。可以合理这种相关性就可以推断这个人打碎了花瓶,这就是因果识别的基本逻辑。
具体到做法为,通过回归分析看你的回归系数显不显著或者显著程度有多大,那么相关性就有多高。因果识别更多的是逻辑性的识别,在做具体研究的时候有关经济的理论非常重要。
统计推断就是实际在数据上显示出相关程度的大小,我们在具体研究中可能会面临这样的几种情况。我们首先用 Y表示研究所关注的结果或者被解释变量,那么d就是导致结果发生的原因或者说核心的解释变量。
在实际因果推断的过程中可能会有三种情况:
一是可以直接推断出来的,就是d导致的y。
但还有一种情况是现实中比较非常常见的,即一个共同的因素同时影响d和y。这有内生性问题,比如说我们之前做的有关于国家队持股的研究,国家队持股降低了资产价格的风险,但有没有可能是国家队本身持有的这些股票有一些特征,这些特殊的特征又与它的风险有一定的相关性,而并不是国家队导致的。
还有一种是反向的因果关系,比如,之前一个研究投资效率的文章也有一个审稿人提到了这样的问题,有可能银行在选址的时候是专门选择一些经营情况比较好的企业周边,所以经济情况好这一因素可能导致了在此周边选址的银行更多。
因此我们平时做研究的时候主要识别a模型的关系,然后b模型和c模型的情况会对研究产生干扰,b模型是内生性问题,c模型是反向因果问题。所以显著相关的结果不一定是满足因果关系的,有可能是b或c的情况。
不显著的结果也并不意味着就没有因果关系了,因为因果关系可能比较复杂。比如说在探讨银行的竞争对企业的影响时,它可能是通过降低融资成本缓解融资约束,可能也是主要的关系借贷,所以有很多种时候解释变量和被解释变量之间有相互冲突的关系,所以统计回归出来的结果可能是不显著的,但并不意味着是没有因果关系的。
02 常见因果推断的模型
1. 控制变量法。
因为因果推断要排除其他的因素,把所有的对比对象之间的差异都控制和考虑到,从计量的角度来讲是在随机脑洞下的垃圾桶里面把垃圾桶里面相关的因素给它提取出来,减少估计偏差。
2. 双重差分法。
即在保持平行趋势的假定下拿控制组的情况来模拟实验组的情况。再就是形象得分匹配,根据样本的特征或者一些协变量来计算样本被处理的概率,协变量对应的处理概率是一样的,控制了控制组和实验组特征的差异。
3. 断点回归法。
比如高考的录取分数线,录取分数线是590分,那么589分没有被录取,591分被录取了,那么这两者是没有比较明显的差异的,但他们受教育的话会呈现出差异的情况。工具变量就是找出外生变量,再进行因果推断。
03 计量基础
推荐给博士、研究生的两本书:《基本有用的计量经济学》和《高级计量经济学与Stata运用》。
因为在做数据回归或者数据分析的时候,一些回归的方法你可能不知道具体是怎么推导出来的,但是你必须要知道它使用的条件,具体要去解决什么问题。
所以如果你要选择某种计量方法或者你面临某种数据的模型、结构要用特定的计量方法来解决的话,可以到这本书里面去找一下。
04 软件与熟练使用
从实证研究的角度来看,我自身用的比较多的是Stata,因为Stata在处理面板数据时有得天独厚的优势。
比如,从 CS码里面截取下来股票的资产负债率的数据,可以看到这个数据的结构里有股票代码时间对应的指标值,那么这个包含时间的数据就是所谓的面板数据。
面板数据基本上充斥于经济金融研究的方方面面,包括在这个图里面展示的上市公司,不同地区、时间的数据也可以说是一个面板的数据。
Stata里面有一个Merge的命令,可以把不同的面板按照股票代码和时间进行比较好的匹配,非常的方便。其他的模块,比如盈利水平或市值、资产总值,可以把前N年的数据都生成一个模块,具体做研究时,直接用 Merge命令,把之前已经处理好的模块合并起来,这样可以极大的提升处理数据和做实证的效率。
如果数据处理结果比较困难,可以先到百度或者人大经济论坛里面搜索,因为它有很多的外部命名,可以很方便的来帮助我们解决这个问题。
如果有关市场的微观结构、定价效率或崩盘风险这方面内容时,一般要做一个分组的回归,要根据股票的一段的时间来跑市场模型,回归的量非常大,那么循环的后面把它的回归系数结果提取出来,Stata里面就有外部的命名,可以直接进行分组的回归,然后提取系数。
像同时也要根据这个数据的需求选择一个恰当的软件,如Stata进行面板的数据或数据处理回归这方面有比较大的优势,而数字计算方面 Matlab更加好用一点。
05 数据收集
数据收集首先是研究数据,一般研究的数据就是CSMAR、Wind或者像一些特色的数据库 CNRDS等,可以从图书馆数据库的链接里面进去。
CSMAR包括上市公司的数据和各个区域发展的数据,而且CSMAR的数据对研究是非常友好的,因为它的数据形式对应的个体、指标值是一个长条的数据。然后Wind数据主要是给一些业内的机构来做交易或者分析的,所以它对研究就不是很友好,很多是一个宽数据。
但是Wind里面有一些特色的数据库是CSMAR里面没有的,像并购或者债券,还有我们之前做的国家队持股的数据在Wind里面都有比较系统的统计。CNRDS数据库里面也有一些比较独特的数据,像夜间灯光的数据或者产业政策的数据在里面都有比较好的一个归纳。
对文献收集来说,文献的阅读是非常重要的。文献阅读第一步是要先把文献给收集出来,图书馆的渠道是非常多的.再就是文献互助平台,如果你在图书馆的数据库里面找不到文献的话,可以直接登录你的邮箱通过高校的文献互助平台,一般会在一天之内就给你发过来。
大家尽量还是看一些权威渠道发表的文献,当然也不是说其他的文献不好,只是说权威期刊的文献可能让学习效率更高一点,因为很多权威文献会把相关研究的制度、背景或者相关研究的综述讲得特别清楚。
实证论文写作步骤
01 选题
选题的原则是问题导向、需求牵引。中国经济金融研究有个非常显著的特色,就是做出来的研究的最终目的是能够为我们国家的经济金融建设提供参考。实际的经济金融发展的时候到底面临了什么样的真问题、大问题,那么应该从哪些地方来找呢?
一个常用渠道就是二十大报告、中央经济的工作会议。二十大报告里有关于经济金融发展的一个章节,比如,提到国内大循环、国内国际双循环、高水平的对外开放、着力提高全额生产率、产业链供应链的韧性和安全水平和区域的协调发展等等。从近两年的文章来看,可以说发表在比较顶级期刊上的文章很多都逃不开这些。
还有中央的工作会议,每一年的经济会议都会对应介绍今年的经济工作重点。
比如,16年的中国中央工作经济会议,提出了几大任务,首要任务就是去产能,然后去产人。在去产能的通知里面把治理僵尸企业也作为去产能工作的首要的目标。
在2017年、2018年的时候,经济研究、管理世界、中国工业经济上面就出了特别多篇僵尸企业的危害或者说怎么来治理僵尸企业的文章。这就是从中央公共信息会议上面找的话题来做选题的比较好的例证。
此外,可以从我国经济金融的独特特征来出发。现在我们的主要方向就是要做中国特色的研究,因为中国的金融体系和西方的金融体系是完全不同。
比较显著的一个特征是我国金融体系里面银行是占主导的,从信贷的配置、社会融资的整体的结构来讲,人民币信贷占据非常大的一个比重。从我国金融结构来讲,人民币的信贷主要是来源于银行。
地方政府的融资都在很大程度上依赖于银行系统,所以有关于银行的研究在整个经济金融研究里面占据非常重要的地位。再就是财政与金融的配合,特别在疫情之后发展最快的是政策性的金融,体现了我国财政和金融的配合,也是我们中国社会主义市场经济体制下非常有特色的一个金融创新的内容。
再有关于资源配置,金融非常重要的功能就是跨空间、跨时期的进行资源配置,那么在资源配置里面我们国家现在提出市场发挥决定性的作用,然后更好的发挥政府的作用,特别是探讨市场和政府的关系。
其实这是贯穿整个改革发展的历程的,因为我们原来在改革开放之前是计划经济,之后推行市场经济,市场经济也不是一蹴而就的,是一个渐进性的改革的过程。
其实这也是我们国家明显区别于西方国家的一个点,一方面是主张要发挥市场的决定性作用,一方面政府应是有所作为的。
所以从怎么让政府和市场进行更好的配合这样一个角度的研究其实也是有非常大的意义的。当然还有很多关于政府政策的研究都会看在不同市场的环境下政府的政策是不是会有一定的效果差异,其实也是体现了市场与政府的协调配合的这样一个角度,其实这是可以增加文章的一个整体的经济的参考性。
02 制度背景与文献
关于选题方面的内容存在一个比较普遍的问题就是对制度背景的关注不够。制度背景的宽度不够,研究设计、理论机制的阐述都会出现问题,可能也会对你的选题有一定的影响。
文献阅读对做研究是非常重要的,最重要我认为是引言和理论机制的部分,特别是精读文献的语言和理论机制的部分可以让我们比较清晰的了解相关研究和制度背景的变化的历史脉络,如环保法庭的设立会带来的影响,物权法相关的研究的背景,产业政策有哪些措施、产业政策实施的历史。
了解这个信息后可以比较好的理清论文的贡献或构建一个理论的逻辑。因为我们一般说自己的论文的贡献都较大程度上建立在已有文献的基础上,包括模型设计、变量定义、控制变量的选择、稳健性检验方法等。
模型的选择和检验是做研究的时候,到底是要用多时点DID还是单时点DID或平行趋势。从文献来讲,评级假定检验可能有几种的方法,如画图法、回归法。
处理内生性问题的时候,文献里面也有一些比较好的方法,这就涉及到稳定性检验的方法。比如我之前有做过一个关于基金方面的研究,基金选择的公司也是与这个公司是有一定的相关性的,就是我们所说的内生性的问题。
工具变量的方法也就是基金与上市公司的总部的距离,因为基金可能对这个距离越近的上市公司了解的可能越多,就可能会影响它持股的行为。
所以文献阅读真的非常重要,包括如何构建研究,如何发现自己研究的贡献,如何梳理你的理论的逻辑,稳健性的方法如何设计等都可以在文献里面找到参考,关键是要多看多思,特别是要着重注意制度背景和这个理论部分延伸到研究里面。
03 理论分析
理论分析算是整个实证论文最为重要的基础部分,也是最容易出现问题的部分。理论分析一定要结合制度背景和文献的理论来构造,但很容易存在潜在问题。
比如数字金融总体来讲主要是信息不对称,还要提高金融供需双方的匹配效率,其实很多的研究话题其实跟这个理论是完全不相关的,但是他会往上面去套,这个就非常的牵强,整体理论逻辑的构建是存在漏洞的,研究做得再漂亮可能在经济原理上也是行不通或者说不可靠的。
潜在问题是银行的发展会影响企业融资,企业融资又会影响到创新逻辑链条,那么链条里面的不可控因素就非常的多,本来的影子银行到企业融资的时候就有其他的因素来干扰因果识别。
我们一般的逻辑链条都是a到b型,或者a到b到c型,最好不要超过三个节点。再谈渠道机制,渠道机制会发展出非常多的渠道机制,渠道之间可能会产生一定的相关性,那么最后这个问题就会讲不清楚。
潜在问题同时难以直接验证,做实证研究的目的是为了对我们提出的经济逻辑进行验证,所以自己进行发展理论分析或者发展研究假设的时候一定要注意,研究假设一定要是可以验证的,验证不了了就不最好就不要讲或者少讲,或者就干脆作为逻辑主要关键点的一个辅助,不要花费太多的篇幅。
04 实证设计
实证设计的整体目的是为理论分析来提供经验证据,一定是以理论分析为基准的,在实际的运行过程中其实是有两个门派的,先理论后实证还是先跑了数据再来讲理论。
但是从金教授来看,更加倾向于是先发展经济理论之后再来设计研究,如果先跑了真正的结果再去寻找理论,很可能本身设计就有问题或者理论构建是有牵强的。
如果实证研究完全是根据理论来设计的,实证与理论比较匹配,实证的结果的可靠性为也会提高。
比如DID实验组和控制组的选取,制度变革会对哪些样本产生差异性的影响。通过研究对象理论或者制度背景去选择的实验组,可以很大程度的增加研究的可信程度,也能避免学生的设计和研究的不匹配所产生的一些问题。
在进行实证研究设计的时候,一定要理解指标的经济含义。比如,一个叫资本配置效率,一个叫资源配置效率。
有的发展理论分析都是说的资源配置效率,资源配置效率的含义非常广,可能是同一个地区不同行业之间的资源配置,还有污染与非污染企业之间的资源配置,还有全国范围内不同行业之间的资源配置。
到底是哪一个层面的资源配置,资源配置还要分资本或者说其他的资源配置,到底是针对了哪一种的资源,所以不能笼统的讲一个资源配置,很可能就出现问题。
此外,要注意数据的结构,数据的结构带来结果合理性的问题。如果变量没有太大的差异或没有太大的变化就算得出了一个显著的结果,那么实际的经济意义可能就是不是很强。
还有数据处理的一些合理性,比如说我们国家的上市公司有停复牌,停复牌之后的第一个评估牌之后的交易日的涨跌幅限制是和其他的涨跌幅限制是不同的。
所以我们一般在处理资本市场研究的时候会把涨跌停负限制,就是收益率绝对是大于限制值,都删除掉。这也是数据处理的一些细节问题。
05 机制分析
就机制分析的话,它和理论分析有比较大的关联性。机制分析要明确分析目标,进一步理清机制分析的逻辑,机制分析和理论分析的关联性是一定要强的,比如我们做的文章是银行信贷与企业的债务决策,其实在理论里面就主要讲了市场力的假设、信息的假设。
市场力的假设是它会缓解企业融资约束性,增加企业的负债;信息的假说是会减少利用关系借贷的获取利润的可能性。
所以根据我们这两种理论来发展,既然它缓解了融资约束,提升了企业的负债,那么它一定是在融资约束高的企业里面作用会更强,那么一定是在不同的信息不对称的环境下结果会存在差异。
在机制分析中,尽量不要用中介效应,因为中介效应会面临逻辑链条过长的问题,其实有一定的共通性,比如影子银行到企业融资,企业融资又到企业创新,如果这是中介的关系,本来企业的融资、企业的创新会受到很多的因素的影响,一条逻辑关系用中介的关系是很难把它表示出来的,除非你能对它的内生性做一个比较好的缓解,但实际上在具体的研究过程中的话是很难做到的,从本质上来讲是内生性问题。
一般来说创新和全额生产率之间是正相关的关系,比如说一个研究对象提高了全校生产率,创新可能是一个渠道,那么可能直接验证研究对象对创新的影响,然后通过论述是说创新是全额生产率提升的主要来源。这个方面相当于做了一个补充的证据来验证逻辑的关系。
而调节效应就是在不同环境下所研究对象的效应是存在差异的,但是设定的环境最好不要与所研究的解释变量具有非常明显的内生关系,比如之前的一个文章其实做机制分析的时候把整个样本中国的转融券强度高的或者转融券强度低的,强度高了之后投机会更强,但是它本身的测度变量和所研究的转融通存在比较大的关联性。所以这样一个内生的环境变量会导致逻辑不清晰。
06 拓展研究
有关于扩展研究:现在很多研究都喜欢做异质性分析,但异质性的分析有很多是为做而做。异质性分析应该是有一定的理论的作用,最关键的是说够为理论分析提供一些间接的证据或者说具有明确的政策含义。
如果一个融资约束的渠道一定是会对投资不足的也有更大的影响,把投资不足和过度投资的分开来做一下异质性的分析,就可以为理论机制提供间接的证据。
关于政策的含义,提到选题的时候也提到关于政府与市场的协调的配合,比如说研究政策的时候,不同的市场环境下政府的政策的作用是不是有差异。这些结果可以让整个的故事更加的丰满,也可以为前文结果提供一些企业的辅助证据。
一篇好的文章通常是在回归的基础上通过扩展研究把内容做大做广,但是也不要完全脱离了这个理论的框架,这里要把握一个度。
审稿意见关注重点
选题动机和制度背景阐述是否清晰。
是否与已有文献进行了充分对比。
研究内容是否充实,为什么有增量贡献?
两次放宽管制,银行主导,银行市场化进程。
银行分支机构空间分布变化。
银行竞争测度指标。
信贷资源配置效率 (补充)
政策意义。
国家队持股的贡献阐述,政府干预的差异,风险测度的恰当性,稳定市场的政策意义。
转自:“经管学苑”微信公众号
如有侵权,请联系本站删除!