投稿问答最小化  关闭

万维书刊APP下载

对于模型、实证分析一窍不通,该怎么写一篇带实证分析的论文?

2024/9/23 9:56:21  阅读:4 发布者:

实证分析的过程就是利用模型拟合数据达到自己预期的结果,论文实证的模型主要有:普通回归,静态面板回归,动态面板回归,门槛回归,断点回归,两阶段回归,双重差分回归,分位数回归,逻辑回归,空间回归,结构方程还有时间序列等一系列的处理方法;确定权重计算综合得分的模型主要有因子分析,主成分分析,熵值法,层次分析法还有综合迷糊评价法等等,本科生应用的模型可以稍微简单一些,普通回归,静态面板回归就差不多了,研究生毕业论文的模型要复杂一些,目前门槛和断点模型运用的比较广泛

实证部分最重要应该最先写:

为什么说实证部分最重要应该最先写呢,第一,实证不通过整篇文章是没有意义的,没有写下去的必要,可能需要更换主题;

第二,实证一旦通过,你最担忧的问题已经解决,并且你已经读了一些的文献,你对研究的主题有了较深的认识,整篇文章你已经做到了心中有数。

因此,各位同学,如果有实证要求,请一定先写实证部分,即使不写,也要把数据处理的结果先做出来。

模型有三个层次:

第一个层次

简单的图表和指标,一般的问卷调查结果的展示都会采取这种方式,生动形象。

第二个层次,描述性统计,分析数据分布特征。

第三个层次,计量分析,建立模型。而计量分析又可以分为几个层次,第- - .层次是简单回归,包括双变量、多元回归,基本计量问题(共线性、异方差、自相关)的处理。

第二层次更专业点儿

包括模型设定误差检验与模型修正、特殊数据类型(时间序列、虚拟变量、面板数据等)的模型选择和处理、联立方程、VEC模型、VAR模型、条件异方差模型等;第三层次包括有序因变量、面板VAR、神经网络、分位数模型、季节调整模型等等。模型,建立一套研究范式,然后按此模型进行研究

关键的实证分析部分(经管类实证举例)

第一步,下载stata,目前建议选择15.1或者16.0两个版本,后者功能更多点,但前者就够用啦~下载途径建议直接找同学分享安装包或者闲鱼购买,简单省事花不了几块钱。如果去经管之家找比较麻烦,一般要论坛币,网页找的盗版或者其他软件居多。

第二步,下载所需数据。经管类的数据一般在国泰安数据库下载,先挂学校vpn,然后直接搜索国泰安可找到,进入过后选择数据中心——单表查询(跨表查询需要个人账户,一般用单表查询后用excel进行数据合并),然后选择右上角的搜索框,输入想要查询的数据即可。

对于数据的查询下载,提几点建议:

多下载几年的数据,比如10年,这样后续处理过程如果样本量太少,不用重复下载。输出类型一般默认为excel2007

有些查询内容学校没有开通购买,此时可以通过闲鱼代查,淘宝购买某某图书馆账号(几人共用)或者分析内容的构成要素,自己后期计算也行。例如我控制变量之一的第一大股东持股比例,直接搜索“第一大股东持股比例”可以找到,但是学校没有购买,最后是用十大股东里的股东持股比例排名间接得到的。

如果只需要下载年度数据,可以设置以下的条件筛选:

第三步,用excel或者stata将下载好的excel数据整理成面板数据。面板数据是指多个公司代码不同年份对应数据的整合,如下图所示。(stkcd为公司代码,这里处理成了数值型数据)

第四步,学习使用stata部分。如果只是为了应付本科论文,建议看B站的up主分享的操作视频即可,(最好请一个学会stata的同学给你讲解,方便随时问问题)如果是为了系统学习stata,建议学习连玉君老师的教学视频,计量软件,连老师是专业的。

第五步,调整显著性。这个是整个实证分析中最耗时也可能最不耗时的部分,回归显著还好说,不显著真的会很难顶。。。我本来有6个假设,最后删除到只剩3个假设。。。因为另外3个怎么也调不显著,哭唧唧 所以在前面假设中建议多做几个假设,从而多下载相关数据,免得后期调整特别麻烦。调整的方法有很多,最常用的是缩尾处理,增加或减少样本量,解释变量滞后一期三种方式。

第六步,整理实证结果。不同的stata命令显示出来的相关性分析,回归结果等有细微差别,此时需要自己手动整理成标准格式,标准格式以参考文献为主。

以上实证分析就完成啦!

实证研究中常常忽视的一个点:该如何将“控制变量”的选择进行到底

在实证分析中,我们常常重视因变量和自变量的选取和定义,而忽视控制变量的选取的重要性。但是,我们不能轻视的是,控制变量也是实证研究中重要的一环,能否选取合适的控制变量对你的文章撰写质量尤为重要。

最近,有朋友粉丝讨论,他们在投稿时遇到了“控制变量”如何选择的问题,这类问题包括:什么控制变量需要纳入、什么控制变量可以剔除,或者如何去寻找适合主题的控制变量。

显然,做好控制变量的选择,是咱们在实证研究中非常重要的一件事情!如果在选择过程中,控制变量的选定没有做到有理有据,可能会被学术同仁或者审稿人群质疑,甚至拒稿。

从实证研究角度来看,在回归分析中控制变量的作用是毋庸置疑的。

日常的实证回归分析,我们主要目的在于讨论因变量和自变量之间的因果关系,但是一个回归分析模型又并不是只能有自变量和因变量,毕竟因变量的产生还可能受到其他因素的影响或干扰。

在一定程度上来说,如果对控制变量予以控制,可能会存在一下两个方面的问题:一是忽视其他因素影响,从而带来放大自变量影响的潜在问题;二是实证研究中常见的遗漏变量问题,模型忽视了其他重要因素的影响,由此可能导致因变量和自变量之间的内生性问题。当然,上述两个问题之间也可能存在紧密的联系。

虽然在实证研究中我们十分重视控制变量的选定问题,但是我们需要注意的是,并不是所有的因变量影响因素都要纳入,这显然会给我们研究带来极大的困难。所以,在选择控制变量时

我们需要注意几个问题:

一是控制变量的选定应围绕因变量来产生确定,而不能天马行空,随意搭配;

二是控制变量的选定避免随意摘取的心态,毕竟因变量的影响因素较多,需要有条件或者有据可依地选择确定;

三是控制变量的选定不是越多越好,你要知道任何一个经济现象产生(因变量)都可能是由千万个因素影响产生的,我们所能做的工作就是从其中选定某些重要因素开予以控制,控制变量就对因变量产生重要影响的因素来确定;四是控制变量的选定需要有理有据,可以有理论依据,也可以经验优先,不能无中生有地确定控制变量。

为此,在实证研究中,我们该如何才能更好地去选择控制变量呢?它们的确定选取有什么途径或者解决方案呢?

一是参考已有权威文章或者学者专家的研究,通过阅读已有权威文章来借鉴他们的模型设计,从已有文献资料中确定你需要控制哪些因素。当然,这种方法对你来说可能比较简便易行,很容易做到有据可循,仅仅寻找同类因变量的文献即可。

二是根据因变量产生或者可能受到影响的因素,这就需要对相关理论知识予以掌握和吃透,从现有的理论依据中寻找我们模型中需要予以控制哪些因素,且选定哪些因素是我们重点关注的对象,并将这些重点因素作为控制变量选定目标的最优选择集。

三是通过常识经验来分析判断,并以此来确定控制变量,这也是一种不错的方案,但是往往存在受到挑战质疑的风险,这是为什么呢?有的学术问题研究避免个人的主观臆断,经验虽然重要,但是个人主观意识太强,难以再学术交流上令人信服,所以在运用该方法时需要你强化理论阐述,多引用文献资料予以支持。

目前大数据行业的从业者通常有三种收集数据的手段,

第一种是通过互联网来收集信息,这种方式是最基本的数据收集方式,虽然互联网数据本身存在真假难辨等问题,但是从大的方面来看,互联网数据对于行业发展的趋势预测具有重要的意义,所以不少大数据公司都比较注重互联网数据的收集和分析,一些行业分析报告也会依赖于互联网信息的分析结果。

第二种收集信息的方式是与行业企业的合作,这种方式是目前获取高附加值信息的重要手段,也是比较有效的手段。比如行业企业想进行大数据改造,但是自身的技术能力又不允许,同时还想降低大数据改造的成本,此时通过自身的数据来于大数据企业进行合作是比较不错的选择。

目前行业内的数据合作范围还是比较广泛的,当然数据合作本身也存在一定的风险,通常数据在交换的过程中往往会经过一系列技术操作,最常见的操作就是“脱敏操作”。对于一些涉及到个人隐私的数据,脱敏是必须进行的操作,但是脱敏操作并不会影响大数据分析的进行,所以脱敏并不意味着数据价值的降低。实际上,在脱敏的过程中,还可以对数据进行一定的整理操作(清洗、归并等),从而方便进行数据分析。

随着大数据的重要程度不断提升,目前一些掌握在管理部门手中的数据,也陆续开放了出来,这些数据对于大数据从业者来说也非常重要,而且这些数据的价值密度往往也比较高,这也是促进大数据发展的一个重要手段

转自蓝境数据微信公众号,仅作学习交流,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com