对于模型、实证分析一窍不通，该怎么写一篇带实证分析的论文？

2024/9/23 9:56:21　阅读：275　发布者：

实证分析的过程就是利用模型拟合数据达到自己预期的结果，论文实证的模型主要有：普通回归，静态面板回归，动态面板回归，门槛回归，断点回归，两阶段回归，双重差分回归，分位数回归，逻辑回归，空间回归，结构方程还有时间序列等一系列的处理方法；确定权重计算综合得分的模型主要有因子分析，主成分分析，熵值法，层次分析法还有综合迷糊评价法等等，本科生应用的模型可以稍微简单一些，普通回归，静态面板回归就差不多了，研究生毕业论文的模型要复杂一些，目前门槛和断点模型运用的比较广泛

实证部分最重要应该最先写：

为什么说实证部分最重要应该最先写呢，第一，实证不通过整篇文章是没有意义的，没有写下去的必要，可能需要更换主题；

第二，实证一旦通过，你最担忧的问题已经解决，并且你已经读了一些的文献，你对研究的主题有了较深的认识，整篇文章你已经做到了心中有数。

因此，各位同学，如果有实证要求，请一定先写实证部分，即使不写，也要把数据处理的结果先做出来。

模型有三个层次:

第一个层次

简单的图表和指标，一般的问卷调查结果的展示都会采取这种方式，生动形象。

第二个层次，描述性统计，分析数据分布特征。

第三个层次，计量分析，建立模型。而计量分析又可以分为几个层次，第- - .层次是简单回归，包括双变量、多元回归，基本计量问题(共线性、异方差、自相关)的处理。

第二层次更专业点儿

包括模型设定误差检验与模型修正、特殊数据类型(时间序列、虚拟变量、面板数据等)的模型选择和处理、联立方程、VEC模型、VAR模型、条件异方差模型等;第三层次包括有序因变量、面板VAR、神经网络、分位数模型、季节调整模型等等。模型，建立一套研究范式，然后按此模型进行研究

关键的实证分析部分（经管类实证举例）

第一步，下载stata，目前建议选择15.1或者16.0两个版本，后者功能更多点，但前者就够用啦～下载途径建议直接找同学分享安装包或者闲鱼购买，简单省事花不了几块钱。如果去经管之家找比较麻烦，一般要论坛币，网页找的盗版或者其他软件居多。

第二步，下载所需数据。经管类的数据一般在国泰安数据库下载，先挂学校vpn，然后直接搜索国泰安可找到，进入过后选择数据中心——单表查询（跨表查询需要个人账户，一般用单表查询后用excel进行数据合并），然后选择右上角的搜索框，输入想要查询的数据即可。

对于数据的查询下载，提几点建议：

多下载几年的数据，比如10年，这样后续处理过程如果样本量太少，不用重复下载。输出类型一般默认为excel2007。

有些查询内容学校没有开通购买，此时可以通过闲鱼代查，淘宝购买某某图书馆账号（几人共用）或者分析内容的构成要素，自己后期计算也行。例如我控制变量之一的第一大股东持股比例，直接搜索“第一大股东持股比例”可以找到，但是学校没有购买，最后是用十大股东里的股东持股比例排名间接得到的。

如果只需要下载年度数据，可以设置以下的条件筛选：

第三步，用excel或者stata将下载好的excel数据整理成面板数据。面板数据是指多个公司代码不同年份对应数据的整合，如下图所示。（stkcd为公司代码，这里处理成了数值型数据）

第四步，学习使用stata部分。如果只是为了应付本科论文，建议看B站的up主分享的操作视频即可，（最好请一个学会stata的同学给你讲解，方便随时问问题）如果是为了系统学习stata，建议学习连玉君老师的教学视频，计量软件，连老师是专业的。

第五步，调整显著性。这个是整个实证分析中最耗时也可能最不耗时的部分，回归显著还好说，不显著真的会很难顶。。。我本来有6个假设，最后删除到只剩3个假设。。。因为另外3个怎么也调不显著，哭唧唧所以在前面假设中建议多做几个假设，从而多下载相关数据，免得后期调整特别麻烦。调整的方法有很多，最常用的是缩尾处理，增加或减少样本量，解释变量滞后一期三种方式。

第六步，整理实证结果。不同的stata命令显示出来的相关性分析，回归结果等有细微差别，此时需要自己手动整理成标准格式，标准格式以参考文献为主。

以上实证分析就完成啦！

实证研究中常常忽视的一个点：该如何将“控制变量”的选择进行到底

在实证分析中，我们常常重视因变量和自变量的选取和定义，而忽视控制变量的选取的重要性。但是，我们不能轻视的是，控制变量也是实证研究中重要的一环，能否选取合适的控制变量对你的文章撰写质量尤为重要。

最近，有朋友粉丝讨论，他们在投稿时遇到了“控制变量”如何选择的问题，这类问题包括：什么控制变量需要纳入、什么控制变量可以剔除，或者如何去寻找适合主题的控制变量。

显然，做好控制变量的选择，是咱们在实证研究中非常重要的一件事情！如果在选择过程中，控制变量的选定没有做到有理有据，可能会被学术同仁或者审稿人群质疑，甚至拒稿。

从实证研究角度来看，在回归分析中控制变量的作用是毋庸置疑的。

日常的实证回归分析，我们主要目的在于讨论因变量和自变量之间的因果关系，但是一个回归分析模型又并不是只能有自变量和因变量，毕竟因变量的产生还可能受到其他因素的影响或干扰。

在一定程度上来说，如果对控制变量予以控制，可能会存在一下两个方面的问题：一是忽视其他因素影响，从而带来放大自变量影响的潜在问题；二是实证研究中常见的遗漏变量问题，模型忽视了其他重要因素的影响，由此可能导致因变量和自变量之间的内生性问题。当然，上述两个问题之间也可能存在紧密的联系。

虽然在实证研究中我们十分重视控制变量的选定问题，但是我们需要注意的是，并不是所有的因变量影响因素都要纳入，这显然会给我们研究带来极大的困难。所以，在选择控制变量时

我们需要注意几个问题：

一是控制变量的选定应围绕因变量来产生确定，而不能天马行空，随意搭配；

二是控制变量的选定避免随意摘取的心态，毕竟因变量的影响因素较多，需要有条件或者有据可依地选择确定；

三是控制变量的选定不是越多越好，你要知道任何一个经济现象产生（因变量）都可能是由千万个因素影响产生的，我们所能做的工作就是从其中选定某些重要因素开予以控制，控制变量就对因变量产生重要影响的因素来确定；四是控制变量的选定需要有理有据，可以有理论依据，也可以经验优先，不能无中生有地确定控制变量。

为此，在实证研究中，我们该如何才能更好地去选择控制变量呢？它们的确定选取有什么途径或者解决方案呢？

一是参考已有权威文章或者学者专家的研究，通过阅读已有权威文章来借鉴他们的模型设计，从已有文献资料中确定你需要控制哪些因素。当然，这种方法对你来说可能比较简便易行，很容易做到有据可循，仅仅寻找同类因变量的文献即可。

二是根据因变量产生或者可能受到影响的因素，这就需要对相关理论知识予以掌握和吃透，从现有的理论依据中寻找我们模型中需要予以控制哪些因素，且选定哪些因素是我们重点关注的对象，并将这些重点因素作为控制变量选定目标的最优选择集。

三是通过常识经验来分析判断，并以此来确定控制变量，这也是一种不错的方案，但是往往存在受到挑战质疑的风险，这是为什么呢？有的学术问题研究避免个人的主观臆断，经验虽然重要，但是个人主观意识太强，难以再学术交流上令人信服，所以在运用该方法时需要你强化理论阐述，多引用文献资料予以支持。

目前大数据行业的从业者通常有三种收集数据的手段，

第一种是通过互联网来收集信息，这种方式是最基本的数据收集方式，虽然互联网数据本身存在真假难辨等问题，但是从大的方面来看，互联网数据对于行业发展的趋势预测具有重要的意义，所以不少大数据公司都比较注重互联网数据的收集和分析，一些行业分析报告也会依赖于互联网信息的分析结果。

第二种收集信息的方式是与行业企业的合作，这种方式是目前获取高附加值信息的重要手段，也是比较有效的手段。比如行业企业想进行大数据改造，但是自身的技术能力又不允许，同时还想降低大数据改造的成本，此时通过自身的数据来于大数据企业进行合作是比较不错的选择。

目前行业内的数据合作范围还是比较广泛的，当然数据合作本身也存在一定的风险，通常数据在交换的过程中往往会经过一系列技术操作，最常见的操作就是“脱敏操作”。对于一些涉及到个人隐私的数据，脱敏是必须进行的操作，但是脱敏操作并不会影响大数据分析的进行，所以脱敏并不意味着数据价值的降低。实际上，在脱敏的过程中，还可以对数据进行一定的整理操作（清洗、归并等），从而方便进行数据分析。

随着大数据的重要程度不断提升，目前一些掌握在管理部门手中的数据，也陆续开放了出来，这些数据对于大数据从业者来说也非常重要，而且这些数据的价值密度往往也比较高，这也是促进大数据发展的一个重要手段

转自蓝境数据微信公众号，仅作学习交流，如有侵权，请联系本站删除！

上一篇： 一个优秀的毕业论文框架怎么写？
下一篇： 如何让论文实证结果一次就显著

投稿问答最小化 关闭

对于模型、实证分析一窍不通，该怎么写一篇带实证分析的论文？

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化 关闭

对于模型、实证分析一窍不通，该怎么写一篇带实证分析的论文？

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化关闭