很多同学对于毕业论文中的数据分析非常头疼,今天给大家介绍下研究生论文常用的数据分析方法:
一、相关分析
相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。例如,人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题。
1、单相关:是指两个变量之间的相关关系。如产品产量与单位产品成本之间的关系等。只有一个因变量和自变量。
2、复相关:是指一个变量与另外两个或两个以上变量之间的相关关系。
3、偏相关:在某一现象与多种现象相关的场合,两个随机变量在排除了其余部分或全部随机变量影响情形下,称为偏相关。
二、方差分析
通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。各研究来源必须是相互独立,且各总方差相等。
1、单因素方差分析:研究中只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系。
2、多因素有交互方差分析:有两个或者两个以上的因素对因变量产生影响,同时考虑多个因素之间的关系。
3、多因素无交互方差分析:分析多个因素与因变量的关系,但是各因素之间没有影响关系或忽略影响关系。
三、回归分析(常用)
可以分为:1、一元线性回归分析:只有一个自变量x与因变量v有关,x与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
2、多元线性回归分析:使用条件:分析多个自变量与因变量Y的关系,x与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。
1)变呈筛选方式:选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法
2)横型诊断方法:
A.残差检验:观测值与估计值的差值要艰从正态分布
B.强影响点判断:寻找方式一般分为标准误差法、Mahalanobis 距离法
C.共线性诊断:
诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针cl、方差比例
处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等
3、Logistic 回归分析线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况。
4、其他回归方法非线性回归、有序回归、Probit 回归、加权回归等。
四、因子分析
因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量。并估计隐形变量对可测变量的影响程度以及潜在因子之间的相关性的分析。
与主成分分析比较:相同:都能够起到济理多个原始变量内在结构关系的作用。不同:主成分分析重在综合原始变适的信息.而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法
1)减少分析变量个数
2)通过对变量间相关关系探测,将原始变量进行分类
五、典型相关分析
相关分析一般分析两个变里之间的关系,而典型相关分析是分析两组变里(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。
典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。
六、其他分析方法
多重响应分析、距离分祈、项目分祈、对应分祈、决策树分析、神经网络、系统方程、蒙特卡洛模拟等。
转自“专家论文指导”微信公众号,本文仅作为学术交流分享,如有侵权,请联系本站删除!