经验|浅谈相关分析与回归分析的关系
2023/9/8 15:13:50 阅读:33 发布者:
相关与回归
相关分析和回归分析是数理统计中两种重要的统计分析方法,在实际生活中应用非常广泛。两种方法从本质上来讲有许多共同点,均是对具有相关关系的变量,从数据内在逻辑分析变量之间的联系,但同时二者存在不同。相关分析可以说是回归分析的基础和前提,而回归分析则是相关分析的深入和继续。当两个或两个以上的变量之间存在高度的相关关系时,进行回归分析寻求其相关的具体形式才有意义。从本质分析了相关分析和回归分析,并比较两种之间的异同,结合生活中的例子,进一步讨论了利用相关分析和回归分析的前提并得出相关结论。
相关关系
相关系数是研究变量间线性相关程度的量。它最早由统计学家卡尔 · 皮尔逊提出,一般用 r 表示。
相关分析与我们的生活联系十分密切,许多问题都可以用相关关系来描述,如 一 个 同 学 看 书 的 时 间与学习成绩,收入水平和受教育 程 度 等 均 可 以 利 用 相 关分析。
相关分析有许 多 分 类,按相关的因素分为单相关与复相关(多元相关)、按相关形式可分为线性相关(直线相关)和非线性相关(曲线相关)、按相关的方向可分为正相关和负相关、按相关的程度可分为完全相关、不完全相关和不相关。
针对不同情形,按需求选取合适的相关方法可以更好的描述变量之间的关系。在 评 价 相 关 性 时通常引用相关系数r,一般来讲,相关系数介于-1~1之间,若r为正则表明两者正相关,反之为负相关。同时,如果相关系数越接近与1(或-1),则表明两者相关性越强;越接近与0,则表明两者相关性越弱(r=0意味着不相关)。
回归分析
“ 回归”是 英 国 生 物 学 家 高 尔 顿 提 出,他 在 研 究 人类遗传问题时对试验数据进 行 了 分 析,发 现 了 许 多 数 据间具有回归效 应。
回归分析研究因变量对于一个或多个其他变量的依赖关系,并在过程中依据现象之间的相关形态,利用数学模型进行模拟,通过数学表达式来反映数据之间的回归关系,并可以得到与之对应的回归方程,来近似地反映变量之间联系 的 紧 密 程 度,可 以 从 数 量 上近似地反映变量之间变动的 一 般 规 律,是 一 种 常 用 的 统计分析方法。建立的数学模型也就是回归方程,实际上它将相关关系之间的不确定和不规则的数量一般化,从而更好的适 用 实 际 问 题 的 解 决。
回归分析按照 涉 及 自 变 量 的 多 少,分 为 一 元 回 归 分析和多元回归分析。其中,一元回归分析是对一个因变量和一个自变 量 建 立 回 归 方 程;与 之 对 应,多 元 回 归 分析是对两个或两个以上的自变量和一个因变量建立回归方程。
按照回归方程的表现形式,分为线性回归分析和非线性回归 分 析。如果自变量和因变量之间的关系是线性相关的,建立直线方程便可以反映,这种分析称为线性回归分析。如果自变量和因变量之间的关系是非线性相关的,那么通过建立非线性回归方程可以较为准 确的反映两者之间关系,即非线性回归分析。
常用的回归分析方法有线性回归、logistic回归、cox回归、poission回 归、probit 回 归,等 等。同 时,卡 方 检 验 可 以 用logistic回归代替,t检验以及方差分析也可以归到回归分析当中。
相关分析与回归分析的 相同点
对于相关分析与回归分析,这二者之间是有一定联系的。它们都是用来研究变量之间关系的统计学方法。可以说,相关分析是回归分析的基础,回归分析是相关分析的深入和继续。现实中,在分析数据时我们往往先通过相关分析来确定变量间的相关程度,再通过回归分析深入研究建立数学模型。若使用回归分析前没有对变量进行相关分析,则很难保证变量间有很强的相关关系,则此时进行回归分析时得出的结论往往不准确,易造成错误,此时我们成这种错误为虚假回归。如,欲研究手机待机时间与使用者年龄之间的关系时,倘若先不对其进行相关分析而直接进行回归分析,则就会将这两种毫无关系的变量强行联系在一起,产生了虚假回归,得到错误结论,对消费者进行误导。故应把这两种分析方法结合使用,以达到准确研究和分析的目的。
相关分析与回归分析的 不同点
相关分析中,变量间关系对等,即不存在确定的因果关系,不存在一个变量因为另一个变量的变化而变化,也没有自变量与因变量之分。而回归分析变量间的关系不对等,变量与变量之间存在一定因果关系。相关关系只是用以确定变量之间是否存在一定的联系,并简单的研究这两个变量间的相关关系,并不能确定具体的变量变化趋势,所以我们说相关分析中无固定的自变量与因变量。而回归分析中,自变量是确定的,而因变量是随自变量的变化而变化的,且自变量与因变量的关系往往不能互换,一个自变量往往受到多个因变量的影响,且通过数据分析得到的回归方程往往与实际不相等,存在一定的波动。相关分析的相关系数是惟一确定的,即对于相关分析来说只有一个衡量标准,相关系数只有一个且惟一确定,
而且我们在分析数据时只考虑相关系数 ;而回归分析中的变量关系并不惟一确定,回归分析中往往会具有两个或两个以上的衡量标准。回归分析变量之间具有因果性,因变量会随自变量的变化而变化,且因变量往往受多个自变量的影响,故可能出现多个回归方程。
综上所述,相关分析只是用来研究变量间相关关系的方法,不能定量分析数据而回归分析为我们定量分析数据提供了一种方法比。在相关分析的基础上对数据进行回归分析,比仅仅通过相关分析得出的结论更加准确。所以这种建立回归模型的方法也被应用到我们日常生活的许多地方中。不仅如此,随着时代的发展,人们对回归分析的研究还有望加深,从而改进现在的建立应用回归模型的技术手段,所以,深入探究回归分析也不乏具有一定现实意义。
来源:spss学习乐园
转自:“斐然智达SCI学术服务”微信公众号
如有侵权,请联系本站删除!