一·
基本描述分析
基本描述分析是对数据进行初步的描述和概括,包括频数分析、描述分析和分类汇总。
01
频数分析
用于分析定类数据,如性别、年龄等,通过频数、百分比、饼图等形式展示数据的分布情况。
02
描述分析
针对定量数据,如收入、分数等,通过平均值、标准差、最大值、最小值、中位数等指标来描述数据的集中趋势和离散程度。
03
数据分布探索
研究不同分类时的汇总情况,如按地区分类汇总销售额,以了解各地区的销售差异。
二·
差异关系分析
差异关系分析用于比较不同组或类别之间的差异,常用的方法包括方差分析、t检验和卡方检验。
01 方差分析
用于比较两个或两个以上总体的均值是否存在显著差异,适用于定类数据与定量数据之间的差异关系研究。
02 t检验
用于比较两个总体的均值是否存在显著差异,特别是当数据不满足正态分布或方差齐性时,可使用非参数t检验。
03 卡方检验
用于分析定类数据与定类数据之间的差异情况,如检验两个分类变量的独立性。
04 非参数检验
当数据不满足参数检验前提条件时使用。
三·
相关关系分析
相关关系分析用于研究变量之间的线性或非线性关系。常用的相关分析方法包括Pearson相关、Spearman相关和Kendall相关等。
这些方法根据数据的类型和分布特征的不同而有所区别,可用于判断变量之间是否存在相关性以及相关性的强度和方向。
01
散点图
相关分析之前,查看X和Y之间的关系情况。
02
相关分析
Pearson相关(正态性)、
Spearman相关(不满足正态性)、Kendall相关(一致性)。
四·
影响关系分析
影响关系分析用于研究自变量对因变量的影响。常用的方法包括回归分析、logit回归分析和非线性回归分析等。
这些方法能够建立数学模型,描述自变量和因变量之间的关系,并预测因变量的变化趋势。
01 线性回归
因变量Y为定量数据时使用。
02 Logistic回归
构建多个X与多个Y之间的影响关系模型。
03 路径分析
构建多个X与多个Y之间的影响关系模型。
04 结构方程模型
构建多个X与多个Y之间的影响关系模型,同时包括测量关系和影响关系。
05 中介/调节效应
研究X对Y的影响时,是否受到中介变量或调节变量的影响。
五·
信息浓缩方法
信息浓缩方法旨在将大量的数据或信息简化为少数几个关键指标或变量,同时尽可能保留原始信息的核心内容。常见的信息浓缩方法。
01
因子分析
一种统计技术,用于识别数据中的潜在变量或“因子”,这些因子能够解释原始变量之间的相关性。因子分析通过旋转功能,有助于对因子进行命名和解释。
02
主成分分析(PCA)
通过降维手段把多个变量化为少数几个主成分,这些主成分能够反映原始变量的绝大部分信息。主成分通常表述为原始变量的某种线性组合。
六·
聚类分析方法
聚类分析是一种无监督学习方法,用于将相似的对象分组,形成多个类别或簇。
常见的聚类分析方法包括K-means聚类、K-modes聚类和K-prototype聚类等,这些方法根据数据类型和聚类需求的不同而有所区别。
01 K-means聚类
按样本进行聚类,对定量数据进行聚类。
02 K-modes聚类
按样本进行聚类,对定类数据进行聚类。
03 K-prototype聚类
按样本进行聚类,对混合型数据(定类和定量)进行聚类。
04 分层聚类
按变量(标题)进行聚类,对定量数据进行聚类。
七·
综合评价相关方法
综合评价涉及多个指标或变量的评估。
01
TOPSIS法
比较评价对象与理想解之间的距离,得出评价对象的优劣程度。
02
熵权TOPSIS法
熵值法与TOPSIS法结合。
03
模糊综合评价
通过模糊数学理论,综合评价对象的多个方面。
八·
权重计算相关方法
九·
其他分析工具
01 多选题分析
多选题分析涉及对多个选项的数据进行处理和解释。
常见的分析方法包括频次分析、交叉分析和卡方检验等。这些方法有助于了解选项的分布情况、选项之间的关系以及选项与总体特征之间的关联。
02 信度分析(只针对量表题)
信度分析用于评估测量结果的稳定性和一致性。
常用的信度分析方法包括Cronbach α信度系数法、折半信度法和重测信度法等。
这些方法通过计算不同测量之间的相关系数或一致性系数,来评估测量结果的可靠性。
03 效度分析
效度分析用于评估测量结果的准确性和有效性。效度可分为内容效度、结构效度、区分效度和聚合效度等。
内容效度:关注测量内容是否覆盖了研究领域的关键方面。
结构效度:评估测量工具的结构是否合理。
区分效度:用于检验不同概念或变量之间的区分程度。
聚合效度:关注测量工具是否能够准确反映所测量的概念或变量。
转自毅懂学术微信公众号,仅作学习交流,如有侵权,请联系本站删除!