数据收上来要如何分析

2022/4/28 16:34:27　阅读：477　发布者：

原创幼教学术青年论坛幼教学术青年论坛 2022-04-11 13:29

任何事物都是质和量的统一，教育现象也是如此。因此探讨教育规律时，我们既要掌握事物质的规定性，又要掌握事物量的规定性，这就要求对搜集的资料进行定性、定量分析。对于数据的处理，初学者往往存在很多误解。定性分析绝对不是一种模糊的、包罗万象的方法概念，而是一个有一定科学规范和明确要求的分析方法。定量分析亦如此。

引言

很多时候，数据刚一收上来，开心之余却不知从何下手。首先，我们需要理清思路，搞清楚数据分析的方向。这个时候，你可以问问自己：这是属于质性还是量化类型的数据？如果是质性类型的数据，要进行定量还是定性的分析？一般而言，量化数据只能采用定量分析，而质性数据却可以采用定量或定性两种不同的处理方法。

质性研究及其数据：质性研究是研究者通过发掘和观察问题，深入了解事物的本质，往往采用深度访谈和田野调查等途径来收集数据，这些数据难以用数字来衡量，通常用主题、模式和故事来表达内容特征(陈向明，2000)。任何形式的内容都可以进行分析，但在分析之前，这些不同形式的内容往往被转化为书面文字。这些内容的来源可以是印刷出版物（报纸、杂志文章、书籍等）、广播媒体（新闻等）、其他媒介记录（照片、图画、视频等）、其他文本记录（网页、广告、海报等）、现场情境（演讲、访谈等）和观察得到的信息（表情、动作、姿态、空间、物品等）。对质性数据进行定量分析时，研究者会关注数据中某些词语或模式出现的频率，根据频率进行分析并做出结论，其结果往往是数字和百分比。对质性数据进行定性分析时，研究者普遍采用编码的方式，其结果往往是类别和主题。

量化研究及其数据：量化研究指的是采用统计学或计量学的方法来对社会现象进行系统性的实证考察，往往采用社会调查、实验研究和结构性观察等途径来收集数据，这些数据最终以数字形式呈现 (Wiersma, 1995)。研究结果的汇报也以数据结果的呈现为重点。

壹

质性数据的分析

我们一般采用编码的方式对质性数据进行处理。编码是组织和分类数据的过程，在连接数据收集和解释数据时，编码成为开展分析的基础，在这个过程中，研究者用代码来标记、编译和组织数据。如果是将编码用于后期的定量分析，那么就属于质性数据的定量分析。如果编码被汇总成为不同的主题，这些主题共同构成研究的发现，那么这就属于质性数据的定性分析。

（一）质性数据的定性分析

总的来说，定性分析的过程可以归纳为以下四步（Creswell & Creswell, 2017）：

1) 数据生成：单独构建数据的多源输入

2) 数据管理：数据的组织、分类、记录

3) 数据分析：展示、减少、分析、综合，从代码/原始成分到主题的整合

4) 发现：数据解释，然后传播

在开始定性分析和数据编码之前，最重要的是要考虑整个分析过程，创建一条故事线。这条故事线用于连接和整合不同主题的分析。

1. 编码故事线

创建一条故事线最好的方法是写下一句话或一小段话来笼统地描述分析方向，它帮助研究者确定概念和主题，指导组织数据和编码的方向以及为编码方案提供了基本结构。编码方案应基于研究者想传达给读者的故事。许多研究者在还没有想法时就开始对数据进行编码，他们不知道最终如何分析，这样就导致编码方案缺乏连贯性并浪费时间，所以在编码前思考分析目的是非常重要的。

2. 编码方法

研究者一开始需要从头到尾阅读完整的文本资料，然后第二次阅读时在拷贝文本上边读边记下代码和备注，方便日后的分析。编码数据的一个系统方法是在阅读文本时问自己以下问题：1）这句话是什么意思；2）它代表什么；3）这个问题是什么类型的事件；4）这里试图传达什么。在回答这些问题时所提到的单词、数字和符号就是代码，这些是对内容进行分类的标签。另外这些代码和备注可能会与其他数据有联系，并且指向一些议题或理论，因此研究者在编码过程中需要仔细留意代码和数据内容。

3. 创建代码

创建代码的过程可以是预设的、开放的或采用混合模式，在开始数据收集和编码过程之前，研究者可以根据自己在这方面的已有知识或借助概念框架和研究问题等列出一些预设代码，这时的代码数量在10-50个是合适的，太多的代码会导致编码的人不知所措或在编码过程中犯错。同时这些代码可以创建一个“代码本”（Codebook），里面包含所有代码及其含义。然而随着继续阅读和分析数据，在这个过程中会出现新生代码，这些代码是在阅读数据时产生的想法、概念、行动、关系和意义等，他们与预设代码不同。在许多情况下，意外产生的新生代码构成了有趣故事的基础，并可能成为故事线的一部分。

4. 完善编码

随着一系列数据被编码，整个编码方案将会被完善，即编码类别可能会有所添加、整合或修改，特别是预设代码，因为经常会发生研究者期望的内容并不存在的情况，另外还会出现有些代码是无效的或者不同编码间的内容混在一起的情况。因此编码的经验法则是使代码适合数据，而不是让数据适合代码。

下表呈现的是学前教育领域中常见的访谈分析的具体流程（Yang & Li, 2020）：

5. 提高质性数据定性分析的可信度（trustworthiness）

1) 对不同的数据信息来源进行三角互证（triangulation）

2) 成员查核（研究参与者进行非正式检查以确保数据准确性）

3) 延长在研究场所参与的时间

4) 同僚探询（研究同伴的合作分析与检查）

5) 自我反思（反思自己可能带有的偏见）

6) 外部审计（资深研究人员的参与、查核及监控）

（二）质性数据的定量分析

定量分析通过使用数字方法确定大小、程度、数量等，赋予研究对象一种纯形式化的符号以反映出事物的特征。

1. 选择分析内容

选择时需要考虑样本数量，通常选择具有充分代表性的100-2000个样本，同时需要考虑分析的重点，根据重点来选择内容。

2. 选择分析内容的单位

研究者根据每个单位的大小采取相对应的编码方法，分析内容的单位通常有三种，单词/短语、段落或文章。如果研究语言的使用，往往选择单词作为内容单位。

3. 准备编码的内容

在开始编码之前将编码内容用可以分析的形式保存，对于已经是文本的内容不需要转录成文字，比如印刷媒体、网页和邮件等；对于广播、电视节目、访谈录音和小组讨论等内容往往需要在分析前转录成文本形式。在这一部分最重要的是准备好转录的文本资料和编码方案。

4. 对内容进行编码

将内容分组以便减少不同内容的数量从而更好地去比较。因此研究者需要掌握将不同概念分组的能力，使每一组的概念都与本组的相似而与其他组有明显的区别。同时研究者需要一个编码框架，将内容分成一系列的组，这个框架可以使用现成的也可以根据内容开发一个新的。

5. 计数和得出结论

当所有内容分析的准备工作都完成后，计数通常是最快的部分，完成计数后就需要进行总结分析，得出结论，在这个部分需要交代清楚编码的原则和过程。

6. 验证质性数据定量分析的有效性

研究者通常使用编码者间一致性或交叉检查的方法来验证数据的有效性，编码者间一致性指的是两个不同的研究人员就如何对相同的内容进行编码达成一致的程度。

貳

量化数据的分析

量化数据的分析是对大量的可能是杂乱无章的数据进行算数或逻辑运算，抽取并推导出某些特定问题具有价值、有意义的数据，经过解释并赋予一定意义便成为教育研究的重要结论。在量化研究当中，研究问题是研究者想了解的不同变量之间的关系，研究假设是研究者对变量关系的陈述，他们说明了数据分析的方向。变量包括自变量、因变量和控制变量三种。在分析时，一般包括描述性统计和推断性统计/推论统计（如下表, Wiersma, 1995）。常用的统计分析工具包括SPSS,、Jamovi、 AMOS、SAS、STATA、Mplus、HLM、R等。

（一）描述性统计

描述性统计用于报告平均值（M）、标准差（SD）和置信区间（CI）等信息。将调查样本中包含的大量数据资料进行整理和计算，对调查总体所有变量的有关数据进行统计学上的总结，主要用于了解数据的离散程度、集中趋势、频数、分布以及一些基本的统计图形（比如说，使用折线图进行基线或干预效果的呈现），具体包括频数、百分比、平均数、众数、中位数、范围、标准差、方差和排名等。描述性统计是推断性统计的基础。

（二）推断性统计

在定量研究中，收集数据后，统计分析的第一步是描述相应的特征，例如一个变量的平均值，或者两个变量之间的关系。下一步是推论统计，它可以帮助确定数据是证实还是反驳假设，以及它是否可以推广到更大的人群。

推断性统计是指用概率数字来决定某两组（或若干组）数字之间存在某种关系的可能性，并由样本特征来推断总体特征的统计方法。推断性统计包括总体参数估计和假设检验，常用的方法包括T检验、方差分析、回归分析、因素分析、结构方程模型和多层次分析等，例如，对于自变量的分类信息和因变量的连续信息的实验研究，研究人员可以使用t检验或方差分析（ANOVA）、协方差分析（ANCOVA）或多变量方差分析（MANOVA，用于多因变量测量）。通常会报告假设检验的统计结果和置信区间（CI）以及作为结果实际意义指标的效应量（ES）。

具体来说，量化数据的分析会依照以下基本流程：

1. 对得到的数据资料进行统计分类，掌握数据分布形态和特征

现象的同质性是研究现象数量关系的前提，按不同的标志进行统计分组，突出统计对象的本质特征，保持组内的同质性和组间的差异性。以此为基础，我们可以做到：

（1）数据的集中趋势和典型特征：计算平均数、中数和众数

（2）判断统计数据的离散程度：计算方差和标准差等差异量

（3）个体在群体中所处的相对位置：标准分数

（4）解释和预测自变量的变化：回归分析

2. 对数据资料分析处理，通过统计检验、解释和鉴别研究的结果

如何分析研究中得到的多个统计量之间的差异，关系到对研究结果的解释。如何进行统计检验:

统计检验中主要有两类错误，I类错误和II类错误。第一步我们以零假设H0的形式陈述假设：H0：u1=u2，假设要比较的两个统计量来自相同的总体，没有真正的差异。第二步，规定显著性水平（z或t值）。

常用的统计检验方法分为参数统计检验和非参数统计检验，常用的检验方法有z检验，t检验和方差分析等。

（1）z检验：通常应用于大样本，用正态分布理论来推论差异发生的概率，从而判定两个平均数的差异是否显著。

（2）t检验：比较两个平均数以确定他们之间的差数是真的差值而不是偶然差数的改了吧，适用于小样本的差异显著性检验

（3）方差分析：用于评估同时比较几个平均数，可以指出自变量的不同水平因素之间的相互作用的效益，准确地确定犯I类错误的概率

3. 通过总体参数的估计，从局部去推断总体的情况

如何根据所抽取的样本统计量去顾及总体的参数，并使这种估计尽可能客观和接近总体的真实情况，会直接影响研究结果的可靠性。总体参数估计有两种，点估计和区间估计。

（1）点估计：这是在不知道总体参数时，用一个特定的值作为总体参数估计。

（2）区间估计：用数轴上一段距离来标识总体参数可能落入的范围，是用一个置信区间估计总体参数。

叁

小结

实际上，关于数据定性分析和定量分析的方法，随着时间的推移，已经有更多丰富的类别和传统。比如说，定性分析的方法，既有传统的文献分析，历史研究，比较研究，也有内容分析法，符号学方法，解释学方法，现象学方法等现代定性分析法。定量分析的方法，也发展到贝叶斯分析、因素回归分析、判别分析、聚类分析、主因素分析、结构方程模型、多层次模型/阶层线性模型等。初学者可以在掌握以上基本数据分析方法的基础上，根据研究需求去学习新的数据分析方法，让自己的研究能力更上一层楼。END

致谢：本文在杨伟鹏博士所开设学前教育研究方法课程讲义的基础上，由李婉仪和向思璇整理汇总而成。

参考文献：

Creswell, J. W., & Creswell, J. D. (2017). Research design: Qualitative, quantitative, and mixed methods approaches. Sage publications.

陈向明. (2000). 质的研究方法与社会科学研究. 教育科学出版社.

Wiersma, W. (1995). Research methods in education: An introduction (Sixth Edition). Allyn and Bacon.

Yang, W., & Li, H. (2020). The role of culture in early childhood curriculum development: A case study of curriculum innovations in Hong Kong kindergartens. Contemporary Issues in Early Childhood, 1463949119900359.

如有侵权，请联系本站删除！

上一篇： 自然通讯丨迈向全球范围的土壤气候减缓战略
下一篇： 南怀瑾先生：“民曰不便”的历史经验（二）

投稿问答最小化 关闭

数据收上来要如何分析

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化 关闭

数据收上来要如何分析

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化关闭