【每日一技】质性研究中的资料饱和及其判定

2024/1/15 14:00:24　阅读：331　发布者：

文章来源 | 不行博士

01 已有研究问题

以往多以两种方式判定质性研究的样本量，或依据经验法则，或通过资料饱和检验。基于经验法则，已有研究总结出了不同类型质性研究适合的样本量，但是这类文献大多缺乏对基本原理的清晰描述，其所建议的样本量标准往往差异很大。更有研究者认为，由于质性研究的特征以及不同研究之间的差异性，为质性研究设置统一的样本量标准缺乏理论与现实依据。

基于资料饱和的概念与作用受到质性研究者的广泛认同并被不断提及，但在实际操作过程中，这一概念和判定标准却始终含糊不清，长期存在一系列概念性与操作化问题。一方面，由于饱和的形式和标准多样，不同形式和标准之间既有差异又相互联系，关系错综复杂，以至于很少有研究者能够系统深入地理解和掌握资料饱和的概念，在使用过程中常常出现混乱。另一方面，在众多研究报告中，研究者都声称该研究以资料饱和作为样本量的判断标准，且已达到资料饱和，但是却极少说明达到的是哪种资料饱和、其判断方式及合理性。

02 如何解决

基于对资料饱和相关文献的研究及作者团队长期开展质性研究的实践经验，试图明确质性研究中资料饱和的概念，厘清不同形式的资料饱和，通过比较、明确不同形式的资料饱和之间的关系，探索质性研究资料饱和的判定及报告方式，以期为质性研究中资料饱和的判断提供参考。

03 质性研究中4种形式的资料饱和

不同形式的资料饱和其意涵、指向、所使用的分析手段及判定标准各不相同。

理论饱和

理论饱和可以解释为“如果继续追加抽样，不会再有新的类属或相关主题出现”。也就是说，在理论抽样的驱动下，概念类属或新生理论循环演进，不断完善，当概念类属之间的关系及其含义逐渐清晰时，就达到了理论饱和。由此可以看出，理论饱和是基于理论完整性进行的饱和度判断，判断的时点在资料搜集和分析的后期阶段，具有较高的理论概括性水平。

数据饱和

数据饱和是指随着资料搜集的进程，不再有新的数据产生，逐渐出现了信息冗余。数据饱和关注是否还会有新的信息出现，是在数据搜集阶段对资料饱和的判断。数据搜集处于整个研究过程的相对早期阶段，研究者基于“在随后的资料分析阶段，某些主题可能会出现”这一预设做出判断。但这种判断往往并不准确，因为在数据分析过程中，各种编码、编码属性及编码之间的关系还会不断变化，包括资料分析过程中编码的合并、意义扩充、意义排除等。所以，仅以数据饱和作为资料饱和的判断标准存在较为明显的弊端。

编码或主题饱和

编码或主题饱和有时也被称为类属饱和，这一概念表示在数据分析过程中，编码或主题范围已基本确定，从新搜集的数据中只能发掘出与已有编码或主题相重复的内容，不再有新的编码或主题出现，编码书已相对稳定。编码或主题饱和关注在数据分析阶段所产生的编码或主题在类属上的重复性，其判断标准为在数据分析过程中再无新的编码或主题出现。

编码或主题饱和与数据饱和相比可靠性有所进步。编码已经进入对数据的分析,而主题则是编码达到一定水平之后出现的结果。相比数据饱和仅仅根据数据或资料本身的重复性做出判断，编码或主题饱和已经将一定程度的分析纳入其中。但以编码或主题重复作为资料饱和的判断依据仍然有问题，也容易出现虚假饱和，导致所获取的信息或资料不足以建构起完善的理论。这是因为编码或主题饱和仅仅提供了研究问题的大致轮廓，往往通过较少的访谈就能达到。因此，只达到编码或主题饱和还不够，仍需要增加更多数据，以便研究者充分理解问题的深度、丰富性和复杂性。

与数据饱和一样，编码或主题饱和仅仅评估了编码或主题在类属或出现频度上的饱和，即只是基于所搜集材料的广度和范围进行饱和度判断，缺少对于编码或主题的意义评估。当某一主题首次从资料中浮现，研究者往往并不一定能达到对该主题的深入理解，还需要进一步搜集与分析数据，以发展对于主题或概念类属更为丰富和深刻的认识。

意义饱和

意义饱和是指在数据搜集和分析过程中，研究者已充分理解了所发展出的一系列编码或主题，关于编码或主题的含义及其之间的关系不再出现新的信息。Hennink等(2017)认为，要达到意义饱和需要一个循环演进的抽样、搜集资料、分析资料的过程，持续监测数据的多样性、清晰度和深度，强调针对目前尚缺乏理解的信息、编码或主题进行数据搜集。意义饱和是在数据搜集和分析过程中基于编码或主题意义的完整性进行的资料饱和判断，着重于对资料的深度理解。使用这一指标判断饱和度，有利于发掘和呈现资料的完整意义。不过，在进行饱和度检验时，仅仅依靠“有些编码或主题开始重复出现，不能继续发现其他新的编码或主题”作为判断标准是不够的，还应该继续判定每一个编码或主题的定义与内容是否得到了充足的发掘与认识，即“对每一个编码或主题的解释维度或理解开始重复出现，不再发现对编码或主题的其他解释，编码或主题因此达到了意义饱和”。

以上4种形式的资料饱和，关注了质性研究资料搜集和分析过程中的信息冗余或理论内涵，它们分别出现在研究过程的不同阶段。数据饱和直接关注资料搜集过程；编码或主题饱和则基于对数据的初步分析；意义饱和在数据搜集和分析(质性研究数据搜集与分析常常同时或滚动进行)的基础上，进一步注重资料分析的深度；而理论饱和则关注更高水平的理论建构，强调在理论建构过程中对概念类属及其属性(理论含义)发掘的充分性。

不同形式的资料饱和其判断的侧重点不同。数据饱和、编码或主题饱和基于数据、编码或主题的重复或出现频度进行判断；意义饱和基于编码或主题的意义深度进行判断；理论饱和基于新生理论中各概念属性的完整性、新生理论的自洽性及新生理论与以往理论的一致性进行判断。总的来说，数据饱和、编码或主题饱和着眼于所搜集资料的广度，意义饱和、理论饱和则着眼于研究资料的深度。意义饱和与理论饱和更接近，但二者又有本质区别。意义饱和关注的是编码或主题的意义深度；而理论饱和则进一步关注由编码或主题发展而来的新生理论的完整性、预测性与解释力。此外，理论饱和的概念源自并主要适用于扎根理论，而意义饱和则不限于扎根理论的语境，适用于对更多类型的质性研究资料饱和的判断。

04 资料饱和的判定方式及标准

理论饱和的判定

理论饱和依赖于不断进行的比较过程，满足以下4个条件方可认定研究资料达到理论饱和：1)相关概念类属反映在70%以上的访谈中；2)受访者认同研究结果，对研究结果有较好的反馈；3)与前人研究结果相契合；4)新的受访者开始重复叙述与之前受访者相似的内容。

数据饱和的判定

研究者根据资料搜集阶段访谈对象所叙述的内容以及对资料分析阶段可能出现的主题预设进行数据饱和度预判。当研究者重复听到同样的叙述，便开始考虑是否做出研究达到了数据饱和的判断。如前所述，在资料分析过程中，研究者的早期理解可能发生巨大变化，仅仅基于上述特征就判断研究达到资料饱和是不可靠的。但将数据饱和应用于对单次访谈的资料饱和评估，或对个体生命历程进行分析(如个体心理传记等)之类的质性研究中似乎是可行的。

编码或主题饱和的判定

编码或主题饱和是质性研究使用较多的资料饱和形式，对与此相关的判定标准的研究和讨论也最详实。

以实证研究结果作为判定依据

有研究采用回顾性实证分析的方式，系统呈现了资料饱和度的评估、报告和验证过程，总结了研究达到编码或主题饱和所需的样本量。上述研究大多采用后期回顾的分析方式，以研究获取的全部编码或主题为基数，通过计算某次访谈之后所获取的编码或主题在总数中的占比来判断资料饱和度，旨在基于多次实证研究的结果及研究者长期积累的经验，为后续研究提供标准参照。但是，在实际操作中，对于饱和度的判断是过程性的，即需要在资料搜集与分析的循环过程中评估饱和度，以便确定在何时停止抽样。回顾性分析相当于“事后聪明”或“马后炮”。尽管此类研究得出了众多关于样本量的实证经验，但正如很多研究者强调的，不能将其研究结果作为一般化取样要求直接应用于其他质性研究。因为资料饱和受到研究问题、研究目的、样本特征、取样均质性、访谈方式、编码特征、研究者以及数据特征等众多因素的影响，应根据研究的方法论特征、认识论立场以及研究资源等因素慎重确定样本量。

以是否还有新的编码或主题出现作为判定依据。当某次访谈中新出现的编码数占已确定的编码总数的比例达到一定标准，即可判断研究达到资料饱和。在研究中可以通过计算新出现信息与已获信息之间的比率来判断资料饱和比较容易操作。研究者还可以借助于图表的辅助，根据研究推进过程中新编码或主题的出现做出符合研究目的的判断。

以饱和度系数作为判定依据

有研究者试图用更复杂的计算公式探究质性研究的资料饱和度问题。这种资料饱和度的计算方式都依赖于概率理论与随机抽样。然而，由于质性研究采取非概率抽样方式，并且具有开放性等特征，使得它并不适用于概率论或者统计推断。另外，受研究传统和知识范围的限制，复杂的数学统计分析模型既不方便人文社会科学研究者的操作和使用，也不利于相应的读者群接受和理解。此外，有研究者使用Jaccard系数和S系数用以判断质性研究的编码饱和度。但目前这依然只是经验性判断，有待获得更多研究的验证与支持。

意义饱和的判定

意义饱和网格可以在资料搜集与分析的循环过程中建立。将发展出的意义单元逐一填入第一列，将新发现的意义单元的下级编码或自由节点按照各自出现的顺序分别填写在网格中的相应位置。如果在访谈中没有新的编码出现，则空出相应单元格。单个意义单元达到饱和的标志是，在后续进行的访谈中不再出现该意义单元新的下级编码或自由节点。当所有(或达到一定比例)的单元格都呈现为空白，代表随着访谈继续下去不会再有新的信息增加，即可判断研究资料达到了意义饱和。需要提醒的是，在质性研究过程中，编码始终处于不断调整状态，这一点在意义饱和网格中能够体现出来。

意义饱和网格记录了意义单元及其含义的发展过程，可以帮助研究者判断特定的意义单元是否已经达到饱和。但这类网格大多只能保存在研究者的研究备忘中，由于内容太多，过于庞杂，在期刊论文中很难完整呈现。Hennink等(2017)因此创造了另一种更具参考价值的意义饱和呈现方式。其中，横坐标为访谈顺序，纵坐标分别呈现不同的意义单元，空心圆表示某个意义单元被正式创建的位置，实心圆表示某意义单元达到意义饱和的位置，即在后续访谈中有关该意义单元的新信息不再出现，这时可认定该意义单元的相关信息已达到饱和。

05 结果与讨论

在质性研究中强调资料饱和具有三方面意义。其一，评估研究资料的充足性，以指导抽样过程。其二，帮助研究者判断对研究问题及相关概念的认识是否深入，是研究质量的体现。其三，帮助研究者在论文中报告研究取样的充分性，接受读者的审查，也便于后续研究者进一步跟进研究。但在实际操作过程中，不同形式的资料饱和常常被混淆，不恰当的评估方式或模糊操作等问题普遍存在。

质性研究达到资料饱和的样本量标准不应统一设定，其检验需嵌入具体研究过程

对于资料饱和的判定，某些实证研究的结果或统计学方法试图在研究之前就给出达到资料饱和的样本量标准。但是，如前所述，质性研究的资料饱和受诸多因素的影响，其中每项研究都有其个性或特殊性。而在资料分析过程中，主题也不是一成不变的，主题的命名、内涵、外延及其对研究问题的理论贡献都在不断发展，特定主题的重要性及其与研究问题的相关度也随之改变。因此，对研究问题探索的深度与样本量之间并非服从简单的线性关系，受访者人数不能单独作为判断资料饱和的依据，达到研究资料饱和的样本量因此不能在研究开始之前确定。

在具体研究过程中，研究者应基于本研究的特点，综合考虑多种资料饱和形式。如使用编码或主题饱和评估研究资料的广度和范围，使用意义饱和评估编码或主题被探索的深度。如果该研究以建构理论为目的，还应该通过持续性比较对理论饱和加以检验。将检验嵌入研究过程，综合使用多种形式的资料饱和，在国外也有一些研究案例，如数据饱和与理论饱和结合使用。

质性研究的资料饱和存在逻辑上的不确定性，适当追加抽样有助于进一步确认

资料饱和是基于已获取的数据对未来访谈数据获取情况所做出的预测。这里“逻辑上的不确定性”是指，根据当前资料搜集和分析的情况预测继续进行数据搜集和分析的必要性，这种预测在一定程度上依赖于研究者的主观判断，其准确性并未得到进一步的证明。尽管研究者可以清晰地记录和呈现资料搜集与分析过程，为研究的资料饱和提供证据，但质性研究的资料饱和很难说是一个绝对准确的判断。

正因为资料饱和在逻辑上存在不确定性，有研究者认为，应该在资料达到或基本达到饱和之后再适当追加抽样，以对资料饱和加以验证。但Saunders等(2018)指出，过度抽样的做法在一定程度上也存在问题，可能会造成资料饱和概念的模糊性。尽管如此，适当追加抽样仍不失为应对资料饱和逻辑不确定性的有效策略。通常在做出研究资料饱和或基本饱和的判断之后，研究者可以根据需要再继续针对同质性样本追加2~3次个体访谈或1~2次焦点小组访谈，对资料饱和做进一步的确认。

资料饱和作为考察研究质量的一项重要指标，并不适用于所有质性研究

质性研究是一个“伞概念”，包含各种不同的研究方法，如扎根理论、现象学研究、话语分析、主题分析、民族志、叙事研究、焦点团体、生命史与心理传记等。有研究者认为，资料饱和的概念并不适用于叙事分析、解释现象学分析等。主题分析、扎根理论、焦点团体等采用归纳思维，从众多受访者那里搜集信息，关注理论发展的充分性，因此比较符合资料饱和的操作性定义；而心理传记、叙事分析等则聚焦于个体；更加关注个体故事的完整性，现有的资料饱和概念似乎并不包含此类含义。至于解释现象学分析，虽然也会采用提炼主题、明确主题间关系等方式进行资料分析，但更重视获取完整、丰富的个体关于生活经验的理解，具有特则取向，强调对每个案例进行详细的审视，这类研究是否适用于资料饱和的概念，还需要进一步探索和商榷。因此，有研究者担心，如果将资料饱和这一概念无差别地应用到所有质性研究中，可能导致失去其一致性效用。未来需要进一步关注对不同类型质性研究的资料充足性的考察、判断与检验。

转自：“学术拓荒者”微信公众号

如有侵权，请联系本站删除！

上一篇： 中央戏剧学院2024年新增设本科专业方向（一）动作表演、（二）数字空间演艺
下一篇： 【每日一技】如何做实地研究？

投稿问答最小化 关闭

【每日一技】质性研究中的资料饱和及其判定

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

【每日一技】质性研究中的资料饱和及其判定

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭