戴正包国宪 | QCA 在中国公共管理研究中的应用:问题与改进

2023/6/15 15:39:44　阅读：90　发布者：

QCA 在中国公共管理研究

中的应用:问题与改进

戴正包国宪

（兰州大学）

引文参考：戴正包国宪.2023.QCA 在中国公共管理研究中的应用:问题与改进.[J]. 公共管理评论,5(2):网络首发

【编者按】为提高学术成果的传播效率，凡《公共管理评论》录用的文章，将在本刊知网主页和公众号网络首发。有转载需求的公众号请联系本公号开白名单。

摘要

基于整体论分析多要素组态效应范式的定性比较分析方法(Qualitative Comparative Analysis,QCA),可探究政府治理问题中复杂的组态关系。通过系统性文献综述,编码并分析2017—2022 年在中国公共管理领域发表的204项QCA研究,以系统识别该方法应用于实践的问题和创新做法。经分析发现,即便QCA应用的操作流程已相对规范和统一,但在各个研究阶段和步骤,不同研究者采用的策略存在显著差异,这表明 QCA 研究者需要在研究设计、数据分析和解释方面开展更为科学与细致的论证。最后总结了问题集与相关建议,旨在提高中国公共管理领域QCA 研究在研究设计、数据报告和应用实践等方面的质量。

关键词

定性比较分析;系统性文献综述;必要性分析;充分性分析

投稿时间：2022/12/26

送外审时间：2023/1/3

首轮外审完成时间：2023/2/3

录用时间：2023/5/7

最终修回时间:2023/5/31

一、引言

自 2010 年前后定性比较分析方法(qualitative comparative analysis,QCA)首次应用于中国公共领域以来(黄荣贵和桂勇,2009;薛澜等,2011),许多公共管理研究者开始采用此方法解决政府治理中的复杂组态问题。该方法在管理学、图书情报学、比较政治学、国际关系等领域均已得到广泛应用,且均有论文综述其在特定学科的应用与发展,然而在公共管理学界鲜有其方法应用的综述。

在公共管理研究中,组态效应分析范式逐渐被认可,这一趋势与当下复杂系统管理研究成为新的科学范式密切相关(杜运周和贾良定,2017)。复杂系统理论认为,世界是由多个要素相互依赖的组态所构成的,而不是要素的简单加总( Furnari et al. ,2021;杜运周等,2022)。该观点挑战了传统研究范式的假设,即整体等于部分之和,并使得组态视角和 QCA 方法成为公共管理研究的重要工具。在新范式下,研究者不再受限于传统“相关性”方法论,而转向组态视角探索公共管理中多要素并发的因果复杂性,并对案例间异质性、非对称关系、等效性路径等复杂问题能够提供精细的分析(杜运周等,2021)。因此,QCA 被广泛应用于公共管理不同子领域的研究,包括公共政策、电子政务、政府创新、舆情治理等。该方法的应用不仅提供了新的知识,也为复杂系统管理研究提供了有益思路。

然而,尽管中国已有研究呼吁要正确且规范地使用 QCA,并且详细列举了 QCA每个流程应采取的可选步骤(张明和杜运周,2019),但其在公共管理领域的应用仍存在使用不规范、报告不透明的问题。可以预想,随着 QCA 的普及,方法的错误应用将产生大量错误的研究结论, 进而影响学者和实践者的判断 ( Schneider and Wagemann,2010)。张明和杜运周(2019)更进一步质疑了中国的 QCA 研究在分析过程的透明性、分析结果的稳健性以及研究结论的理论深度。因此,尽管 QCA 为我们提供了重要的研究工具与视角,但与之相关的方法论议题仍有待进一步发展,需要学界的共同参与和贡献(黄荣贵,2019)。本文依据归纳的逻辑对 2017—2022 年中国公共管理领域使用 QCA 的典型文献进行系统述评,以发现研究存在的问题和创新做法,并尝试进一步探究问题的成因,以及提出相应建议,使 QCA 能够更科学有效地构建新理论或实现对现有公共管理理论的检验或细化。本文的安排如下:第二部分介绍本文的研究方法、文献筛选过程及文献编码条目;第三部分依据 QCA 的操作流程依次分析文献库在各步骤实操过程中存在的共性问题;第四部分对共性问题进行总结,并参考国内外公共管理领域 QCA 应用的优秀实践和方法专家的权威文章提供相应改进建议;第五部分讨论本文主要结论与局限。

二、系统性分析方法

本文采用系统性文献综述(systematic review)的方法,遵循系统综述和荟萃分析优先报告(preferred reporting items for systematic review and meta-analysis,PRISMA)的流程进行分析(Moher et al. ,2015):(1)确定研究主题;(2)制定检索标准(如表 1 所示),其中通过“研究议题与对象”来确定“公共管理领域”的边界;(3)文献检索;(4)通过标题、摘要或全文对收集的文献进一步筛除;(5)根据研究主题进行分析。

第一步在 CNKI 数据库中检索,将主题词限定为“QCA”或“定性比较分析” (检索字符串为“SU= '定性比较分析' +'QCA' ”),并将时间限定于 2022 年 12 月 31 日前,且仅限于 CSSCI 来源期刊的论文,如此共产生了754 篇论文。第二步删除讨论英国资格与课程委员会(Qualifications and Curriculum Authority,QCA)的论文(8 篇)。为探讨 QCA 方法的应用情况,第三步删除介绍 QCA 或是述评的论文(21 篇)。如图 1 所示,QCA 应用的论文数量自 2017 年以来呈指数型爆发增长。

然后将余下 725 篇论文导入参考文献管理软件 NoteExpress V3. 0 中,形成文献集合。第四步采用德尔菲法对文献集合中的所有文献进行分类。将文献的标题、摘要和关键词分别发送给三位公共管理领域的专家,让其划分文献归属的主题类型。主题类型分为公共管理类和其他类。在第一次分类结束后,将三位专家一致同意归于公共管理类的论文纳入文献库,其他存在不同意见的论文经整理后再次发送给三位专家并且附上其他专家对这些论文的分类(不告知专家姓名),请其再次分类。在重复了三次如上步骤后专家们达成一致,并初步筛选出 214 篇公共管理领域的 QCA论文。

通过初步观察发现,2017 年之前的论文数量相对较少(10 篇),为呈现近几年QCA 的应用情况,因此删除。最后对文献库(204 篇)中所有论文进行定性处理。先将所有论文分配给两位公共管理领域精通 QCA 的专家,两位专家各自通读 20 篇论文后形成初步的编码条目。编码条目包含 6 个一级条目,包括“分析方法与案例的选择”“变量的选择与校准”“条件的必要性分析”“条件组态的充分性分析”“研究结论的稳健性检验”“结果的升华与深化”。每个一级编码条目包含 2 ~ 6 个二级编码条目,如“分析方法与案例的选择”的二级编码条目为“案例选取标准” “案例数量”“数据来源”。然后专家依据随机选取的 20 篇论文对每个二级条目的赋值标准进行初步编码。随后专家们以面对面交流的方式,解决编码过程中标准不一致的问题,最终对每个二级条目的名称和赋值标准达成共识,为下文 QCA 的应用及其效果分析做准备。

三、QCA 的应用及其效果分析

社会科学家 Charles Ragin(1987,2000,2008)在其三本著作中开创性地提出和拓展了 QCA 的理论基础与操作技术。与传统基于回归分析或因子技术的“相关性”方法和基于实验思维的因果推断方法不同,QCA 是基于布尔代数方法对案例开展逻辑化分析的技术,其强调对案例与相关理论不断进行检验。具体来说它有 4 个显著特征:(1)一般从小样本数据中构建条件组合与结果的充分或必要关系;(2)关注社会现象多重条件并发的原因(结果与前因条件的关系是复杂且可替代的),即假定社会现象的因果关系是非线性的,同一个社会现象的发生有可能是不同原因组合导致的;(3)以寻找产生结果的最简表达式为目的,进行逻辑最小化或布尔最小化运算;(4)使用集合关系表述条件(组合)与结果的充分性因果、必要性因果等复杂因果关系(杜运周等,2021)。参考张明和杜运周(2019)的研究可知,在研究者确定研究主题后,一般会执行以下标准化步骤:(1)分析方法与案例的选择;(2)前因条件(或称“条件变量”)与结果(或称“结果变量”) 的选择与校准;( 3) 条件的必要性分析;(4)条件组态的充分性分析;(5) 研究结果的稳健性检验;(6) 结论的升华与深化。研究的规范性在于研究者需要对以上实施的每个步骤都提供相应的科学解释。

QCA 的操作流程相对规范且成文,但其在具体实施过程中给研究者留有较大自由裁量空间。研究过程的操作规范、严谨程度主要由研究者的主观选择和研究经验决定,这导致 QCA 在应用中存在大量不规范和标准不统一的问题(张明和杜运周,2019)。本节将依据以上标准化步骤,依次讨论 QCA 在中国公共管理领域研究中的一般做法及存在的问题。

(一)分析方法与案例的选择

1. 选择分析方法

首先,研究者需要论述使用 QCA 的原因及其适用性。在文献库中,论文主要有如下 5 种解释方式。(1)研究复杂并发问题。探究多个前因条件的可能性组合及其互动关系,以及条件组合对结果的复杂并发影响。(2)研究中小样本案例。为“可获取的案例数量相对较少,无法使用传统定量方法开展分析”的研究提供了解决方案。(3)研究多案例比较。超越个案研究的限制,可通过多案例间的比较分析系统考察结果发生的成因。(4)研究非对称性的问题。仅关注结果发生或者不发生时的影响因素,或是前因条件与结果并非充分必要关系时的研究情景。(5)可纳入反事实案例。纳入在理论上存在但现实中未被发掘的案例,穷尽变量组合的所有可能性以丰富论证。然而有 12. 75%的论文仅论述了 QCA 本身的优势,但未明确论述其为何适用于将要开展的研究。

QCA 包含多种具体的分析工具,如 fsQCA、mvQCA、csQCA、tQCA 等,不同分析工具的操作流程与适用性均不同。文献库中的论文仅涉及 fsQCA(66. 67%)、mvQCA(3. 92%)和 csQCA(21. 08%)三种分析工具。三者的主要区别在于结果和前因条件的赋值范围:若结果或前因条件中不存在“天然”的二分或多分类变量,则一般使用fsQCA;若均为二分变量,则用 csQCA;若存在多分类变量,则一般使用 mvQCA。此外,有8.33%的论文没有说明选择特定 QCA 工具的原因。

2.选择分析案例

作为案例导向的分析方法,QCA 特别重视案例选择的过程。在中小样本的研究中,需要研究者对拟选择的每个案例都尽可能熟悉。案例选择过程一般需要遵循理论抽样并且保证所选案例之间存在异质性以及一定程度的相似性。

文献库中有 33. 33%的论文仅以数据导向选择案例,以资料或数据的可得性为唯一标准。这类研究所选择的案例一般为资料数据所覆盖的全样本,例如 31 个省级政府。其余论文遵循理论抽样的方法,在全样本中选取部分案例进行分析。选择过程一般遵循以下原则中的一种或多种。一是经典性。筛选出影响范围较广、情况较为典型的案例。二是多样性。案例间具有一定程度的区分度,需覆盖多种类型的研究事件。三是同质性。案例间具有可比性,通常以结果的相似性作为选择标准。四是资料可获得性。能够获得需要的全部信息。五是已有前因条件的适用性。被选案例在前因条件中的取值有区分度,保证案例与前因条件设置之间互相契合。

(二)变量的选择与校准

1. 前因条件与结果的选择

前因条件与结果的选择过程常是 QCA 被质疑的焦点(张明和杜运周,2019)。在文献库中,前因条件与结果一般从构建的理论框架中产生(如武晗和王国华,2021)。但仍有 12. 75%的论文没有论述前因条件的选择过程,还有 35. 29%的论文仅以单一变量线性影响的思维直接选取前因条件,而未对 QCA 方法论中强调的组态影响做前置假定,只简单提及可能有组态影响而未从理论层面具体假定“为何有组态影响,以及哪些条件组合会对结果发生产生影响”。

大部分论文只有一个结果,仅少数论文考虑了多个结果的情况(如许玉镇和刘滨,2020a)。而前因条件的数量一般大于 3 且应保持在适中的范围,要与案例数量成一定比例。具体的选择过程需要不断试错(杜运周和贾良定,2017),而不存在一个确定的标准。但文献库存在诸多相互冲突的确定性标准。例如,认为样本数量范围在[10,40][15,80][10,100],其相应前因条件的数量范围为[4,7][4,8][5,9]。需要注意的是,前因条件的数量尽量不要超过 10,否则解的数量将会呈几何倍数式增长,从而导致有限多样化的问题。而前因条件过少也会产生无法充分概括现实案例、遗漏重要条件的风险(张明和杜运周,2019)。

2.前因条件与结果的校准

校准是指给所有案例的前因条件与结果赋予集合隶属分数的过程,即对所选案例涉及的所有变量的原始数据或资料进行整理和分析,最终将其转化为[0,1]的隶属分数的过程。Greckhamer et al. (2018)认为有效的校准过程是“半概念半经验”的过程,应遵循 3 个原则:(1)明确定义每个代表结果和前因条件的集合;(2)使用适当的理论和实质性的知识来确定阈值(或“锚点”);(3)透明报告所选择的阈值。文献库中,依据数据或资料性质的不同,一般可分为采取客观校准与理论校准两种方法的论文。

客观校准是指研究者依据变量的描述性统计特征,不加理论与经验解释,机械地赋予集合隶属分数的过程。其校准的对象一般为权威机构发布的调查数据或综合指数(排名)。文献库中 42. 65%的论文使用客观校准(直接校准)的方法。其中使用 csQCA 的论文一般使用中位数或平均数作为 0 ~ 1 取值的锚点。使用 fsQCA 的论文(以常见的三分锚点为例),一般依据变量数值的实际分布,简单采用 5%分位数为完全不隶属,95%分位数为完全隶属,然后根据变量数据最大值和最小值(排除离群点)的均值作为交叉点。也有将 10%分位数、90%分位数、10%与 90%分位数的均值或是 25%分位数、75%分位数、50%分位数的取值分别作为完全不隶属、完全隶属、交叉点的锚点。最终将前因条件和结果的原始数值转换为相应的模糊隶属分数。44. 12%的论文使用理论校准的方法,即研究者依据研究经验和理论知识确定锚点后,依据对各案例资料与数据的深入了解,赋予集合隶属分数的过程。但有 13. 24%的论文直接给出锚点标准,却未说明依据或标准。

(三)条件的必要性分析

1. 初步确定必要条件

赋值与校准后,需依赋值表或模糊集隶属度/ 分数矩阵开展必要性分析,以识别结果发生或不发生时所必须具备的前因条件。简单来说,若某前因条件总是伴随着某一结果出现,则可认为此条件是这一结果出现所必要的,即为必要条件。此外,提前识别必要条件,方便后续充分性分析时对逻辑余项进行假设,以防止出现纳入逻辑余项后必要条件被简约解消除的情况。

一致性是衡量必要条件的重要指标。在必要性分析的情景下, 需用∑ [min(Xi,Yi) ] /∑(Yi) 评估一致性 ( 必要一致性)。若一致, 则需进一步用∑[min(Xi,Yi)]/∑(Xi)评估覆盖度(必要覆盖度)。需注意,下文“(四)条件组态的充分性分析”中 “3.分析结果汇报”也即在充分性分析的情景下, 需用∑ [min(Xi,Yi) ] /∑(Xi) 评估一致性 ( 充分一致性)。若一致, 则需进一步用∑[min(Xi,Yi)] /∑(Yi)评估覆盖度(充分覆盖度)。可以发现,必要一致性与充分覆盖度以及必要覆盖度与充分一致性的计算公式是相同的(Ragin 2008)。必要条件的初步认定标准通常为必要一致性分数处于[0. 9,1]。文献库中,有少数论文误将充分一致性(其初步认定标准通常为大于 0. 8)等同于必要一致性,并将必要一致性大于 0. 8 的前因条件初步认定为必要条件。此外,张明和杜运周(2019)认为单个前因条件存在与不存在均需进行必要性分析,而结果存在与不存在的必要性分析则要依研究需求选择性开展。然而文献库中,50. 98%的论文仅考虑了前因条件存在的情况,忽略了条件不存在成为结果发生必要条件的可能性。

文献库中还有 6. 86%的论文未进行必要性分析。此外还需注意,当在必要条件分析中未找到必要条件时,并不可推导出结果的发生一定将受前因条件的组态影响。因为可能存在既无单一条件影响,也无组态效应影响的情况。

2.必要条件的经验相关性与存留

如前所述,即便前因条件初步通过一致性检验,仍需进一步讨论其是否为紧要必要条件,尤其是在不关注组态关系仅关注单一条件必要性的论文中(如董健和李兆友,2020)。具体来说,有两种常用的方法。一是必要覆盖度检验,必要覆盖度能够度量必要条件与结果的经验相关性或紧要程度。尽管目前对覆盖度的阈限尚未有一致的标准,但尽量不要低于 0. 5(Schneider and Wagemann,2012;张明和杜运周,2019)。二是 XY 图检验,当绘制的必要条件集合与结果集合的 XY 散点图中的案例越接近主对角线,并且远离右纵轴时,则必要条件的紧要性越强。当大部分案例集聚于右纵轴时,则认定该必要条件无关紧要(Duşa,2018)。另外,还可以考虑卡方独立性检验。当拒绝原假设 H0 时,即条件X和结果Y是相互独立的,则可认定X 是结果的一个紧要必要条件(Braumoeller and Goertz,2000;Duşa,2018)。文献库中仅有少数论文按照上述方法排除了被初步认定为必要条件的前因条件(如许玉镇和刘滨,2020b)。

在所有依据“一致性判断标准”初步确定存在必要条件的论文中,有 28. 26%没有进一步讨论必要条件的存留问题,甚至有 5. 88%没有计算条件的覆盖度。其余论文虽然计算了条件的覆盖度,但有 60. 78%在文字描述部分没有对这些“辛苦计算”出来的数字进行描述与讨论。这可能导致一些无关紧要的必要条件被视为结果发生或不发生的核心条件。此外,还可以依据已有的理论与经验,探讨由任意数量的前因条件组成的各种组合对结果的必要性(张明和杜运周,2019)。Duşa(2018)推荐了一种基于 R 语言的函数,其能够自动析取在数据层面可能成为结果必要条件的所有组合。

最后,依据以上步骤确定必要条件存在后,如果后续组态的充分性分析结果路径中未含必要条件,则需手动将其纳入,或是在生成解之前,将非必要条件设置为“存在或缺席”(present or absent),将必要条件设置为“存在”(present)。然而在存在必要条件的论文中,有 69. 57%没有严格采取此种策略,而是将必要条件剔除充分性的分析过程或是将必要条件作为核心条件单独解释。还有论文认为要在后续的充分性分析结果路径中将必要条件排除或是将含有必要条件的解排除。

(四)条件组态的充分性分析

1. 真值表的形成

真值表是充分性分析的数据前提,通过变量赋值表或模糊集隶属分数矩阵简化后得到。真值表的确定,需要先构建,即设置案例频数阈值、设置原始一致性阈值;再修正,即处理矛盾组态、对逻辑余项进行假设。然而有 62. 75%的论文未详细说明真值表的获得过程,这将使读者难以复刻其研究,影响研究的科学性。

(1)初步构建真值表

构建真值表前需先设置案例频数阈值和原始一致性阈值,再用软件分析。设置案例频数阈值旨在排除支持案例数小于阈值的条件组合。阈值范围一般根据案例规模确定:小样本中案例频数阈值一般设置为 1,大样本频数设置为 2。一个基本经验是:经案例频数阈值筛选后的案例数量应至少为原样本的 75%。若不设置阈值将会使只有少数案例支撑的条件组合纳入分析,这一定程度上会降低结果的准确度。文献库中仅有 34. 31%的论文讨论了案例频数阈值的设置标准:案例频数的范围在[1,3];案例数量与阈值的比值大致为[1 ∶ 10,1 ∶ 52]。少数论文旨在提高案例入选标准而增大案例频数阈值,将其设置为大于 2 的数字,却未报告频数设置的理论或数据方面的原因以及筛选后的样本数量是否仍在 75%的标准内。

设置原始一致性阈值旨在排除未通过模糊集合理论一致性的条件组合。只有达到阈值的条件组合才会被纳入下一步分析。若未设置原始一致性阈值,那么将低原始一致性的条件组合纳入可能会扰乱后续的简化运算。最低阈值没有定论,需依据案例数量、研究目的、数据质量等灵活调整(张明和杜运周,2019)。文献库中最低阈值分别为 0. 9(9. 31%)、0. 85(11. 76%)、0. 8(22. 55%) 与 0. 75(13. 73%),另有42. 65%的论文未提及原始一致性阈值。

(2) 修正真值表

阈值设置完成后,研究者一般会借助软件辅助计算得到初步的真值表,然后再进一步讨论可能存在的矛盾组态和逻辑余项。矛盾组态是指其结果既包含是(1),也包含非(0)的条件组合,即同一条路径既能导致结果发生,也会导致结果不发生的“自相矛盾”情况。如果不处理此种条件组合,将无法开展简化运算。大部分论文可能未出现矛盾组态或仅呈现最终矛盾组态被解决后的结果。文献库中,仅有 8. 82%的论文讨论了矛盾组态出现的情况。

逻辑余项是指少有或没有现实案例支撑(低于频数阈值的真值表行),但依逻辑可推导的条件组合。研究者需根据研究经验和案例剖析对逻辑余项进行假设。需要注意:对逻辑余项进行假设是就单个条件的发生与否是否对结果产生影响进行相应的判断和选择,而非直接对逻辑余项的结果进行赋值。对逻辑余项的讨论将会影响充分性分析后中间解的结果。如果不设置逻辑余项,fsQCA 软件导出的中间解与复杂解将完全一致(Fainshmidt et al. ,2019)。然而,文献库中仅有少数论文讨论了逻辑余项的设置问题。

2. 选择解

真值表构建完成后,需要依据它进行布尔最简化运算,即条件组合的充分性分析,以得到影响结果发生或不发生的最终路径。文献库中 82. 35%的论文使用由Ragin 等人开发的 fsQCA 2. 0 / 3. 0 软件系统,也有 2. 94%的论文使用由复旦大学复杂决策分析中心开发的 fm-QCA 软件进行计算。两种软件均默认导出 3 种解:复杂解(或称“复合方案”,complex solution;不纳入逻辑余项)、中间解(或称“优化解”“中间方案”,intermediate solution;仅纳入设定好的逻辑余项)和简约解(或称“简洁解”“吝啬方案”,parsimonious solution;纳入所有逻辑余项)。9. 31%的论文使用 TOSMANA或是 R 语言,另有 5. 39%的论文没有汇报使用何种软件进行数据分析。

文献库中的论文对选择何种解存有较大争议。(1)23. 53%的论文选择复杂解,认为复杂解是能完全依据变量设置参数而得到的分析结果,可排除与事实矛盾的组合,进而保证结果的严谨性和启示性。反对者认为复杂解将所有逻辑余项设置为“假”,没有反事实案例,一般不作为分析的参考。(2)50. 49%的论文选择中间解,认为中间解能够容纳逻辑余项,从而对未发生的事件进行合理假设,也符合已发生案例的事实。反对者认为中间解会根据研究者设定的反事实前因条件而变化,结果并不稳定。(3)5. 88%的论文选择简约解,认为简约解的前因条件很稳定,有助于理论构建,或认为这一选择适用于前因条件多而案例数量相对较少的情形。反对者认为简约解会导致由于不符合现实的条件组合纳入而产生的偏误,以及过于简单而难以理论化的问题。(4)还有 9. 31%的论文选择多个解进行汇报,以更加全面地从多个角度展示分析结果。此外,10. 78%的论文使用了 fsQCA 软件却没有汇报最终选择了哪种解。

3. 分析结果汇报

选择解的类型并据此简化运算后,需要汇报分析结果。一般存在两种形式:主流的汇报形式是“核心条件型”,即参考Fiss(2011)的方法,将同时出现在简约解和中间解的条件认定为“核心条件”①,其余只存在于中间解的条件被认定为“边缘条件”。然后再以中间解的结果作为主体进行讨论。少数研究者采用“同等效应型”形式,即不区分核心条件与非核心条件,直接汇报软件给出的结果。

① 核心条件是结果的基础,无法被消除,并且最终必须是所有解的一部分( Ragin and Sonnett,2005;Rubinson,2019)。

在汇报的结果中,各条件组合路径的一致性和覆盖度是判断其解释力与有效性的关键指标。一致性表示条件组合的解释力(作为结果发生的充分条件的概率),其测量了条件组合指向特定结果的一致程度。其中原始一致性一般建议的基准是≥0. 8(Ragin,2000,2008)。另外,Greckhamer et al. (2018) 建议在模糊集分析中考虑PRI(proportional reduction in inconsistency)一致性,以避免出现在结果发生与否的评判中同时存在子集关系的情景,即某一条件组合既能导致结果,也能导致其非集的情景。PRI 得分尽量不要与原始一致性分数差别过大,其阈值推荐为 0. 75(Park et al. ,2020;杜运周和贾定良,2017) 或 0. 7(Du and Kim,2021;Greckhamer et al. ,2018),但尽量不要低于 0. 65。Greckhamer et al. (2018)指出,PRI 低于 0. 5 的条件组合存在明显的不一致性。

覆盖度包含解的覆盖度(solution coverage)、原始覆盖度(或称“原生覆盖度”“原覆盖度”,raw coverage)和唯一覆盖度(或称“净覆盖度”,unique coverage),三者均表示经验相关性或重要性,用于衡量完整或单个条件组合在多大程度上覆盖(或解释)了结果。具体来说,在清晰集中①,解的覆盖度表示完整条件组合所解释结果案例的比例;原始覆盖度表示单个条件组合能够解释结果案例的比例;唯一覆盖度表示剔除与其他条件组合的交集后,单个条件组合所解释结果案例的比例。然而文献库中仍有 14. 22%的论文没有汇报这些数值。

① 模糊集中,解的覆盖度表示完整条件组合所解释结果的隶属度的比例;原始覆盖度表示单个条件组合所解释结果的隶属度的比例;唯一覆盖度代表了仅由单个条件组合所解释的结果隶属度的比例(其他条件组合没有涵盖的隶属度)。

当最终出现的分析结果存在多个条件组合时,18. 63%的研究有选择性地只解释某些路径,选择的原因主要包括:(1)排除原始覆盖度低的路径;(2)排除唯一覆盖度低的路径;(3)排除可以由其他路径根据布尔运算简化而得到的路径;(4)排除包含有单因素充分条件的解;(5)排除一致性低的路径。出于研究需要,25%的研究对结果不发生的情况也进行了探讨,以直接验证反向结果存在的假设或是间接证明正向结果的正确性(如杜运周,2020)。该步骤需依研究目的选择性地开展,然而少数论文进行了反向结果数据分析,却未解释如此分析的作用。

(五)研究结果的稳健性检验

QCA 最后需对充分性分析的结果开展稳健性检验,以保证结论的可靠性与严谨性,否则研究结论和政策建议将“摇摇欲坠” (Krogslund et al. ,2015)。具体来说,检验是为避免研究者对 QCA 某一操作步骤的差异化策略选择带来的结果误差,同样也是为避免他人质疑 QCA 结果的科学性和严谨性而采取的应对举措。但需注意,检验应遵循集合理论分析的逻辑而非回归分析,即若稍有不同的决策导致必要条件和充分条件的结论足够相似,以至于确定的路径以及一致性和覆盖度的结果并未有实质性变化,那结论即可被视为稳健(Schneider and Wagemann,2012)。该过程未有统一的检验流程。为保证结果的可靠性,研究者需要同时采用多种稳健性检验方法,如杜运周等(2022)同时使用了 4 种检验方法。

文献库中,有 30. 39%的论文进行了稳健性检验,具体方法有 7 种:(1)调整校准锚点或交叉点锚点,以改变结果或前因条件在案例中的赋值;(2)降低 PRI 一致性水平,如由 0. 7 降低至 0. 65;(3)提高案例频数阈值,如由 1 提至 2;(4)替换前因条件或者是结果的代理指标;(5)提高组态分析的一致性水平,如将 0. 8 提升至 0. 85 或0. 9;(6)引入结果不发生的条件组合进行反向检验;(7)随机删除部分样本。前 5 种是使用频率最高的方法,但大部分研究在使用中未说明为何将锚点或阈值调整到某个值,整个过程看起来具有较大的随意性。

(六)结论的升华与深化

对组态结果的升华与深化是最考验 QCA 研究者理论功底与对案例熟悉程度的一步。文献库中,30. 39%的论文犯了以下错误的一种或多种。(1)解释反向结果。充分性分析得出的条件组合,只能解释结果发生的原因,而不能证明遵循条件组合的对立情况就会导致结果不发生。例如,结果得出民主和低犯罪率国家经济发达,但不能因此得出独裁和高犯罪率国家就一定经济不发达。(2)非组态的解释。充分性分析最终将得到影响结果发生的多个组态,它们均并发对结果产生影响,这就意味着不能孤立地解释某个充分不必要或必要不充分条件的作用(Oana et al. ,2021)。正如前一个例子,无法证明促进民主或降低犯罪率一定可以促进经济发展,必须要将两者结合讨论才有意义。(3)非充分性的解释。只能说明某一组态可能是导致结果发生的一种路径,而非要达成这一结果必须遵循的路径。同样,也就是说,民主和低犯罪率是促进经济发展的一条路径,但要促进经济发展不一定必须要民主和低犯罪率。简言之,得出的解释是使结果发生的充分条件组合而非必要条件组合。

QCA 是基于案例的研究方法,分析结果与案例的对话是非常关键的步骤,它赋予了分析结果以现实意涵。依据不同的研究目的,需选择不同类型的案例开展比较分析(张明和杜运周,2019) 。根据 Schneider and Wagemann(2012)的观点,研究者在探究联结前因条件和结果间的因果机制时,需要对至少两个典型案例开展案例内比较分析;若关注充分性组态的识别,则应对一致性异常案例和典型案例展开案例间比较分析;若目的是确定分析中缺失的前因条件,并找出缺失的充分性组态,那么应该对覆盖度异常案例和个别无关案例展开案例间分析。然而在文献库中,34. 80%的论文未与案例对话,仅仅依据条件组合影响结果的量化逻辑展开论述。大部分论文( 51. 96%) 选择与案例库中路径所指向的典型案例进行对话,但有 33. 02%的论文仅是对案例简单描述,并没有开展案例之间的比较分析或对单个案例深入探析。

当条件路径过多时,研究者通常依据条件组合之间的相似性,采取归纳共享条件(组合)的策略以简化模型,使其更具解释力(如杜运周等,2022)。具体来说,它是将具有相同重要条件(一般为简约解中包含的条件、简约解与中间解包含条件的交集、必要条件或是存在于多条路径中的条件) 的条件组合进行合并,以形成简化结果。

四、QCA 应用中的问题

总结与改进建议

QCA 的操作流程被认为是标准化的,但并未以标准的方式执行(张明和杜运周,2019)。尽管多样性和创新对方法论的严谨性或者灵活性来说是“健康的”,但受限于研究者的主观认知与对方法的掌握程度而产生的误用值得警惕,并且研究者常常忽视 QCA 设计、软件操作、分析和解释方面决策信息的展示,这限制了读者充分理解和复刻 QCA 的研究过程。表 2 依据第三部分的分析总结了文献库中的论文在每个步骤存在的主要问题。

在 QCA 的各个阶段,研究者都可能犯错。因此,Schneider and Wagemann(2010)推荐了好的 QCA 应用实践。随着 QCA 方法的不断发展,越来越多的学者也开始加入最佳实践和增强标准化分析(enhanced standard analysis)的探讨(如Wagemann and Schneider,2015;Cooper and Glaesser, 2016 ; Thiem, 2016 ;Schneider and Wagemann,2016;Schneider,2018)。他们尽管对 QCA 的某些步骤和流程存有争论,但都认为QCA 仍是一个新方法,还需要不断地更新和完善,以及 QCA 研究者应致力于对主流的(现实主义的)标准和规范不断改进(Schneider,2018),对最佳实践不断更新(Oana et al. ,2021)。

因此,笔者将参考国内外公共管理领域 QCA 应用的优秀实践和 QCA 方法专家的权威论文,先按照 QCA 的一般步骤提出推荐的做法及相关参考文献(见表 3)。然后,针对 QCA 方法整个过程以及其中的重难点问题,提出详细建议。希望这些建议能够解决本研究发现的问题,同时,也为公共管理领域潜在的 QCA 应用者提供一份指南。

整体性建议如下。(1)QCA 中的数据分析通常是一个不断迭代的过程。必要性和充分性分析的结果能够帮助研究者不断改进模型。例如,在发现矛盾组态后,研究者可以通过增删案例或条件的方式不断修正模型(Greckhamer et al. ,2018)。 (2)应严格遵循 QCA 术语规范,如前因条件而不是自变量( Schneider and Wagemann,2010),以及符号规范(Rubinson,2019)进行撰写。(3)应尽量使得研究过程与结果可视化,以帮助读者更有效地理解。Rubinson(2019)系统总结了呈现 QCA 各个分析过程与结果的技术与方法。Oana et al. (2021)为一些常用的可视化工具提供了对应的 R 命令。(4)需要再次强调,QCA 分析需要始终关注案例本身,而非数据和计算,并且在真值表分析之前、之中和之后都应对案例充分熟悉,特别是在中小样本研究中(Schneider and Wagemann,2010)。

建议1:详细论述方法选择的原因

研究者需要明确论证 QCA 使用的必要性,如第三部分“(一)分析方法与案例的选择”中“1. 选择分析方法”总结的,研究复杂并发问题、研究中小样本案例、研究多案例比较、研究非对称性问题、可纳入反事实案例等原因。除其自身优势外,QCA 方法的选用也常常建立在传统线性单要素净效应分析失效的基础上。例如,Wang(2016)发现传统基于回归分析的经典理论无法很好地解释社区治理网络问题,因此引入了复杂性情境理论,即某要素的作用只有在特定条件下才能显现,很好地阐述了 QCA 方法的适用性,并通过混合研究设计进行验证,从全新视角丰富了人们对治理网络作用的认知。此外,Schneider and Wagemann(2010)总结了 QCA 研究应服务的原始目标,如总结数据、检查数据与子集关系的论断是否一致、检验现有的理论、快速检验研究者的猜想和发展新的理论论断、创建经验类型学(creating empirical typologies)等。

建议 2:使用混合方法

混合方法(mixed methods)的使用可以结合不同研究方法的优势,帮助研究者更全面、深入地理解和解释公共管理现象,以提升研究的可信度和效度。研究者使用的其他方法更多用于理论框架搭建和变量的选取。例如,Mosley and Wong(2021)基于溯因的逻辑,结合开放式主题访谈和主题分析发展出影响结果的前因条件。在小样本的研究中,此种结合能让研究者深入了解每个案例,并且确保生成的概念是明确的、相关的和可操作的。山少男和段霞( 2022)、吕鲲等( 2022)、方齐和谢洪明(2022)等也分别使用元分析方法、扎根理论编码、因子分析等对前因条件进行筛选。此外,杜运周等(2020) 创新地使用必要条件分析方法( necessary condition analysis,NCA)更细致地分析了必要性因果关系,并将分析结果与 QCA 的必要性检验结果进行对比分析,提高了必要性检验结果的可靠性。仍需注意,尽管积极探索混合方法有诸多优点,但张明和杜运周(2019)也警示“简单使用两种分析工具并不是好的混合方法实践”。

建议 3: 切勿忽视时间之维

公共管理领域对动态 QCA 的探讨还相对较少。忽视时间维度和动态演化问题,仅以静态视角看待复杂的公共管理问题可能会产生“理论静态性与理论不饱和问题,在实证检验中则可能导致样本时间选取问题与非稳健组态结论问题” (蒙克和魏必,2023)。面对日益复杂的行政环境,若可发展出更切合的动态理论和方法,则能更科学地解决行政理论与现实脱节的问题。因此,研究者若准备使用 QCA 开展研究,需要充分考量研究问题已有理论、现实经验、拟获取的资料等,尝试探讨将“前因条件的顺序和动态性”纳入研究设计的可能性,使研究思路更严谨。在确定合适的动态研究议题后,需获取多时点截面或连续面板数据以支撑动态的 QCA,来构建动态理论或开展稳健的实证检验。动态 QCA 包括多种方法,典型的有时序定性比较分析(TQCA)、时间相关条件、时间序列定性比较分析(TSQCA)、多时段定性比较分析等。杜运周等(2021)创新性地提出了线性增长 QCA 和多时段多线性增长 QCA 方法,并给出了以上所有动态QCA方法详细的分析步骤。

建议4:依据先验理论和案例经验构建组态理论

高质量的 QCA 研究需要构建组态理论。一般来说,需要先清楚地定义被解释的现象或结果,然后依据现有的理论和案例知识,发展用于解释结果的条件(组合),最终构建能够解释条件间以及组态间联系的组态理论。在这一过程中,关键是明确说明为什么包括这些条件, 以及这些条件联系起来 ( 而非单独) 对结果的影响(Greckhamer et al. ,2018)。例如,杜运周等(2022)在开展 QCA 前,根据前因条件间相互依赖的复杂关系和现实案例,构建了组态视角下营商环境生态促进全要素生产率的复杂路径和机制。然而,由于深受逻辑实证主义的影响,公共管理领域中大部分理论倾向于根据线性关系来感知世界,以“X 增加,Y 增加”的相关形式存在。因此,对于具体的结果,研究者可能需要采用溯因、归纳或演绎的逻辑重新构建组态理论(溯因逻辑参考 Furnari et al. ,2021;归纳与演绎逻辑参考 Park et al. ,2020)。例如,杜运周等(2020)依据溯因逻辑,结合制度逻辑与生态演化等理论,从要解释的现象(营商环境生态与创业活跃度)出发,探究哪些制度组态可以产生高的创业活跃度,为营商环境生态和创业活跃度关系提供了细粒度的分析。需要注意,基于溯因逻辑的 QCA 的优势在于拓展必要性和充分性因果关系的理论,后续还需要演绎逻辑进一步检验(Du and Kim,2021)。此外,以上均为构建静态组态理论的方法,杜运周等(2021)提出了进一步发展动态组态理论和动态QCA的思路。

建议5:同时考虑先验理论和案例经验对变量进行校准

在校准的过程中,确定定性锚点尤为重要。有效的校准需要同时考虑案例资料和理论知识。例如,Greckhamer(2011)在校准福利国家这一变量时,参考已有的论点(在高福利国家中,超过 75%的医疗保健费用由政府支付,而低福利国家这一比例不到 50%),将完全隶属的阈值设置为 80%,非隶属的阈值设置为 45%,并将能够覆盖约 2 / 3 医疗成本(65%)设置为交叉点。而当缺少研究样本之外的标准和指导校准的理论知识时,研究者可采用专家法(如 Lazzarini et al. ,2020)进行校准;在最坏的情况下,研究者可只使用样本数据特征进行校准。Schneider and Wagemann(2010) 警告称:“在校准过程中,对数据进行机械的数学操作(例如使用平均值或中位数)几乎总是错误的。这种只考虑样本数据特征的方式,没有任何理论意义。”但若变量本身是基于样本特征的相对指标,则可以采用此种方法。例如,杜运周等(2022)考虑到“市场主体对城市间营商环境的评价依据的是相对水平,而且城市全要素生产水平也是一个基于样本的相对指标”,故采用此种基于样本相对位置的校准方式。

建议 6:(如果有)详细描述“容易的”反事实假定过程

当逻辑余项过多时,“容易的”反事实(easy counterfactuals)假设能够将部分逻辑余项纳入布尔最小化分析中,得到复杂度适中的中间解(杜运周和贾良定,2017)。这一过程需要充分考虑现有的理论知识。例如,Greckhamer(2016)在分析薪酬水平的影响因素时,将高经济发展作为一种“容易的”反事实。这是因为之前的研究表明,国家的经济发展程度与人口的平均收入、工业化程度和教育水平呈正相关。此外,根据已有的理论和经验知识,经济发展水平提高可以减轻国家收入的不平等,以及福利国家的目标是平衡经济福利在人口中的分配,而增加福利支出应当减少收入不平等。他将发展水平和高福利国家缺失作为影响薪酬不平等的反事实。但对于其他条件,由于缺乏相应的理论和经验知识,他没有进行反事实假设。但仍需注意,对于探索性的研究来说,尽量不进行反事实的假设(Andrews et al. ,2016)。特别是在没有成熟的理论体系支持的情况下, 优先考虑复杂解更为稳妥 ( Cooper and Glaesser,2011)。

建议7:结果阐释、升华与深化

完成 QCA 分析后,一个关键而困难的步骤是对所得组态进行阐释、升华和深化。首先,需要对充分性组态进行详细的阐释,包括对解的拟合参数(如一致性、覆盖度等)和因果复杂性的潜在假设(如殊途同归、多重并发和非对称性)进行详细的说明(张明和杜运周,2019)。另外,还需要为每个组态命名,以简洁有力地传达组态信息。这一过程需要严格结合典型案例及相关定性资料进行详细分析,并简洁地表达,兼顾组态解的整体性和每个解的独特性(Furnari et al. ,2021;杜运周等,2022)。

其次,要与现有的理论充分对话。在 QCA 得出组态之后,研究者需要深入分析这些组态,并将其与现有的理论(框架)联系起来,以加深对研究问题的理解。张明和杜运周(2019)认为,参与对话的理论不仅限于研究中使用的主导理论,还可引入其他相关理论进行补充。在对话过程中,可从以下 3 点入手。(1)应该确定现有理论是否与组态相容,以及组态是否为现有理论提供了进一步的支持或挑战。可以从组态的构成元素、条件和关系等方面入手,与现有理论进行对比和分析。(2)应该关注组态的内在逻辑和机制,探索其中的原因和因果关系,以发现与现有理论不同的因果模式和机制。(3)在组态中发现新的变量或条件,进一步扩展或修正现有理论框架。

再次,也是近年来研究者关注的重点问题,即 QCA 结果如何在结论部分和具体案例中进行更好的对话。除了第三部分论述依据不同的目的、选择不同的案例类型外,还应关注以下 3 点。(1)将 QCA 分析的结果与案例的具体情况相结合,描述分析结果是如何与案例相关的。可以在论文中通过引用案例中的具体数据、事件、背景信息等,来解释 QCA 分析结果的内涵。(2)通过对比案例之间的差异,深入探讨QCA 分析结果的意义。例如,如果 QCA 分析结果显示,某个因素是影响成功案例的关键因素,而在另一个案例中这个因素却没有被发现,则可以在论文中对比两个案例之间的差异,进一步探讨这个因素为什么在一个案例中非常重要,而在另一个案例中却没有起到同样的作用。(3)通过对案例的深入分析,进一步挖掘和解释 QCA分析结果背后的机制和逻辑。例如,可以通过深入分析一个特定的案例,来解释为什么某个因素在这个案例中是关键因素,它是如何与其他因素交互作用的,以及它是如何产生影响的等。

最后需要警示的是,QCA 并不存在严格的标准,更透明和流程化是好的,但也要警惕可能的错误标准(Cooper and Glaesser,2016)。强调标准化流程和最佳实践的指南不应该也不可能把 QCA 变成一种“机械”( point-and-click)的方法,让学习者被动地接受,从而失去自己的思考(Schneider and Wagemann,2016)。

五、结论与讨论

本研究系统地识别出中国公共管理领域 QCA 应用的主要问题,并且为 QCA 的潜在使用者(特别是在公共政策、电子政务、舆情治理等子领域)推荐一些创新做法和建议,以避免这些问题,期望能持续提高 QCA 在研究设计、数据报告和应用实践等方面的质量。系统性分析的结果表明,QCA 的应用标准具有高度的灵活性。与任何实证研究一样,每个 QCA 研究都有需要研究者灵活决策的步骤(如变量的校准、数据分析中的各种阈值、模型构建和分析的迭代等)。因此,透明地报告这些选择及其基本原理以及考虑它们如何影响研究结果,是至关重要的(Greckhamer et al. ,2018)。此外,QCA 适合用于探索性研究,而非验证性研究(Fiss,2011)。研究者需要特别警惕基于定量研究的范式和思维开展 QCA 研究。具体来说,不同于一般的实证研究,组态研究解决因果复杂性问题,具有一定的“思想实验”性质和探索性,因而在采用QCA 研究组态问题时,除非有清楚的理论依据,通常不提具体的研究假设,而是通过提宽泛的命题或理论来分析提炼研究的前因条件。

同时,限于研究的关注点,本研究文献库回顾的范围仅限于公共管理领域的核心中文期刊,这意味着英文期刊和非核心中文期刊及其他相近领域期刊的论文被排除了,因此,为全面了解 QCA 应用的趋势、问题和创新实践,未来的回顾可以扩展范围。除了更新在本研究中使用的评价标准或参数外,未来研究还可对公共管理子领中 QCA 应用的文献进行系统评价。

转自：“公共管理评论”微信公众号

如有侵权，请联系本站删除！

上一篇： 武汉大学团队发布中文版世界银行营商环境新评估体系
下一篇： 可憎的比较：社会学中的不可通约性、案例研究和小样本 | Sociological Theory

投稿问答最小化 关闭

戴正包国宪 | QCA 在中国公共管理研究中的应用:问题与改进

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

戴正 包国宪 | QCA 在中国公共管理研究中的应用:问题与改进

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭

戴正包国宪 | QCA 在中国公共管理研究中的应用:问题与改进