2022/11/30 16:48:10 阅读:1905 发布者:
原文刊载于《中国考试》2022年第11期第67—76页。
作者
杨柳,北京师范大学数学科学学院在读博士生。
郭玉峰,北京师范大学数学科学学院教授,博士生导师。
摘要
“双减”政策与教育评价改革皆以高质量育人为根本旨归,精准化教育测评为减负与提质的耦合并进指明了新的方向。立足于“双减”重要理念与具体举措,从测评基点、测评路径、测评机制3个方面阐释教育精准测评的顶层发展逻辑,建构包括目标精准确立、测验精准布局、数据精准分析、结果精准应用4个核心环节的教育精准测评实施框架,以知识与能力双目标的映射统一为基础,联合项目反应理论与认知诊断理论实现兼具群体共性与个体特性的精准测评。以初中数学为例的应用分析表明,精准测评能够实现学生的个性化诊断,为个性化学习、补救式教学等提供有益参考,从而打造教育质量与效用协同提升的“双减”新生态。未来应进一步推进测评目标的过程性优化、多模态数据的互补式融合、智能技术的适配性应用,以实现“双减”导向下精准教-学-评的一体化发展。
关键词
教育评价改革;“双减”政策;教育精准测评;个性化诊断
正文
0 引言
现阶段我国正处于教育高质量发展的关键时期。为从根源上系统解决学生学业负担过重问题,2021年7月国家发布的“双减”政策与2020年10月发布的《深化新时代教育评价改革总体方案》共同构成落实减负、提质教育目标的重要抓手。伴随测量理论的发展,评价由笼统测验分数评判转向精准的个性化诊断[1]。但是,当前的基础教育考试仍然存在测评数据浅表化、碎片化、粗放化等问题。针对上述转变趋向与现实问题,精准化和个性化的教育测评将打破传统学校教育的藩篱,为减负与提质的协同并进指明新的方向,并有力推动“双减”工作的全面落地与有效开展。
1 “双减”视域下教育精准测评的发展逻辑
基于“双减”政策的重要理念与具体举措,从测评基点、测评路径与测评机制3个维度审视“双减”视域下教育精准测评的发展逻辑,为实施框架的构建提供多重依据。
1.1 测评基点:数量与质量兼顾的精准定位逻辑
从我国基础教育改革长期的减负实践看到,一味在教材、课程、作业等方面的“减量”无法从根源上解决学生过重学业负担问题,也很难实现学生综合素质发展与教学质量提升的教育目标。相比于以往出台的中小学“减负令”而言,“双减”政策更具战略性、全局性与深刻性,试图走出“表层减负”“考试减负”的工作常模[2]。“双减”政策明确提出了压减作业总量和时长的重要措施,同时对作业设计质量、考试命题质量、课后服务质量、课堂教学质量等提出了更高要求。新时代的“双减”政策立足于我国教育发展实际,深入剖析数量与质量的辩证关系,凝聚减负与提质的共同效用。
投射到教育测评领域,测评目标与维度的确定、测评工具与试题的设计、测评方式与方法的选定等环节都直接关乎教育测评的实际效力。其一,测评目标的精准定位是教育测评开展的先决条件。为避免因目标数量太多出现测评结果不准确的情况,测评目标应在切合学生自身情况之上秉承少而精的确立原则。其二,测评工具的精准制定是教育测评达成高精确度的有力保障。在确保试题难易度、区分度、信效度良好的情况下,运用尽可能少的题目数量和考试次数诊断学生的知识掌握和能力习得情况,避免重复评价、高频考试、无效考试给教师和学生带来的教学负担。其三,测评方式的精准选定是测评数据生成有效测评结果的必由之路。对于想要测评的特定构想,绝非是采用越多的测评方法越好,而是要选择与测评目的尽可能契合与适用的测评方法[3]。在兼顾数量与质量的核心要义指引下,通过建立严谨合理的目标框架,采用科学有效的测试工具,选取恰当适宜的测评方法,以指导和改进整个教育测评精准化建设。
1.2 测评路径:综合与个性统一的精准分析逻辑
由于过去教育评价对教育多样性特征重视程度不够,在评价过程中存在较为严重的“标准化”“一刀切”问题,导致各类教育共同存在同质化或趋向化问题[4]。尤其对于学生群体而言,学生的家庭情况、教育背景、学业基础、学习习惯及未来人生规划都不尽相同,应同时遵循学生群体发展规律与学生多样化发展特点开展教育评价工作。“双减”政策以满足学生多样性发展为根本出发点,在提升学校服务质量、拓展课后服务渠道、开发优质线上教育资源等方面提出了一些可行性办法。尊重学生个性化发展的教育测评旨在不断挖掘学生的多维发展潜力,让学生在一般性成长之上发展成为一个个独特而灵动的生命体。
“双减”政策进一步推动教育测评向着个性化、精细化方向发展,学生的综合性评价抑或是个性化评价都需要借助科学规范的教育测量理论与方法,探寻兼具宏观测评与微观测评的融合之道。教育测量理论大体经历了2个发展阶段:以经典测量理论、概化理论、项目反应理论为主的标准测量理论阶段和以认知诊断为核心的新一代测量理论阶段[5]。2个阶段的测量理论与模型各有侧重与优势。新时代的教育测评理念更加注重学生群体宏观水平评估与个体微观认知过程诊断的交融并重。随着教育的精细化发展,学术界开始广泛关注评价系统的个性化、全面性与自适应性,学习评价也由笼统的测验分数转向个性化诊断结果。因此,教育精准测评的未来可持续发展需要借助不同教育测量理论与技术的优势,提升学生测评数据分析的针对性与准确性,建立测评数据、测评方法与技术、测评结果有序联结的精准分析测评路径。
1.3 测评机制:静态与动态共生的精准反馈逻辑
在传统教育测评中,考试和测验是教育测量手段层面的典型形态,以终结性评价或总结性评价作为主导思想[6]。这种以结果为导向的测评理念无疑在助长“唯分数”“唯升学”“唯文凭”等导致学生负担过重的沉疴积弊,甚至还会让学生带着愈发强烈的学业焦虑症,深陷于“鸡娃”“内卷化”等教育异化现象之中,逐渐淡化对于学习本身的真切热爱与远大抱负。“双减”要达到预期目的,需要破除以往以分数为标准的“育分式”评价,凸显以教育导向性和育人性为基本要义的“育人式评价”[7]。
在“双减”政策形成的教育生态中需要建立科学的教育评价体系,进一步弱化测评的选拔与甄别功能,强化测评的诊断与反馈功能。测评结果的运用不应该仅仅停留在成绩、排名的表面数字意义上,应力求充分挖掘结果背后的测量学意义和教育教学价值。学校、教师要学会用长局眼光看待当下的教育测评结果,为以往以及后续的课堂教学评价与学生测评提供可靠证据支撑,可以通过结果性评价和过程性评价的测评信息进行相互支持、相互印证,以利于结果评价与过程评价形成合力,从而提高教育测评的效益与效率[8]。一方面要重视静态测评结果数据的科学解读与精准使用,依托于教育测量理论、教育学原理等专业知识,对采集到的测评数据进行正确阐释,发挥测评结果对于学生学习情况的诊断评判功能;另一方面可将不同阶段的测评结果进行纵向关联,随着课堂教学的推进形成一条连贯统一的数据链,逐步建立教育测评的动态化精准反馈机制。
2 “双减”视域下教育精准测评的实施框架
从顶层发展逻辑出发,梳理“双减”视角下教育测评精准化发展的关键环节,据此设计以知识状态和能力水平为目标导向的精准测评实施框架,见图1。该框架强调从测评目标出发,经由测验的有序开展、测评数据的多维分析,进而实现测评结果的有效应用,其中,精准性要求贯穿于整个实施框架之中,推动各环节之间的相互融合与优化。
2.1 测评目标的精准确立
在教-学-评一致性的教育准则指引下,为确保“以评促学”“以评促教”的教育目的得以落地,测评目标应该与当下的学习目标、教学目标保持高度一致。测评目标的精准性主要体现在2个方面:其一,测评目标的确立需要建立在学生学习情况、教材内容及教学实施情况的综合分析之上,依据最近发展区原理,制定与学生发展规律和个体发展需求高度契合的测评目标;其二,对学生知识掌握情况、能力素养水平等的测评有精细化标准,在测评目标体系中强调对各个目标维度的合理拆解与科学细化,形成清晰准确的目标层级关系和整体结构。
对于具有较强关联性与逻辑性的数学学科而言,测评目标更要紧扣课程标准、教材以及教学内容的基本范畴,准确把握数学内容的上下位关系以及具体知识点的前驱后继关系,为实现对学生微观层面的个性化诊断提供依据。近年来,随着国际数学教育界对数学能力测评的愈发重视,打通知识目标与能力目标的融合式测评将成为教育测评高质量发展的有效路径之一。有研究构建了以大概念为核心的结构化知识、以关键能力为核心的结构化能力为关键要素的新结构教学评框架[9],是提高学习测评科学性与精准性的有益尝试。基于此,本研究设计的实施框架将测评目标定位在知识与能力2个维度,在测评目标的细化过程中要充分考虑知识与能力的整体性与关联性。
2.2 测评测验的精准布局
施行测验是让测评目标从理论构想走向现实场域的关键一环。考试与测验作为实现测评目标的基本方式,其形式会跟随测评目标的变化而变化。不同形式的测验所关注的重点、希望解决的问题也会存在一定差异[10]。用于学生诊断的测验应当兼具常模参照测验和标准参照测验的基本功能,不仅关注同一群体学生的整体水平以及学生个体在群体中的相对位置,同时也关注学生是否达到课程标准、学习目标中的具体要求。同时,以学习者为主体的测验兼顾学生表现的群体共性与个体差异,通过实施一系列科学完善的测验流程,发现学生的薄弱点、闪光点与生长点。
测评试题的精准研制是整个测验流程的核心步骤,要考虑试题内容与学习者本身的匹配程度,建立测评试题与测评目标之间的映射关系。基于这种映射关系,往往设计双向细目表用以表征每一道试题与其考查的知识点、能力的对应关系。有价值的试卷往往是将学科知识点分布在不同类别的题目中,用以考查学生对不同知识的掌握情况[11]。即便是分数相同的2名学生也会存在不同的得分点、失分点,反映出来的知识体系与知识点掌握模式也不尽相同。就测评目标的多维性而言,每一道试题所考查的知识点数量、能力目标数量应该进行合理配置,采用具有适宜数量、合理难度、科学结构的试题为每个具体知识点和能力点设置测评点,实现对学生真实表现的精确测评。
2.3 测评数据的精准分析
数据分析体现了对原始数据的加工与提炼过程,是测评数据转化为有效测评信息的重要途径,也是实现学生精准测评的必备条件。对学生测评数据的科学分析需要教育测量理论与技术的支撑,借助正确合适的测量模型与分析方法对测评数据进行深度挖掘。因此,本研究的实施框架将测评目标定位在知识与能力2个维度,结合知识与能力目标的结构体系与数据特征分析,有针对性地选用认知诊断理论(cognitive diagnosis theory,CDT)对被试学生的知识掌握情况进行诊断,以及项目反应理论(item response theory,IRT)对被试学生的能力水平进行测评。
在知识维度的测评方面,认知诊断理论可以将学生在测验题目上的作答情况与特定的知识属性掌握情况建立对应关系,进而能够对学生的知识学习情况进行标准化的多维评价[12]。在心理测量学领域开发的众多认知诊断模型中选择拟合效果好的模型进行数据分析,从单个知识点的掌握程度和整体知识结构的掌握模式2个层面为学生测评提供精细化的诊断信息。在能力维度的测评方面,多维项目反应理论(multidimensional item response theory,MIRT)克服了单维项目反应理论(unidimensional item response theory,UIRT)只能提供一个能力值的限制,可在多个能力维度上提供被试学生的表现信息[13],同样也可以从单一能力水平和整体能力水平2个层面提供更加多样化的学生测评信息。对测评数据的精准分析,如同建立了一个兼有学生知识与能力数据的多元化信息库,在学生群体的共性特征与学生个体的个性特征2个方面提供了丰富的诊断信息,将促进后续测评结果的有效应用与精准反馈。
2.4 测评结果的精准应用
测评结果精准应用于教育教学场景之中,其根本要旨在于将精细化的学生测评信息按照一定的规则和规律进行沉淀,最大限度地提升数据信息的价值密度,发挥精准测评对实际教学的评价与指导功能。此外,应用的精准性还体现在利用数据挖掘、可视化技术、知识推理方法支持从数据到评价的转化与升级过程。以数据信息的有序化、精准化发展为导向,为实现测评结果的精准应用,需要经过测评结果的多元呈现、测评结果的科学解释及测评结果的应用反馈3个阶段。
首先,完成从“碎片化信息”到“有序化信息”转化。针对具体应用场景的需要,应用可视化分析技术对数据结果进行直观化呈现。基于知识与能力的内部层级关系与外部结构特征,运用统计分析图表、社会网络分析等方法对学生测评情况进行可视化呈现。基于群体共性、个体特性2个方面的深度剖析,依据数据标签构建学习者群体画像和学习者个体画像,全方位展示学生的测评结果。其次,完成从“有序化信息”到“精致化信息”转化。制定数据解释框架,进一步提升测评结果的专业性与可解释性。组织统计测量专家撰写数据分析报告、学科专家给出诊断性教学建议等,通过对数据的深度挖掘,为测评结果的精准运用提供专业保障[14]。最后,将精准化信息真正应用于学科教学实践之中,通过学习路径规划、学业预警分析等措施,为教师的补救式教学、差异化教学、精准化教学提供依据和参考。与此同时,测评结果的应用效果也将推动教育测评各个环节的改善与优化,为精准测评的动态反馈机制持续助力。
3 教育精准测评实施框架的应用分析
精准测评是智慧教育赋能下的测评新形态,实施框架注重环环融会贯通、步步有据可循,有效促进学校教学评价的良性发展与教学方式的持续优化。本文以初中数学学科为例,从实证分析视角探索教育精准测评的应用过程与初步成效。
3.1 测评定位与数据选取
选用初中数学实数章节6个知识点作为知识维度目标,它们是算术平方根定义(A1)、算术平方根计算(A2)、平方根定义(A3)、平方根计算(A4)、立方根定义(A5)和立方根计算(A6)。同时将数学运算能力确定为能力维度目标,考查学生在理解平方根、立方根概念的基础之上进行乘方与开方运算的基本能力。依据试题与测评目标的对应关系,构建认知诊断Q矩阵以及双向细目表,并以此为依据选取和编制24道试题。学生完成上述6个知识点的学习之后,立即实施测验,以确保测评的时效性与针对性。数据来源于北京市某中学初一年级3个班学生的测试数据,有效样本量为123名学生。
本套测试题的Cronbach α系数为0.828,且每个项目的Cronbach α系数均大于0.8,试题具有较强的内部一致性。本案例融合多种教育测量模型进行诊断测评:其一选择常用的DINA模型进行知识层面的认知诊断分析,拟合度检验发现24道题目的RMSEA值均小于0.1,项目数据与该模型拟合效果较好;其二选用单参数单维度Rasch模型进行能力层面的测评分析,试题的拟合指标Infit MNSQ和Outfit MNSQ分别为0.99和1.13,均在严格标准范围内(0.7~1.3),说明数据与Rasch模型拟合度良好。以上数据说明,使用本套测试题进行知识维度和能力维度的测评可以保证信度和效度。
3.2 数据分析与专业解释
3.2.1 学生总体情况的宏观分析
为了解学生总体的知识目标达成情况,运用认知诊断方法对学生样本的作答情况进行分析,得到6个知识点的平均掌握概率值见表1。从知识目标的掌握度来看,学生对6个知识属性的整体掌握情况良好。从各知识点平均掌握概率可知,随着学习顺序的推进和知识复杂度的加深,学生对算术平方根、平方根、立方根3个定义的掌握度依次降低,对定义型知识的掌握度要优于计算型知识,学生总体在相应知识的数学计算上还存在提升空间。
为了进一步呈现学生表现的总体趋势与分布情况,借助气泡图反映学生在知识掌握度、能力值、知识点掌握个数3个维度上的具体表现,见图2。从整体趋势来看,伴随知识掌握度的提高,学生的能力值呈现上升趋势,知识点掌握个数也愈发增多。从班级差异来看,C班学生集中分布在高知识掌握度、高能力值的范围内,总体表现最好;A班和B班学生表现分布较为分散,知识与能力表现情况存在一定跨度。对不同班级学生表现的多维度刻画,可以帮助教师准确鉴别各班级学习目标达成情况,并采取针对性的教学改进策略与措施。
3.2.2 学生群体聚类的中观分析
为了识别与分析不同类别学生的群体特征与表现差异,本研究选用K-means聚类分析法对样本数据进行聚类分析。以学生的知识标签和能力标签为指标,将学生划分为4个类别。7个指标下方差分析显著性P值都小于0.05,各分类下的聚类中心距离分布均匀,分类结果科学合理,4个聚类下学生测评结果见图3。
由聚类分析结果可知,聚类1在6个知识目标上的表现最为优秀,且学生能力值也处于较高水平,可以作为其他学生后续学习提升的目标参照。相较于聚类1,聚类2仅在A4上表现稍弱,这表明平方根的计算是学习难点之一,学生在初次学习之后仍需练习巩固。从诊断问题的角度出发,聚类3在A2、A5上表现较差,说明在某些定义的理解与计算方面有待加强;聚类4在A2、A4和A6上均表现较差,说明在数学计算上存在相当大的困难。此外,聚类3、聚类4的数学运算能力值较低且非常接近,但在精细处的知识掌握状态存在较大差异。综合不同聚类学生在各目标维度的表现进行分析,可以清晰地反映出学生群体层面的集中优势与不足,从而引导学生在弱项上改进与努力。
3.2.3 学生个体特征的微观分析
以群体聚类分析结果为基础,依据认知诊断分析下的精准测评能够提供每个样本学生的属性掌握模式,进而揭示不同层次学生个体在6个知识属性细微处的不足。以3个不同聚类下的学生代表为例,学生A、学生B、学生C的知识属性掌握模式分别为(1,1,1,1,1,1)、(1,0,1,1,0,0)和(1,0,1,0,1,0),据此对学生未掌握的知识点进行针对性地复习与巩固,建立独具个体特色的个性化学习路径。
由于数学学科知识之间具有高度相关性与继承性特点,学生还需在知识点之间建立关联意识,并逐步建立自我的数学知识体系。本研究采用认知网络分析法(epistemic network analysis,ENA),借助在线分析平台ENA Webkit对学生的知识关联结构进行可视化表征和深度剖析[15]。依据认知网络分析原理,以学生个体为分析单元,以每道试题为分析小节,通过量化知识要素之间的共现情况,生成学生的认知网络结构图,见图4。学生A来自聚类分析中的优秀组,“平方根定义”“算术平方根定义”的自现频次(节点大小)与共现频次(连线粗细)都较高,二者为认知网络中的核心连接点,该知识结构图可作为其他学生学习的有效参照。从学生差异性分析来看,学生B在“平方根定义-算术平方根定义”和“算术平方根定义-算术平方根计算”两条连线上的认知强度不够,应结合个体学习需求进一步加强与提升;学生C则应该在“平方根定义”“算术平方根定义”“平方根计算”3个方面增强数学知识的关联性与同步性学习。利用认知网络分析挖掘学生知识结构的现实状态与发展空间,以便在学科知识体系下制定精准化的教学设计与方案,让学生从低阶知识结构走向高阶知识结构。
3.3 测评效果与应用反馈
为进一步验证测评结果的准确性,针对上述6个知识点抽选10名学生进行回访,回访结果与DINA模型下知识点掌握模式基本一致。在后续进行的单元测验中抽取同质性试题对学生作答情况进行预判。基于Rasch模型的学生能力值和试题难度值估计发现,回访学生的个体答题判准率均大于0.7,平均答题判准率为0.871;因此,本案例下知识与能力融合式教育精准测评的实施方案具有一定可行性及有效性。
凭借知识与能力的双目标精细化测评方案,分别从总体宏观层面、聚类中观层面以及个体微观层面对学生表现进行深度剖析,得到了丰富且有效的学生诊断信息。针对班级群体而言,教师可以依据所在班级集中出现的学习问题以及与优秀班级的表现差异,分析制定适宜的教学目标与学习路径,采取针对性的班级分层式教学、差异化教学,提升教学效果与教学质量。针对个体学生而言,通过精细化的诊断信息充分了解现实状况与未来进步途径,为补救式教学实施与学生个性化学习提供重要参考。
4 未来展望
4.1 测评目标的过程性优化,推动减负提质协同化发展
测评目标的精准确立是教育测评开展的首要环节,决定着测评整体布局与阶段化实施的基本走向。在“双减”政策的理念指引之下,本研究设计的教育精准测评实施框架强调知识目标与能力目标的映射统一。新一轮课程改革对测评目标的进阶优化提出了更高要求,应在学科知识体系、学科关键能力、学科核心素养的整体构架中制定测评目标,伴随教学推进形成愈发精确与完整的目标序列集。通过构建教育知识图谱加强测评目标之间的逻辑关联,还可以助力学生系统高效地建构知识体系、优化学习决策,促进学生个体的自我剖析、自我改进与自我发展[16]。测评目标的过程性优化有效契合学生知识状态与学习水平的动态变化,实现教育测评效能的稳固提升,增进教育减负提质问题的根本性解决。
4.2 多模态数据的互补式融合,支持精准测评纵深化推进
教育测评中多模态数据的统一采集与有效分析,在一定程度上为学生问题诊断及个性化学习推荐带来了不同层面的证据支持。多模态测评数据共同构成课堂教学的有机整体,可通过探寻数据间的内在关联,充分挖掘评价表现背后的育人价值[17],进而探索基于多模态数据支持下的教育精准测评发展机制。一方面,围绕教学目标与学习需求将总结性评价与形成性评价进行统摄整合,既要重视在客观化、标准化测验中形成的学生显性测评表现,也要关注学习活动中与学生测验表现产生关联的其他多模态数据,比如学习行为特征、课堂互动表现、情感心理状态、语言表达等。另一方面,在动态教学进程中加强测评数据的实时反馈与纵向追踪,将不同时间与空间的测评数据进行深度联结并形成连贯统一的数据链,发挥增值性评价与发展性评价的功能。最终通过多样化数据的补充与交互印证实现数据的“降维”与“提纯”,为教育评价提供一致性、精准性、实质性的测评结果。
4.3 智能技术的适配性应用,赋能精准教-学-评一体化发展
人工智能的技术变革开创人机耦合的教育新生态,赋予“双减”政策扎根落地的沃土,指明精准教-学-评一体化发展的新出路。运用信息技术可将日常学习的数据按照一定规则进行收集、沉淀与分析,助力于精准教、学、评的整体优化,为学生学习质量提升、教师工作负担减轻提供可行性解决方案[18]。需要强调的是,人工智能技术根植于教育测评领域尤其要注意适配性问题,在教育精准测评实施框架的各个环节采用合适的智能技术进行精准匹配。比如:针对学生主观题的文本作答数据,利用自然语言处理技术提取关键信息辅助学生个性化诊断;针对学习过程性数据链,运用机器分析技术精准抓取学生学习行为路径、学习内容偏好、学习兴趣度等个体特征;针对学生个体知识状态与能力水平,基于智能化推送系统向师生提供精准化学习报告、练习任务推荐,并据此设定下一步教学目标与学习计划。通过对教育测评智能化的不断深耕,经由整体设计、分步实施、迭代优化,必将迈向精准教-学-评一体化发展的新天地。
转自:“中国考试”微信公众号
如有侵权,请联系本站删除!