作者信息
徐瑾劼/上海师范大学国际与比较教育研究院、联合国教科文组织教师教育中心、教育部教育大数据与教育决策实验室副教授,硕士生导师;
张民选/上海师范大学国际与比较教育研究院、联合国教科文组织教师教育中心主任,教授,博士生导师。
本文摘要
新时代,以数字技术为支撑深化教育评价改革对教育监测的价值定位、实践模式和行动路径不仅提出了新的要求还提供了新的思路和方法。课题组通过洞察不同国家及国际组织推动教育监测数字化变革的探索与实践,发现技术赋能有助于促进多元共治的教育现代化治理能力提升,强化对教育发展的前瞻性和预警性作用发挥,提供支撑精准教与学的过程性可靠数据,以及提升大规模因材施教的管理能力。近年来,大数据技术和人工智能技术的发展和运用,已重构了教育监测内容、重组了监测实施流程并拓展了监测结果应用的领域。从发展趋势和方向看,教育测评的智能化和建立基于纵向数据的教育监测体系是适应新时代要求推动教育监测数字化变革的主要行动路径。立足于我国传统的教育监测体系推动数字化变革,应加强基于教育监测生态系统观的顶层设计,加大系统层面大数据技术的应用,理性对待算法的准确性,以及提升教育者及管理者的数据素养和循证决策意识。
随着人工智能、社交机器人、物联网等智能技术在教育领域的广泛应用,教育系统从理念目标、课程体系到教学模式在全方位地重构。服务教育决策、指向衡量教育系统各层面发展水平及内在关系的教育监测也在发生变革。然而,目前我国教育监测的数字化生态尚未建立,仍然存在价值指向不明、各层级数据割裂和有效信息支撑不足等问题。基于此,本文重点立足于全球视野,试图厘清和阐释数字化变革背景下教育监测的价值定位及其实践模式和行动路径,以期为我国深化教育评价改革,结合技术赋能,构建具有中国特色的教育监测体系提供思路和借鉴。
一、数字化变革重塑教育监测的价值定位
教育监测,抑或称为教育系统评估,指向的是系统层面对教育质量或成效的评估,是在教育事业或专项的教育战略与行动计划的实施过程中进行的,其对应的英文全称“monitor & evaluation”诠释了“评估”与“监测”两大功能。在实践操作中,教育监测立足于引领和监控教育发展两个视角:一方面通过对结果进行评估,引领社会树立正确的教育价值观,发挥指挥棒的作用;另一方面则通过构建涵盖教育投入—过程—产出的大规模教育质量数据库和大数据处理平台,监控教育发展状况。近年来,随着大数据技术和人工智能的大规模应用与飞速发展,教育监测在技术的赋能下正在从过去依赖于一次性、单项性的结果评估转变为通过开展持续性、综合性的监测,凸显在过程中监控以促进发展的功能定位。数字技术正在通过对教育系统不同层面的数据进行整合和融通,对教育监测实施过程中的要素进行重构和流程再造,从而拓展教育监测新功能,赋予教育监测新的价值和使命。
(一)促进多元共治的教育现代化治理能力提升
“监测”在教育领域中的应用源于“证据驱动的教育治理模式”的兴起。教育系统的复杂性改变了教育治理模式。“复杂性”是指教育治理出现多元共治的新局面:第一,家长、社区、社会组织和媒体的参与日益深入对教育提出多样化需求;第二,教育管理权责出现向区域—学校—班级的向下分权。教育治理模式不再是单向、线性的指令传导,而是网络交错式的多主体协商共治。该治理模式下基于政策改进的协商式学习要求构建跨部门、跨区域和跨学校的动态数据资源体系。而传统教育监测体系中不同层级的数据处于彼此割裂的“孤岛状态”。经济合作与发展组织(简称经合组织)于2011年发起了一项长达十年的数字化改变教育决策的跨国行动研究。该研究发现,基础教育监测体系普遍存在班级、学校、区/省市、国家层面数据采集的不一致,尚未在既定的概念框架和指标体系中采集统一口径和标准的数据,阻碍各层面数据的融通。近二十年来,随着教育大数据建设的推进,各国或地区的各级教育行政部门在开发或升级本地的教育信息系统,如美国的纵向教育数据系统SLDS和韩国的国家教育信息系统NEIS。利用大数据技术建设教育数据资产管理平台可打破原先的数据孤岛,建立整合教、学、管、考、评、研究及家校等跨部门服务的智慧教育管理系统,同时为市或区级局管理者、校管理者、教师、学生和家长开放不同的使用空间。
(二)强化对教育发展的前瞻性和预警性作用发挥
传统教育监测重在采集、整理和分析教育资源投入(经费、生师比等)和产出的静态数据,但对描述和反映资源如何转化为产出以及转化过程中出现的问题缺少过程性数据。这削弱了教育监测对政策干预和改进的功能。这个问题可归咎于两方面的障碍:支持数据分析的算法技术落后以及缺乏与政策调整同步产生的过程性数据。基于上述两大障碍,一方面,人工智能和机器学习技术的应用提升了算法能力。高级算法支持下的教育监测系统基于大数据甄别各类“问题”学生并对其实施动态追踪和提前干预。美国、爱沙尼亚、德国等的教育监测纳入了针对高中生辍学、职校生消极情绪、学业不良等“问题行为”的早期预警系统。 另一方面,技术赋能下的教育监测系统采用物联网技术,通过传感器实现对物体的智能识别、定位及监控并通过与网络连接把信息实时存储和传输到管理中心,最后通过云计算对产生的大量的实时数据进行清理、整理和分析,为政策调整和改进提供有效的信息支撑。教育监测系统中的学校数据可通过机器学习被整理、汇总到区级、市级层面,为实时监测教育政策的逐层逐级落实和及时调整提供技术支撑。
(三)提供支撑精准教与学的过程性可靠数据
面向未来和数字社会,教育系统亟待提升效率与公平。教育目标从实现“人人有学上”转向为每一名学生提供适合的教育,发掘他们的潜能。新的教育目标要求教育监测提供更为精准、细节性的评估,不止于结果,应下沉到教与学的过程,从而为教育教学改革提供可靠性数据。发展以人工智能为核心技术支撑的课堂分析及智能化测评可获取颗粒度更细的微观数据,拓展教育监测新领域。近年来,智能课堂教学诊断系统和游戏化测评采用人工智能技术支持的人机交互技术并结合虚拟现实和增强现实技术,通过创设数字化环境中的真实情境,获取并分析学生在问题解决过程中的认知、非认知和元认知技能运用和变化的行为数据。更有意义的是,在人机交互过程中,应用可穿戴智能技术和高级感应技术可实时获取学生在问题解决过程中的情绪、兴趣、动机等社会情感变化的信息以及学习策略采用的行为数据(如坚持、主动性等)。德梅洛等学者进一步提出了利用数字学习技术测量学生参与的方法,即AAA(高级的、分析的、自动化的)模型。这进一步拓展了教育监测领域的范畴,从学生的学业成就拓展到情感发展,从学生学了什么拓展到学生如何学等复杂技能,为评估全人教育理念下五育并举的成效提供支撑。
(四)提升服务大规模因材施教的管理能力
目前,数字技术已在学校和班级层面广泛应用,开始颠覆传统育人模式,如智慧校园的推广应用。物联网技术被广泛应用于智慧校园的建设中。通过在学校安置传感器和感应设备及时探测和监控有关校园安全、资源、设备和场所使用等指向学生生活和学习等行为数据的动态变化。在大数据技术广泛应用的支持下,教育信息系统产生了大量、常态化描述学生生活和发展轨迹的纵向教育数据,如学生学业记录、毕业流向以及学生在学习资源选择、使用等方面的信息。在过去,这些数据是彼此孤立、碎片化和静态的。但在基于大数据技术的教育监测系统的支持下,这些数据可联动、汇聚并指向特定的关系。例如,在大数据的基础上采用机器学习算法中的概率论的分类法及回归分析甄选出对政策依从度高的特定学生群体(资优生、学困生、心理障碍学生、家庭社会经济背景不利的学生等),为实现精准施策提供基础。更进一步的发展是,随着在线学习、数字设备、智慧校园及学习管理系统等教育新基建的大规模应用,催生出获取大量指向学生发展的数据路径。这些路径为更准确、即时地了解学生如何学习、如何进步、如何获取支持提供不同视角,也为不同区域及同一区域的不同学校基于生源特征进行资源分配和支持倾斜提供有效的证据支撑。
二、教育监测数字化变革的实践模式
在技术赋能下,先进的手段改变的是教育数据的采集和整合的方式,但如果实践模式不发生根本性变化,数据就无法转化为有效的证据,支持和服务教育监测体系新的使命和价值定位。在传统的教育监测体系中,数据主要被用于支撑评估结果的应用,代表性的实践模式是基于数据的教育决策。早在20世纪90年代,学校管理者、教师、政策制定者等教育系统中相关主体开始利用量化数据作为必要的依据支撑决策和政策成效评估。进入21世纪,美国和欧洲发起了通过大规模策略性地使用数据以提升学校绩效的专项行动。例如,2004年美国发起了“面向未来的教育”行动倡议,2010年实施了“基于数据驱动决策的信息基础设施SLD计划”,同年欧洲开展了“基于数据驱动学校改进的领导力建设”项目。从这一时期数据在教育监测中的作用看,部分国家已经利用大数据技术收集学生学业成绩并在学校和区级层面进行分析,形成指向学校教学质量的评估和指向学区教育均衡发展的评估。2010年后,随着机器学习、数据挖掘在教育监测领域的应用,用于监测及监测过程中产生的数据的形态和价值发生了实质性的变化。大数据技术和人工智能的应用重构了监测内容、重组了监测实施流程并拓展了监测结果应用的领域,实现数据—信息—知识—证据的转化,推进教育监测从过去基于数据转向基于证据引领和监控教育发展的实践模式转化。
(一)监测内容:采集指向学生的多模态数据,践行“全人教育”理念
新时代育人工作重视培养“完整的人”。这需要弥补传统教育监测体系视域下以“分数”代表学生的弊端,遗失学生的主体性参与,尤其是动机、情感和兴趣的发展。随着人工智能的发展,常态化教育监测已经能够通过智能课堂及测评系统采集学生在作业完成和问题解决过程中生理、行为(鼠标键盘、眼动追踪数据)、语音以及与情境交互产生的多模态数据,勾勒学生的数字画像。近年来,经合组织利用技术不断创新教育测评方式,突破传统教育监测所关注的认知技能,将监测内容拓展至学生的非认知技能和过程性思维。其中,具有代表性和影响力的是其在PISA 2022中对全球15岁学生进行的创造性思维的评估和PISA 2025创新领域“在数字世界中的学习”测评。经合组织在测评中利用自适应和智能技术,通过创设真实的问题情境,以学习任务为载体,以主体参与学习的过程为观测点,对学生认知、动机、行为(努力和坚持)、合作(同伴学习)和元认知(学习策略)等五个方面作出综合的描述与评估。更值得关注的发展方向是经合组织、联合国教科文组织和国际教育成就评价协会还重视系统监测在数字化环境中学生数字阅读和问题解决能力。这表明,数字技术不仅是提升教育监测质量的手段,还成了重要的监测内容,即学生在数字化环境中知识、技能的运用及情感的发展。
(二)监测流程:实现从循数转向循证的教育监测体系的建构
大数据技术和人工智能支持下的教育监测体系不断产生数据并基于不同目标把数据转化为促进精准干预和政策改进的知识、证据和行动。在技术赋能下,教育监测在实施过程中主要经历了以下主要阶段。
第一,教育理念及目标转化为监测指标体系。该阶段的主要任务是构建基于监测目标,包括指向教育改革、课程改革、学生能力发展(创造力、学科素养等)目标的评价框架和指标体系。把教育政策或行动计划的理念目标转化为可观测的指标并明确各层级(学校—区县—省市—国家)可提供的数据。例如,我国基于中国教育现代化2035目标的监测指标设计,联合国教科文组织基于可持续发展目标制定的全球教育监测指标框架,涵盖7个具体的监测领域等。
第二,通过教育信息平台和管理驾驶舱建设,实现教育数据要素的整合和融通。该阶段的主要任务是:第一,对来自教育系统不同层面和部门的多来源的数据基于共享的标准或口径进行清洗,通过数据清洗,解决不同统计口径、不同年度数据的可比性问题;第二,整合不同来源、不同主体的数据,构建基于不同目标可进行跨层、跨主体分析的教育监测数据库。该环节的落实目前主要依赖于大数据技术和教育数字驾驶舱建设,通过打破教育监测体系中彼此割裂的数据孤岛,融汇数字集合,实现一屏纵览教育系统的运行状况。
第三,进行监测数据分析和挖掘,完成从数据到教育知识的转化。海量的数据需要整理才能转化为有价值的信息。通过采用教育数据挖掘技术,探测和发掘大数据中所蕴藏的类型或重复出现的关系,为发现教育知识和进一步通过验证形成教育规律提供基础。大数据技术和人工智能的应用产生了大量、来源丰富(教师/学生的自陈式报告、行为观察等)并且可下沉到班级课堂层面的教与学的过程性数据,这改变了过去基于结果,依赖于教育投入—产出两端的数据分析模式。
第四,监测结果可视化,促进教育知识和经验的传播。数据分析师、统计分析人员需与教育专家合作,以可视化的方式(如图、表、仪表盘)展现重要的数据发现,促进决策者、校长、教师、家长等相关主体的信息交流与协商,为新的知识生产提供条件。目前,国际组织,包括经合组织、世界银行、联合国教科文组织通过提供基于教育监测产生的公共产品并以可视化的方式积极分享和传播发现的教育知识,扩大话语权,影响全球教育政策的走向。例如,经合组织基于国际学生评估项目(PISA)开发了基于测评结果的交互展示平台,基于跨国课堂视频研究建立数据库;世界银行开发和实施了基础教育质量评估(SABER测评) 。
(三)监测结果:服务科学决策,促进教育知识向有效证据的转化
目前,智能技术已颠覆课堂教学模式,为教与学的精准干预提供了有力的支撑。但在教育系统层面,智能技术尚未充分服务科学决策。难度在于从监测结果到形成科学支撑政策改进和决策的有效证据需要行动智能。行动智能的工作逻辑是把教育数据转化为教育知识并吸纳公认的价值、相关主体的共识和判断,形成有效的证据并采取行动。首先,在系统层面对学校、区或省市采集的数据进行聚类并采用人机协同模式,从宏观层面生成有关学生如何学、教师如何教的知识;而后,参与教育治理的多元主体,包括政策制定者、决策者、校长、教师代表需基于系统层面获得的教育知识展开交流、协商,提出政策干预的建议;最后,在行动中验证干预的有效性,进而产生证据。简而言之,与传统教育监测服务决策的工作模式不同,数据驱动的教育监测的结果应用需要在人机协同的合作模式下产生基于政策改进的行动智能,把教育理念、参与教育治理共治的多元主体的意志和智慧纳入数据驱动的证据筛选的范围中,避免落入“数据殖民”的陷阱。
三、教育监测数字化变革的行动路径
从全球范围的探索和实践看,技术赋能不仅重构了教育监测的实践范式,推进从“循数决策”迈向“循证决策”的教育治理现代化,还通过改进和完善教育监测的方式和手段,进一步拓展教育监测功能,填补传统教育监测的盲区。
(一)发展采用智能化教育测评手段的教育监测体系
传统的标准化教育测评是为了满足工业时代以筛选为目的的教育目标而设计的。从指向系统层面的教育监测结果看,教育系统的表现体现为代表学生能力的“分数”。各国及地区基于“分数”对教育质量进行比较。此外,传统单次、单一维度的标准化测评难以对学生面向未来的复杂性技能、情感态度进行测量。因而,依赖于传统纸笔测试和标准化测评的教育监测获得的数据既不能反映学生能力的全貌,也无法发掘支撑学生可持续发展的社会情感能力。
随着人工智能技术的飞速发展,通过发展智能化教育测评,教育监测体系能够获得和生成大量来源多样化、形式多模态的过程数据,为评估国家或地区学生的复杂性技能提供路径。经合组织和国际教育成就评价协会早在二十年前就开始探索在网络环境下开展学生素养的测评,如PISA 2012数字阅读能力、PISA 2015人机交互环境中协作问题解决能力以及国际教育成就评价协会开发和实施的信息素养测评(ICILS)。近年来,随着学习分析、社交机器人、物联网等以人工智能为核心的新技术的不断涌现和迭代发展,国际组织以及美国、欧洲等西方国家的考试中心积极探索把智能技术融入测评中,实现对“21世纪技能”测评的突破,从而通过教育监测对面向未来各国或不同地区人力资源的竞争力比较提供有效的、具有前瞻性和可比性的实证依据。
随着智能化教育测评发展的日益深入,游戏化测评也广泛应用于对学生复杂技能的测评中。游戏化测评的优势在于从行动中采集过程数据并同时采集学生无意识状态下产生的心理数据。游戏化测评采用基于证据的评价分析模型。该模型支持下的游戏化测评能够实时记录、追踪学生与学习任务和工具的交互数据以及在该过程中不断产生的反馈及学生作出反应的行为或心理数据并通过数据挖掘发现有意义的关系或特定的行为模式。美国教育考试服务中心(ETS)也在充分利用人工智能/机器学习、虚拟/增强现实、教育数据挖掘等技术,开发高质量的数字模拟和游戏化测评,通过模拟应用场景以测量21世纪技能,例如批判性思维测试。
(二)建设基于纵向数据的教育监测体系
随着大数据技术和算法的进步和融入,纵向教育数据的应用不仅为问责提供了有效的证据,还提升了教育监测的预测和早期干预的能力。纵观欧美国家教育治理数字化进程,基于纵向数据的教育监测体系经历了如下两个发展阶段。
第一,实现跨时空、跨学段、跨部门的教育数据融通,建设教育监测新基建。进入21世纪,美国发起了“数据质量运动”率先在州的层面开发跨部门教育数据融通的纵向教育系统。随后,丹麦、荷兰、爱沙尼亚、芬兰和韩国等国家也相继开发了国家层面的教育信息管理系统(NEIS),为教育监测提供数字基建。在教育信息化浪潮的席卷下,我国也在推进各部门教育数据的融通,建设统一的教育管理数字化平台。但从目前的建设水平看,教育数据的纵深程度还不够,纵向教育数据还未联通学前教育至高等教育阶段,教育数据的颗粒度还不够细。一方面,从地方教育监测系统的角度看,基于学生和教师的数据还未下沉到班级层面(课堂);另一方面,从国家教育监测系统的角度看,基于学生或教师的数据还未下沉到村和乡镇。纵向教育数据的纵深程度会影响基于学生或教师成长轨迹勾勒出的数字画像的精度以及在系统层面对教育结果作出预测和解释的准确性和全面性。
第二,融入高水平的算法和分析技术,提升教育监测的预警和早期干预能力。随着算法和分析技术的进步,模型分析、增长混合模型以及类型分析广泛应用于对纵向教育数据的开发之中。美国、印度和芬兰等国基于对纵向教育数据的应用,开发早期预警系统及指标(EWS/EWI)用于对高中阶段的辍学生、职校的问题学生和因职业倦怠选择离职的教师等特定群体的甄别。此外,更有价值的应用是实现学生成长数据从学前教育到高中毕业的融通并对这些时间序列更加密集的纵向数据进行聚类分析,可从系统层面发现不同类型学生的学业成就变化的规律,为个别化指导和干预提供科学的证据,从而推动大规模的因材施教。
四、全球教育监测数字化变革的启示
通过从国际视野洞察数字化变革背景下教育监测的价值定位、实践模式及行动路径,有助于思考我国在教育数字化转型背景下构建大数据技术和人工智能驱动的教育监测系统的价值导向、功能定位以及存在的问题和潜在风险。
(一) 树立教育监测的生态系统观,从教育治理现代化的视角和立场加强顶层设计
融入大数据技术和人工智能的教育监测最主要的优势是贯通散落在教育系统不同层面(班级—学校—区县—省市—国家)的与学生或教师相关的数据,实现从系统层面(如省市或国家)下沉到学校和班级层面监控教育政策或教育改革对学生及学校的实际影响。然而,由于在诸多国家或地区(如丹麦、挪威、爱沙尼亚等),教育监测系统在设计上存在缺乏从目标导向—概念框架—指标体系—监测计划—工具设计的整体构建,造成教师和校长并不明晰班级和学校层面采集的数据与国家的教育理念、改革和行动之间的联系。因而,亟待加强教师和校长对教育监测的系统性认识,从国家或区域教育改革和行动计划等战略性的目标出发理解学生、课堂、学校表现的进步与提升。
(二)加大系统层面教育大数据应用,加快建设支撑教育治理现代化的数字新基建
从目前各国及地区的发展和探索看,大数据和人工智能技术已经广泛地应用于班级和学校层面的教与学过程,颠覆传统教学模式,例如,人工智能支持下的个性化学习系统、智能课堂诊断系统等。在系统层面,主要的应用是开发早期预警系统,对不同学段特定的学生群体进行甄别和干预。然而,在服务政策改进和评估教育质量及均衡发展等教育监测的功能上,数字技术融合的深度还有待加强。难点之一在于加强数字新基建的建设,搭建采集和贯通教育系统各层面、各部门以及基于学生成长足迹的跨时空和学段的信息管理平台。数字新基建是支撑教育监测数字化的基础设施,是最大化整合各类数字技术应用的平台。目前,数字技术虽然已全方位融入学校教育活动,实现了大数据多场景的应用,但是传统以区或市为单位的教育数字化建设呈现出数字应用场景“多而杂”的局面,尚未联通在课堂教学、资源管理及师资队伍建设等多方面的数字应用中。这样既容易造成数据孤岛,还可能出现学校的重复建设并且不利于为教育监测提供系统、连贯的数据。因而,区级以上单位的教育监测系统亟待推进数字新基建的建设,整合学校各类数字技术应用,在统一的平台中采集、整合、处理和分析来自不同学校教育活动的常态化、沉淀的过程性数据,服务教育治理。
(三)理性对待算法的准确性,避免落入“数据殖民”的陷阱
随着智能技术的飞速、迭代发展,算力也在逐步升级,但智能教育技术的发展尚未完善,甚至对于特定的任务是永远也无法做到完全准确地预测和分析的。例如,在对课堂的智能分析中,对于判断学习活动的结构(集体、小组或个体),算法的准确率可达到90%,但对于教师采用了何种类型的教学策略,算法的准确率并不高,约达到67%。对于循证决策而言,基于大数据的教育监测通过算法探测出的模型、关系需要经过教育专家的经验判断和筛选才能进一步转化为教育知识。发掘出的教育知识也需要融入公共价值、决策者的意志以及相关利益主体(教师、校长、家长等)的共识和智慧才能转化为支撑政策制定和干预的有效证据。因此,对于大数据技术驱动的教育监测在服务决策的功能定位是人与智能的协同。智能技术的作用是协助决策或引导反思。特别对于高利害的决策判断,务必确保人在最终决策过程中的主导地位。
(四)重视能力建设,提升教育者和管理者的数据素养和基于循证的决策意识
从经合组织对瑞典、德国、美国、荷兰等欧美国家关于如何推动智能驱动教育治理的调查结果看,大部分证据表明地方教育决策者很少采用教育监测数据服务政策改进以及拨款等资源投入的决策。出现这个现象的原因是多方面的。其中,主要的原因包括:一方面,对于地方教育行政管理者而言,大量来源多样化、繁杂无序而混沌的数据对支撑决策和服务政策改进的指向性并不明确;另一方面,一线教师、校长、地方教育行政管理者等参与教育共治的主体缺乏基于证据进行预测、干预和决策的意识并且也缺乏相关的数据分析和使用的知识和技能。因此,需要对上述相关主体加强培训,帮助他们从系统层面认识跨部门、跨层级教育数据的用途以及明确不同数据具体的指向,与学校改进、系统决策的关系。
完
本文刊登于《中国教育学刊》2023年第七期,平台发表内容以正式出版物为准
本文转自微信公众号“中国教育学刊(ID:zgjyxk)”
如有侵权,请联系本站删除!