摘 要:采用江苏某高校学生多期追踪调查数据,运用倾向得分匹配法探究综合评价学生与普招学生在大学入学后的学业成绩和课外表现差异,以及这种差异随在校时长的变化特点。研究发现:男生、城镇学生以及父母受教育水平越高、高考分数越低的学生更有可能通过综合评价招生入学,入学后综合评价学生的学业成绩和课外表现均优于普招学生,但这种优势会随在校时长的增加而减弱。异质性分析发现两类学生之间的学业成绩与课外表现差异在农村学生中表现更为突出。因此,高校应从设置农村专项计划、强化综合评价学生个性培养、注重跟踪评价三个方面,构建从选拔、培养到跟踪的一体化机制,促进培养更多全面发展的创新人才。
关键词:综合评价招生;学业成绩;课外表现;高考改革
一、问题的提出
21世纪以来我国加快探索建立科学多元的人才选拔模式。2001年开始试点后逐步推广的自主招生,经多年运行后,于2020年被“强基计划”所取代。“强基计划”对学生高考分数要求以及基础学科特长要求严格,仅在39所一流大学建设高校试点,极大程度上提高了入围门槛。自2014年新一轮高考综合改革启动以来,我国部分省市和高校逐步试点实施综合评价招生,综合了国家统考、高校考核、高中评价三个层面多个维度对学生进行多元评价,且试点高校层次广、数量多,与“强基计划”互为补充,成为高校多元录取机制的重要组成部分。
本研究聚焦于高校综合评价招生的实施成效。从制度设计的应然角度看,综合评价招生在选拔程序上增加了材料初审和高校笔试或面试考核的环节,在考核内容上融入了高中学业水平考试成绩、综合素质评价、高校考核结果等,以这种自主灵活、科学多元的方式,聚焦学生的综合素质和创新潜质,对学生的素质能力进行全面考量,推动高校招生从“考试”到“评价”、从“招分”到“招人”的转变,实现对“唯分数”论的纠偏。那么,综合评价招生的人才选拔实际效果如何?综合评价学生(以下简称“综评学生”)是否比普通录取学生(以下简称“普招学生”)入学后表现得更加优秀?针对以上问题,本研究采用江苏某高校学生多期追踪调查数据,运用倾向得分匹配法就两类学生入学后的学业成绩、课外表现差异,这种差异随在校时长的变化特点,以及此种差异在不同学生群体的异质表现进行实证研究。
以往有关高校自主选拔政策的研究主要聚焦自主招生、“强基计划”和综合评价招生,其中实证类研究主要就各类自主选拔学生和普招学生入学后的学业成绩与拓展性课外表现的差异展开分析。
就自主招生而言,成为自主招生学生(以下简称“自招学生”)对于学业表现的影响未形成统一结论。在学业成绩方面,有学者发现自招学生大一平均学分绩点、课程考试均分显著优于普招学生。一项利用北京市15所高校多期调查数据的回归研究发现,自招学生大学4年总学分绩点排名好于普招学生,但控制高考分数后,这种差异消失了。侯佳伟也发现自招学生在自评成绩排名等方面与普招学生无显著差异。还有研究发现自招学生学业成绩起初不如普招学生,大三后差距不再显著。综合素质方面,文雯、管浏斯采用9所高校数据发现自招学生在有效的学习性投入与活动上优于普招学生。李雄鹰认为自招学生在活动实践方面更积极,心理素质更好,具有深造学习愿望。“强基计划”学生在专业兴趣、学习规划方面,与普招学生并无显著差异,但自我效能感和研究能力显著优于普招学生。
针对综合评价招生,有研究发现综评学生学习潜力和动机较强,成绩也逐年提高。另有研究发现综评学生在课程与教学安排、认知与学习能力、学习投入与专业知识、学习策略等方面适应性均高于普招学生,但学习环境方面较低。在综合素质方面,有访谈研究发现综评学生担任学生干部、竞赛获奖比例较高,拥有较好的自我管理和组织沟通等能力。还有回归分析发现综评学生大学期间在竞赛实践参与和获奖方面更有优势,但主要来源于高中阶段的积累和延续。
基于上述文献可知,综合评价招生实证研究较少,且大多只关注综评学生与普招学生学业成绩差异,仅有少数几篇研究以学生对自身发展的主观认知和满意度为评价标准进行了初步探讨。此外,既有研究多采用描述统计、均值比较、回归分析等方法,少有研究采用准实验方法探讨因果影响。针对这些不足,本研究将同时考查综评学生与普招学生的学业成绩和课外表现差异,并采用倾向得分匹配(Propensity Score Matching, PSM),对两类学生在大学期间的发展作对比分析,进而科学评价综合评价招生实施成效。
二、研究设计
(一)数据来源
本研究选取江苏某省属高校(以下简称G校)2015—2017级全部综评学生及相关专业的省内普招学生作为研究对象(G校综合评价招生仅在江苏省招生),共收集1957名学生的有效调查问卷数据,2015—2017级学生分别为429人、536人、992人,涉及文理工等多个专业。还收集了学生大一和大二上学期计算奖学金的平均学分绩点和第二课堂加分用于数据分析。
(二)变量选取及处理
1. 因变量。以学生入学后的学业成绩和课外表现作为因变量,分别用平均学分绩点与第二课堂加分代理。学业成绩反映学生第一课堂课程知识掌握程度,多以笔试方式测量;课外表现反映学生参与社会生活并不断发展自己的志向能力,涉及竞赛实践、担任学生干部等方面,侧重考量第二课堂表现。研究还按照年级和专业对两类分数进行了标准化处理。并利用大一上与大二上两学期数据,观测学生表现变化趋势,反映综合评价招生在人才培养环节的持续作用。从表1来看,综评学生大一、大二学业成绩均值都低于普招学生,课外表现均值都高于普招学生,两种差异皆大一显著,大二不再显著。表明综评学生入学短期内学业成绩不如普招学生,课外表现具有明显优势,差距都随入学年限增加逐渐缩小直至不再显著。
2. 核心自变量。学生是否综评学生为核心自变量(综评学生赋值为1,为处理组;普招学生赋值为0,为控制组)。其中,综评学生225人,普招学生1732人。
3. 控制变量。个人特征变量包括学生性别(男生=1)、民族(汉族=1)、户籍(城镇=1)等特征,以及控制了学生的年级与专业固定效应。家庭特征变量为父母受教育水平(取父母最高受教育水平,高中及以下=1、大专或本科=2、硕士及以上=3)、职业(父母至少有一方在企事业单位工作赋值为1,其他为0)以及政治面貌(父母中有中共党员,则赋值为1,其他为0)。学校特征变量为高中所在地区(苏北=1、苏中=2、苏南=3)与等级(四星级中学=1,其他为0)。
(三)模型设定
为探究是否综评学生对入学后学业成绩和课外表现的影响,本研究设定线性模型如下:
式(1)中,因变量Scoreit表示学生i在t学期的学业成绩和课外表现。核心自变量Dit为学生i是否综评学生,β为其估计系数,代表综评学生与普招学生的差异,Xstu,it、Xfam,it和Xscℎ,it分别表示由学生个体、家庭和学校三个层面因素构成的控制变量,γg,i、δm,i分别表示控制年级和专业固定效应,μit为残差项。
此外,进一步控制高考分数,继续观测核心自变量Dit对学生入学后表现的影响。得到下式:
Gaokaoit为高考分数,φ为其估计系数,代表高考分数对因变量的影响。从表1可知,综评学生高考分数均值低于普招学生15.24分,因为当时G校综评学生最高可享受高考分数一本线下20分的优惠。根据新人力资本理论,个体能力包括认知能力和非认知能力。认知能力通常用考试分数衡量,故加入高考分数控制变量后,Dit中由高考分数所代理的学生认知能力的影响被剥离,剩下的便可能是非认知能力的影响。
鉴于本研究使用的是事后观测数据,学生是否通过综合评价入学并非随机发生,OLS回归可能产生选择性偏差,引致显性偏估。故本研究采用Rosenbaum和Rubin提供的倾向得分匹配法进行偏估矫正。依据相关匹配原则,采用多种匹配手段对综评学生和普招学生中匹配变量取值相同或相近的对象进行匹配,利用新样本估计是否综评学生对入学后表现的“净影响”。
三、实证研究结果与分析
(一)成为综评学生的影响因素
本研究首先利用logistics回归估计成为综评学生的影响因素,结果如表2所示。
由表2可知,考生性别、户籍对于成为综评学生具有显著影响,男生成为综评学生的概率比女生高出5个百分点,来自城镇的学生比农村学生高出2.8个百分点。高考分数的估计值在1%水平上负向显著,说明考生高考分数越高,成为综评学生的概率越低,每高1分,成为综评学生的概率降低1.2个百分点。父母受教育水平正向影响成为综评学生的概率值,以高中及以下为基准,父母最高受教育水平为大专或本科、硕士及以上,成为综评学生的概率分别提高6.5%、22.4%。
(二)样本匹配效果检验
首先由表3可知,匹配后协变量标准化偏差值均小于5%,协变量t检验结果均不显著,意味着协变量的显著差异被较好地消除,实现了数据平衡。
此外,绘制核密度图检验倾向得分共同支撑区间,1∶2近邻匹配后综评录取与普通录取倾向得分概率密度分布的重合区间覆盖了概率取值范围[0,0.7],重合区间较为广阔,满足共同支撑区间条件。匹配后的倾向得分核密度函数趋近,接近重合,说明匹配后处理组与控制组之间差异明显降低,匹配效果较好。(见图1)
(三)综评学生与普招学生是否存在差异
本研究进行了OLS估计,并利用PSM重组样本后再进行回归,估计结果见表4。
1. 入学后综评学生学业成绩优于普招学生,非认知能力对学业成绩具有积极影响。与表1结果一致,表4模型1的OLS结果同样显示综评学生大一学业成绩显著低于普招学生。PSM结果显示综评学生入学后的学业成绩与普招学生并无显著差异。学生的学业成绩不仅受到认知能力的影响,非认知能力也会产生重要影响。故通过控制学生高考分数这一变量,对两类学生的学业成绩作进一步解释说明。由模型10和模型12可知,在剥离认知能力影响后,综评学生入学后的学业成绩好于普招学生,这种优势来自非认知能力的影响。这意味着非认知能力对学生学业成绩具有积极促进作用。
2. 入学后综评学生课外表现好于普招学生,非认知能力有助于提升课外表现。由表1可知,综评学生前两年课外表现都好于普招学生,大一时这种优势具有显著性,大二不再显著。表4模型5和模型7的OLS结果与此一致。经PSM匹配后的回归结果显示,大一时综评学生与普招学生的课外表现并无差别,进入大二后,综评学生课外表现明显好于普招学生。访谈得知,综评学生入学后短期内会投入较多精力学习,对课外活动投入精力相对较少,故课外表现方面的“后劲”可能到大二才显现。控制高考分数后,发现综评学生入学后前两年的课外表现都好于普招学生,可见非认知能力对学生课外表现产生了正向推动作用。
3. 综评学生与普招学生的差异随时间不断减小,呈现趋同发展。根据模型10、模型12、模型14、模型16的结果可知,高考分数和综评学生变量的估计系数随时间不断减小,表明综评学生与普招学生学业成绩和课外表现差异逐步缩小,两类学生呈现趋同发展。原因可能有二。其一,可能和高校人才培养方案有关。G校并未对综评学生制定专门的培养方案,并且学生报考专业要求并未与竞赛获奖的优势学科挂钩,导致其原有的学科特长和创新潜质沦为综合评价招生的敲门砖,难以继续发挥更大优势。其二,同伴效应可能导致两类学生趋同。同伴效应会带来学生行为的顺从与模仿、观念的同化、相互间的合作与竞争等,同伴资源可为中等生或者低学业能力学生提供学业帮助,促进其学业成绩提高。在同伴效应作用下,也可能促进综评学生学业成绩、普招学生课外表现不断提升,差异逐渐减小,表1两类学生学业成绩和课外表现均值变化情况也的确如此。
4. PSM纠正了对学生表现的显性偏估。对比PSM和OLS结果可知,在控制高考分数时,PSM结果显示高考分数以及综评学生身份对学生学业成绩和课外表现的影响增强,显著性水平和估计系数都有所提升。在学业成绩方面,从模型2、模型4和模型10、模型12对比可知,综评学生的估计系数都从不显著变为显著。在课外表现方面,对比模型6、模型8和模型14、模型16发现,原本大二时综评学生的估计系数不显著,PSM结果变为显著。可见,OLS因忽视自选择偏差会造成对学生表现正效应的低估,导致综评学生与普招学生的差异被缩小了,PSM真实反映出综评学生的优势。
综上所述,G校综合评价招生确实选拔出了优秀学生,其具有较好的创新潜质和综合素质等非认知能力。本研究调查数据也表明,综评学生高中阶段市级以上获奖次数均值高出普招学生119%,验证了其具备更好的非认知能力。控制高考分数时,在非认知能力作用下,综评学生入学后的学业成绩和课外表现都显著优于普招学生。但这些差异却随学年的深入逐渐减弱。综评学生身上的个性特质在不断退化,综合评价招生在人才培养环节的持续效应减弱。
(四)异质性分析
本研究还从学生户籍与专业两方面对不同学生群体作异质性分析,结果如表5所示。
根据表5的模型1、模型3、模型5、模型7可知,综评学生与城镇户口的交互项估计系数不显著,因此户籍对综评学生的学业成绩和课外表现总体上并无显著影响。当控制高考分数后,如模型2、模型4、模型6、模型8所示,综评学生与城镇户口的交互项估计系数呈现负向显著,说明综评学生中农村学生非认知能力对学业成绩和课外表现的影响更大。这可能是因为农村学生高中阶段接受的教育资源相对薄弱,以应试教育为主,非认知能力发挥作用的空间受限。进入大学后,非认知能力的作用得以充分发挥,产生了积极的影响。此外,高考分数与城镇户口的交互项估计系数正显著,意味着城镇学生认知能力对学业成绩和课外表现的影响更大。城镇学生接受的高中教育素质化程度更高,在学习方面的投入相对较少,学习潜能有待进一步释放,相较农村学生而言,认知能力对城镇学生大学期间发展的影响更大。
按优势专业和普通专业划分学生群体后,发现不同专业中两类学生学业成绩和课外表现并无显著性差异。控制高考分数后,如模型10、模型12、模型14、模型16所示,综评学生与优势专业交互项的估计系数仍不显著,说明无论综评学生是否就读优势专业,都不会影响其与普招学生在学业成绩和课外表现方面的差异。
(五)稳健性检验
为了验证1∶2近邻匹配结果是否稳健,进一步采用1∶4近邻匹配、卡尺匹配、核匹配方法进行匹配,并对实现匹配的样本数据进行OLS回归估计。其中,卡尺匹配选择卡尺的范围为0.01,核匹配使用默认的核函数和带宽,结果如表6所示。从总效应来看,入学后综评学生与普招学生的学业成绩并无差别;但在课外表现方面,综评学生具有显著优势,入学后两年内综评学生课外表现都显著好于普招学生,并逐步减小。从分效应来看,综评学生非认知能力带来的学业成绩和课外表现优势随时间逐步减小甚至消失。基于此,表6与前文所得的研究结果基本趋同,研究结论较为稳健。
四、结论与启示
本研究采用江苏某省属高校学生的微观调查数据,利用PSM探析了综评学生与普招学生学业成绩和课外表现的差异及其变化趋势,得出以下结论。①逻辑回归发现,男生、城镇学生以及父母受教育水平越高、高考分数越低的学生更有可能通过综合评价招生入学。②PSM研究发现,综评学生与普招学生在学业成绩方面不存在显著差异,而综评学生的课外表现更加突出。当控制高考分数时,综评学生在学业成绩和课外表现方面都展现出明显优势,但这种优势随学年深入不断减小。③异质性分析发现,相较于城镇学生,综评学生这一身份对农村学生课外表现和学业成绩的正向影响更大,但对于优势专业和普通专业的学生而言并没有显著区别。
根据上述结论,得出如下启示。
其一,综合评价招生发挥了较为明显的人才选拔功能,但由于缺乏针对性的培养,导致人才培养环节的效应有所减弱。综合评价招生通过多维度、多环节考核以及双向选择过程,为学生提供了多元录取机会,有利于提高生源与高校的匹配性。但优秀人才在大学里可能受统一培养等因素的局限,影响了培养成效。选拔出适切的人才是第一步,更重要的是通过学校的环境支持和教育引导,促进综评学生发挥优势潜能,成为全面发展的创新型人才。
其二,城乡二元社会结构下的家庭背景和教育资源差距,造成综合评价招生呈现出对城镇和高人力资本家庭学生的群体和阶层偏好,但在农村学生群体中体现的长期效应更显著。城镇和高人力资本家庭为孩子提供的素质教育资源和路径更广泛,帮助孩子培养综合素质能力,促使其更易成为综合评价招生竞争中的优胜者。相比之下,农村学生面临更加激烈的竞争,自身足够优秀才能脱颖而出,而综合评价招生成功经历对其在树立自信、自我激励等方面的内隐性影响,有利于个体获得全面发展。
综上,高校须进一步完善综合评价招生政策设计和运行机制,贯通选拔、培养、跟踪全链条,持续扩大制度成效。在选拔环节,尝试设置面向农村学生的综合评价专项计划,设置专门的报名条件,例如若是学籍、就读中学、户籍且家庭在农村,报名条件可以适当放宽,设置差异化的面试考核内容,真正做到多元化选拔。在培养环节,应量体裁衣,以单独编班模式开展个性化培养,或在统一编班模式下提供针对性的师资指导和多元化的实践机会,从而激发综评学生的内驱力和能动性,更好地实现全面而有个性的发展。最后,有必要建立综评学生档案库,对综评学生入学后学业成绩、获奖情况、科研成果以及就业去向和薪酬等开展跟踪评价,积累丰富的数据资料,深入开展研究分析,推动制度良性运行。
【王江曼,南京大学教育研究院博士研究生,南京工业大学助理研究员;何沛芸,通讯作者,南京大学教育研究院博士研究生;黄斌,南京大学教育研究院教授;云如先,南京大学教育研究院博士研究生】
原文刊载于《中国高教研究》2023年第9期
转自:“中国高教研究”微信公众号
如有侵权,请联系本站删除!