作者:顾茜 东南大学脑与学习科学系,儿童发展教育研究所
研究生导师:柏毅;夏小俊
【摘要】:大学通过培养学生的高阶思维和学术能力,为经济增长和国家竞争力做出贡献。尽管在大学科学、技术、工程和数学(STEM)教育方面投入了大量资金,但人们对不同国家和不同院校的STEM本科生之间技能的比较知之甚少。在本研究中,我们通过收集和分析中国、印度、俄罗斯和美国数万名计算机科学和电气工程专业学生的纵向数据,为这些问题提供了直接证据。我们发现,不同国家和院校的学生在学术技能水平和批判性思维能力方面存在明显差异。与美国相比,中国、印度和俄罗斯的学生在四年时间里并没有得到批判性思维能力的提升。此外,印度和俄罗斯的学生在本科前两年提升了学术技能,而中国学生则没有。这些能力水平及其增益方面的差距,让我们得以深入了解不同国家和不同院校类型的STEM大学生的全球竞争力。
一、介绍
本科 STEM 课程的主要目标是帮助学生发展学术知识、能力和技能(以下简称学术技能)以及批判性思维等高阶思维技能。使人们掌握这些技能有助于开发人力资本并促进创新,从而促进国家发展及其在全球知识经济中竞争力的提升。
过去的研究表明,一个国家的人力资本(以受教育年限衡量)与其经济增长水平成正比。最新的研究表明,对中小学生的国际评估所衡量的技能更能代表国家层面的人力资本,也是经济增长的更可靠的决定因素。关于认知技能在经济增长中的作用的相关研究表明,认知技能的测量也可以反映非认知或高阶认知层面,而这些层面也能解释生产力和经济的增长。这些结果为实行教育改革提供了丰富的探究思路,从而可以培养受教育者更多的技能。
然而,在强调人力资本对生产力和经济增长的重要性时,研究人员主要关注的是在学前教育中获得的技能,而不是在高等教育中获得的技能。特别是,尽管每年在STEM本科课程上花费数百亿美元,但对于这些课程在多大程度上能培养大学生的批判性思维和学术能力,人们知之甚少。
衡量技能掌握情况也有一些尝试。例如,通过收集毕业生短期就业结果的数据,由于过于间接,无法为教育政策制定者或大学管理者提供具有较强可行性的思路。使用标准化评估的直接方法很少得到应用。在为数不多的收集标准化评估数据的研究中,如经济合作与发展组织的高等教育学习成果评估,一般都没有对具有全国代表性(随机)的学生和机构样本进行评估,因此无法从国际角度来说明大学毕业生的技能水平和增益。
Loyalka等人比较了各国具有代表性(随机)的STEM本科生的技能。然而,该研究的局限性在于,它只收集和分析了计算机科学(CS)专业学生在某一时间点(即大学毕业时)的计算机科学(CS)技能的静态数据。因此,本研究的结果并没有直接涉及:(1)大学期间学到的技能(技能增益);(2)高阶思维技能,这些技能被认为对劳动力的生产率至关重要;或(3)基础学术技能,如数学和科学,这些技能主要在大学前两年学习,是以后取得成功的基础。Loyalka 等人还对中国、印度和俄罗斯的1593名学生进行了规模相对较小的抽样调查;此外, 印度的样本仅来自三个邦,并在国家层面不具有严格的代表性。
高等教育中技能获取方面的研究是一个重要的方向,但目前研究较少。当前,各国在高等教育上的支出占国民生产总值的比例越来越高(美国为2.6%)。与中小学教育相比,高等教育的回报也更高。尽管私人回报可能在不同程度上归因于高等教育对技能发展的贡献或其信号价值,但高等教育所培养的技能也可能具有巨大的外部效应。例如,高等教育可能会促进创新和知识成果转移。
高等教育与当今经济尤为相关,其旨在帮助个体获得跟上快速技术变革所需的高级技能。高级技能包括高阶认知技能,如批判性思维和创造力,以及学术技能,如大学水平的数学和科学。然而,关于高等教育在多大程度上传授了这些大学水平的高级技能,目前还缺乏直接的、可推广的证据。
在本文中,我们试图通过提供直接的、有代表性的和纵向的证据,说明 STEM 本科生的高阶思维能力和学术技能(技能水平和技能增益)在不同国家教育体系中的比较情况,以及它们在院校选择性和学生性别方面的差异,以弥补这些差距。为此,我们收集了有关中国、印度和俄罗斯精英院校和非精英院校STEM本科生(四年制计算机科学与技术和电气工程专业的学生)批判性思维和学术技能的国际标准化评估数据。此外,我们还将这三个主要国家的STEM学生的批判性思维技能水平和学业成绩与美国STEM学生的对应数据进行了比较。
图1 中国、 印度和俄罗斯的批判性思维能力水平及其增益(以标准差为单位),以美国为基准
在院校选择性方面,高等教育系统日益分化为精英和非精英院校。精英院校的特点是公共和私人投资水平较高,名额有限,择优录取,因此学生得分较高,声望较高。一般认为,与培养一个国家绝大多数大学生的非精英院校相比,精英院校的质量较高。在中国、印度和俄罗斯等新兴经济体,高等教育体系日益分化为精英院校和非精英院校的现象也很明显。这些国家的政策制定者积极推动精英院校成为世界一流的研究型大学,以培养高素质的科研和管理人才。
我们采用严格的抽样程序随机抽取了中国、印度和俄罗斯的院校和学生(详见方法部分)。通过密切关注调查执行情况,我们还在这些院校和在校生中取得了较高的总回复率。我们设计的测试在文化上立场客观,并通过了验证。在研究开始前,对数百名调查员进行了培训,让他们以同样的方式监考。所有被抽样调查的学生,都获得了相同的参与激励。此外,我们还测试了结果对学生动机潜在差异的敏感性。
我们对技能增益的估计是多维的、稳健的(见方法部分)。严格的抽样和调查程序使我们能够从相对意义上考察跨组别的技能增益,即不同高等教育系统和院校的技能增益。同时,我们还使用纵向标度测试分数(使用有足够锚定项目的测试)来考察绝对意义上的跨组别技能增益——即随着时间的推移,学生的技能是否会发生正向、负向或不发生变化。我们测量了学生在一般领域的高阶思维技能(批判性思维)和特定领域的学术技能(如数学和物理——抽样专业的主要理科科目)方面的相对和绝对进步。在控制了学生的家庭背景和校外活动等后,我们提供的证据表明,技能水平增益的差异可归因于学生在大学中的经历,而非其家庭背景或校外活动的差异。因此,我们测量的技能增益可能反映了参与本科STEM项目所获得的相关增益。
表1 中国、 印度和俄罗斯的批判性思维能力水平及其增益(以标准差为单位),以美国为基准
在预览主要结果时,我们发现各国之间以及精英院校与非精英院校之间在技能水平上存在明显差异。大学伊始,中国和美国学生的批判性思维得分比印度学生高出约1.4至1.5s.d.,比俄罗斯学生高出约0.3至0.5 s.d.。此外,中国学生的学术技能得分比印度和俄罗斯学生高出约1s.d.。与非精英院校的学生相比,中国和印度精英院校的学生在学术和批判性思维技能方面的得分要高得多。与男生相比,女生的批判性思维分数与男生持平,而数学和物理分数略低。在大学的前两年,男女生在数学方面的差距有所缩小,但在物理方面的差距没有缩小。
这些技能水平上的巨大差距让我们深入了解了来自不同国家和不同类型院校的STEM本科生的大学准备情况。此外,我们还展示了大学两年后学术技能水平的差距,以及大学两年后和四年后批判性思维能力的差距,从而进一步了解各国STEM毕业生的全球竞争力。稍后,我们将通过讨论STEM专业的选择差异来说明这些技能水平差距的来龙去脉。
重要的是,为了关注大学质量,我们展示了各国在技能增益方面的巨大差异。印度和俄罗斯的学生在前两年的学术技能有显著提高(从0.1至0.4 s.d.),而中国的学生在前两年的学术技能没有提高或有显著的绝对下降(大约从-0.3至0 s.d.)。这有助于缩小中国与其他国家之间的学术技能差距。纵向结果显示,中国、印度和俄罗斯的学生在大学前两年的批判性思维能力略有提高,而在大学最后两年的批判性思维能力有所下降,而美国多个批次学生的回归调整结果(尽管不具代表性)与之前的文献密切相关,这些文献表明美国学生在四年内的批判性思维能力有大幅提高(约0.5 s.d.)。
2、结果
2.1批判性思维能力水平及其增益
我们发现,不同国家的批判性思维能力水平差异很大(图1和表1)。中国大学一年级学生(以下简称新生)的批判性思维能力水平与美国新生相似(差异=-0.146 s.d.,P=0.319,95%置信区间(CI)=-0.435 - +0.143),但远高于印度新生(1.373 s.d.,95% CI=1.168 - 1.579),也略高于俄罗斯新生(0.332 s.d.,P=0.007,95% CI=0.090 - 0.573)。俄罗斯新生的批判性思维能力也远高于印度新生(1.042s.d.,P<0.001,95% CI=0.876 - 1.207)。在二年级结束时,中国大学二年级学生的批判性思维能力得分仍然远远高于印度二年级学生(1.433 s.d.,P<0.001,95% CI=1.123 - 1.744),略高于俄罗斯的二年级学生(0.368 s.d.,P=0.039,95% CI=0.019 - 0.718),与美国的二年级学生(-0.019 s.d.,P=0.922,95% CI=-0.405 - +0.367;由于美国学生在一年中的不同时间参加批判性思维考试,而且第二年和第三年的样本量相对较小,因此我们将第二年和第三年的观察结果合并)。然而,在第四年结束时,虽然中国学生的得分仍然远远高于印度学生(0.973 s.d., P<0.001, 95% CI=0.661-1.286),但他们的得分在统计学上与俄罗斯学生差异不显著(-0.053 s.d., P=0.780, 95% CI=0.661-1.286)、 P=0.780,95%CI=-0.431 - +0.324),远低于美国四年级学生(-1.173 s.d.,P<0.001,95%CI=-1.654 至 -0.692)。
大学毕业时批判性思维能力水平的差距主要是由于不同国家在大学最后两年批判性思维能力增益方面的差异造成的。中国、印度和俄罗斯的学生从大学一年级开始到二年级结束,批判性思维能力的增益幅度很小(0.04 -0.10 s.d.;图1)。此外,美国的跨组别回归调整收益表明,大学生批判性思维能力在大学前两年没有显著提高,这也与以往研究的估计是相吻合的。然而,在中国(-0.48 s.d.,P<0.001,95% CI=-0.66至-0.29)、印度(-0.11 s.d.,P<0.001,95% CI=-0.17至-0.06)和俄罗斯(-0.11 s.d.,P=0.037,95% CI=-0.21至-0.01),学生的批判性思维能力在大学最后两年显著下降。相比之下,美国的跨组别回归调整收益显示,批判性思维能力从大学中期到末期有显著提高(0.46 s.d.,P<0.001),这与之前几项研究的估计结果一致(从第1年到第4年的回归调整收益仅略有提高,且不显著(0.53 s.d.,P<0.001))。
2.2学术技能水平及其增益
与批判性思维一样,中国大一新生的数学和物理技能水平最高,远高于印度(数学差异=1.254 s.d.,P<0.001,95% CI=0.954-1.554;物理差异=1.080 s.d.,P<0.001,95% CI=0.691-1.469)和俄罗斯(数学差异=0.929 s.d.,P<0.001,95% CI=0.634-1.224;物理差异=1.071 s.d.,P<0.001,95% CI=0.681-1.460;图2和表2)。与印度新生相比,俄罗斯新生的数学技能水平明显更高,但物理技能水平不高(数学差异=-0.325 s.d.,P<0.001,95% CI=-0.455 至 -0.194;物理差异=-0.009 s.d.,P=0.921,95% CI=-0.189 - +0.171)。
图2 大一开始至大二结束时的数学和物理技能水平及其收益(以标准差为单位)
由于各国在技能增益方面的差异,中国在学业技能方面的优势在两年后显著缩小(图2和表2)。根据未调整的估计值,从第一年开始到第二年结束,中国学生在数学方面的技能增益幅度为负且显著(-0.312 s.d.,P<0.001,95%CI=-0.400 至-0.224),在物理方面为负但无统计学意义(-0.061 s.d.,P=0.145,95%CI=-0.145 - +0.022)。相比之下,印度的数学(0.388 s.d.,P<0.001,95% CI=0.357-0.418)和物理(0.244 s.d.,P<0.001,95% CI=0.168-0.319)技能上的增益估计值为正且显著。俄罗斯的数学(0.079 s.d.,P=0.068,95% CI=-0.006 - +0.165)和物理(0.168 s.d.,P=0.024,95% CI=0.024 - 0.312)技能的结果也是正向且显著的,尽管幅度较小。综上所述,结果表明,印度和俄罗斯的学生在大学前两年的数学和物理学习中取得了显著的进步。相比之下,中国学生在进入大学前所掌握的数学技能有所倒退。
表2 大一开始至大二结束时的数学和物理技能水平及其收益(以标准差为单位)
无论我们是否将项目反应理论(IRT)量表的分数转换成z分数,结果都是有效的。此外,当我们将大一开始时和大二结束时的数学测试限制在锚测验(两次测试的锚题完全相同,约占每个测试的40%)时,我们发现中国学生在大二结束时的得分也比一年级开始时低 0.27 s.d.(这与表2中报告的数学技能下降0.31 s.d.非常相似)。与此形成鲜明对比的是,印度和俄罗斯的学生在普通题上的数学成绩明显提高。尽管中国学生从大一开始到大二结束时的数学技能绝对值有所下降,但与印度和俄罗斯相比,中国学生在大二结束时的数学技能水平仍然很高。
2.3精英院校与非精英院校学生的技能对比
在精英院校和非精英院校中,不同国家学生的批判性思维和学术技能水平也存在明显的差异(见表3)。在批判性思维能力方面,中国精英院校大四学生的得分比印度和俄罗斯精英院校的学生高0.5-1.3 s.d.;中国非精英院校大四学生的得分比印度非精英院校的学生高0.7-1.2 s.d.,比俄罗斯非精英学校学生高出 0.2 s.d.(大二和大三除外,这两年的得分水平相同)。关于大一开始和大二结束时的数学和物理技能水平,中国精英院校学生的得分比印度和俄罗斯精英院校学生高出约 0.5-2 s.d.;中国非精英院校学生的得分比印度和俄罗斯非精英院校学生高出约 0.3-1.0 s.d.。值得注意的是,与印度精英院校的新生相比,中国非精英院校新生的批判性思维能力高出很多(这一差距在大四缩小),与俄罗斯精英院校新生相比,中国非精英院校新生的数学和物理能力高出很多(数学方面的差距在大二缩小,但物理方面的差距没有缩小)。
表3 技能水平及其增益:精英院校与非精英院校对比(以标准差为单位)
无论是在国内还是国际上,精英院校和非精英院校的学生在批判性思维和学术技能的增益方面都存在巨大差异(表3)。中国精英院校的学生从大一开始到大二结束,批判性思维能力和数学与物理技能没有任何提高。中国非精英院校学生的批判性思维能力从大三开始到大四结束显著下降(-0.505 s.d.,P<0.001,95% CI=-0.681至-0.330),数学能力从大一开始到大二结束显著下降(-0.333 s.d.,P<0.001,95% CI=-0.437至-0.229),物理技能没有提高。然而,印度精英院校学生的物理技能在前两年有所下降(-0.403 s.d.,P=0.006,95%CI=-0.650至-0.156),批判性思维技能在最后两年有所下降(-0.343 s.d.,P=0.019,95%CI=-0.612至 -0.075),但他们的数学技能却有显著的提高(0.306 s.d.,P<0.001,95%CI=0.210-0.402)。此外,印度非精英院校的学生在数学(0.387 s.d.,P<0.001,95% CI=0.356-0.419)和物理(0.272 s.d.,P<0.001,95% CI=0.202-0.342)技能方面都有显著提高,但在最后两年,批判性思维技能有所下降(-0.102 s.d.,P=0.001,95% CI=-0.159至-0.046)。俄罗斯精英院校的学生似乎在数学(0.257 s.d.,P<0.001,95% CI=0.178-0.335)方面有所提高,但在物理和批判性思维方面没有提高;而非精英院校的学生在物理(0.244 s.d.,P<0.001,95% CI=0.129-0.360)方面有所提高,但在数学和批判性思维方面没有提高。
2.4不同性别学生的技能对比
表4 技能水平及其增益:不同性别对比(以标准差为单位)
不同性别的学生在技能水平及其增益方面的差异很小(见表4)。在中国、印度和俄罗斯,女生在大学伊始表现出的批判性思维能力水平与男生相似。中国和印度女新生的数学和物理成绩略低于男新生(0.1-0.3 s.d.)。俄罗斯女新生的数学和物理成绩与男新生持平。
在大学的前两年,女生和男生在批判性思维方面的进步想当。到大四结束时,印度和俄罗斯的女生在批判性思维方面的得分相近,而中国女生的得分比男生低 0.3 s.d.。
在大学的前两年,中国、印度和俄罗斯的女生在数学方面比男生取得了更高的进步,这缩小了中国和印度的性别差距,并在大二结束时比俄罗斯的男生高出 0.1 s.d.。相比之下,在中国和印度,物理学科的性别差距在大学前两年依然存在——到大二结束时,女生的成绩比男生低 0.1-0.2 s.d.。俄罗斯女生在大二结束时的物理成绩与男生持平。
3.讨论
关于学生在大学伊始的技能储备情况,中国和美国的新生在批判性思维方面要比印度和俄罗斯的新生领先很多。在数学和物理方面,中国的新生也比印度和俄罗斯的新生领先很多。印度的新生在批判性思维方面也远远落后于俄罗斯的新生,但在数学和物理方面却很有竞争力。印度批判性思维能力水平特别低的原因可能不仅在于经济水平较低,从而导致的对早期认知发展的妨碍以及较少的中小学教育的人均投入,还在于过于强调死记硬背的学术学习,忽视了高阶认知技能的发展。
鉴于中国培养了大量的计算机科学家和工程师(约为美国的八倍),中国大学起始阶段和中期阶段高水平的批判性思维和学术技能值得关注。中国精英院校的得分更高,其培养的计算机科学家和工程师人数几乎是美国所有院校总和的 1.5倍。中国培养出如此多的高技能人才,对全球大学STEM毕业生的劳动力市场产生了影响。然而,中国拥有如此高水平的技能并不一定意味着中国的中小学教育体系比其他国家相比更有能力为学生进入大学做好准备。与俄罗斯(35-40%)相比,中国18-22岁学生中就读于提供STEM本科(学士)课程的大学的比例相对较小(8-10%,与印度相似)。
在解释各国技能水平差异时,考虑专业选择也很重要。在中国、俄罗斯和美国,主修计算机科学与技术专业的学生与主修其他专业的学生在大学起始阶段的成绩差异都不大。在中国,理科生(约占所有四年制大学学生的三分之二)中,计算机专业学生在大学入学考试中的成绩与非计算机专业学生大致相同。在俄罗斯,与其他专业的学生相比,计算机专业的学生在大学入学考试的数学模块中得分高 0.26 s.d.(在语言模块中得分低 0.22 s.d.)。在美国,计划报考计算机专业的新生与计划报考其他专业的学生相比,在十二年级数学考试中的得分要高出约 0.25 s.d.。印度没有全国性的标准化数据来研究专业间的差异。
在技能增益方面,中国、印度和俄罗斯的学生在大学期间的批判性思维能力水平没有提高,甚至有所下降,而美国的学生则有显著提高。这些证据与美国少数几项非代表性研究一致,这些研究探讨了批判性思维能力在各种专业中的提高情况。虽然还需要进一步的研究来解释中国、印度和俄罗斯的批判性思维能力在绝对值上和相对于美国而言缺乏提升的原因,但其中一个可能的原因是,与美国学生相比,这些国家的STEM本科生需要选修的人文和社会科学课程较少。另一个可能的原因是,这些国家的大学教育往往不够活跃,尤其是在大学最后两年的学习中。
在中国,精英院校和非精英院校的学生在学业技能方面的巨大倒退——与印度和俄罗斯的有所增长——是惊人的,也是出乎意料的。即使考虑到每一轮评估中考试动机的差异(可忽略不计),结果也是具有较强说服力的。造成技能倒退的一个可能原因是,中国学生很少因成绩不佳而被迫退学或辍学,因此学习积极性可能较低。另一个可能的原因是,尽管中国学生的数学和物理课业负担相似,但中国教师往往布置较少的家庭作业和课外阅读任务,这也可能与学生的学习能力有限有关。与中国的学生相比,印度和俄罗斯的学生之所以能取得进步,可能是因为他们需要通过定期评估并且承担学业的失败风险,这些都会对他们的学习技能负责。
技能的增益似乎是由于花时间上课或完成与课程直接相关的学校作业,而不是花时间接受课外辅导或指导。补充表2显示了三个国家的精英院校和非精英院校在校内外活动上花费的时间量。学生用于课外接受辅导或指导的时间只占总学习时间的1-7%。这也很可能只是上限估计值,因为我们无法区分校外辅导和指导(也可能来自校内同学或教师)。由于绝大多数学习时间都用于与课堂相关的学习,而不是课外辅导或辅导,因此技能的增长很可能反映了与接受大学教育相关的增值。
此外,所观察到的各国之间以及精英院校与非精英院校之间在技能水平及其增长方面的差异可以归因于高等教育体系和院校,而与各国和院校类型之间在家庭背景和校外活动(如校外辅导、实习、有偿工作和志愿服务)方面的差异无关。具体来说,在估算国家间技能水平及其增长的差异时,我们控制了家庭背景和校外活动。无论我们是否控制了家庭背景和校外活动,中国和印度在技能水平上的巨大差异程度都是相似的。相比之下,在对家庭背景和校外活动进行调整后,俄罗斯在技能水平上进一步落后于中国和印度。俄罗斯与其他两个国家之间不断变化的分数差距是可以预见的,因为俄罗斯学生的家庭财富水平更高,父母受过大学教育的可能性更大(而这些社会经济因素几乎总是与考试分数正相关)。控制家庭背景和校外活动并不能从根本上改变各国在技能增益方面的差异,也不能改变同一国家中精英大学和非精英大学之间的差异。
最后,根据我们的研究结果,大学内不同性别学生在数学(在中国、印度和俄罗斯)和批判性思维(在印度和俄罗斯)方面差距正在缩小,这可能会对提高女性在STEM相关专业劳动力中的平等代表性产生影响。我们的研究是对中国早期研究的补充,这些研究表明,尽管STEM专业女学生在大学伊始的学业成绩低于或与男学生持平,但她们的学习成绩提升却高于男学生。尽管如此,在中国和印度,物理学习的前两年仍然存在一定程度的性别差距。这种差距的持续存在以及大学入学时数学和物理学科成绩的性别差距表明,这些国家需要投入更多资金来提高学生在中学阶段的数学和科学成绩,或者这些国家的STEM课程在吸引成绩较好的女生上还有一定的空间。
由于资源限制,我们的数据和分析存在一定的局限性,那就是我们只关注了两个专业。因此,尽管我们关于技能水平的研究结果确实凸显了不同国家和院校的学生在两个重要的 STEM 领域上的能力差异,但不应将其误解为整个教育系统质量的代名词。此外,我们对技能增益(代表大学质量)的研究结果不一定能推广到其他研究领域。尽管如此,我们的研究结果确实能够代表有关大学技能学习的各国之间的比较信息。
具体来说,我们的研究结果在几个方面为有关人力资本发展及其与生产力和经济增长关系的文献做出了贡献。首先,不同国家和院校在技能增益方面的巨大差异凸显了对大学技能发展进行更多研究的必要性。总体而言,中国、印度和俄罗斯在批判性思维方面没有任何提升,而中国在学术技能方面则出现了绝对的倒退,这一事实表明,包括精英和非精英院校在内的高等教育体系往往没有让学生做好准备,以应对以技能为导向的技术变革。尽管大量微观经济学文献关注的是大学入学和毕业问题,以及中小学教育中的技能发展问题,但却很少考虑大学中的技能发展问题。
其次,近期关于人力资本和经济增长的研究,仅使用了小学和中学学龄学生的认知技能衡量标准,从而隐含地假定各国在中小学教育中获得的技能与高等教育中获得的技能是相似的。然而,本文提供的证据显示,各国在大学技能方面存在着巨大的差异——绝对提高、没有提高甚至绝对倒退。与此密切相关的一点是,要想了解一个国家人力资本的生产和可用性,就必须了解中小学教育和高等教育体系是如何相互作用以生产出与经济相关的技能的。我们还提供了有关大学学位信号价值的间接证据。最近的研究表明,高中文凭很少或基本没有信号价值。然而,在中国,总体的学术技能负增长加上大学或精英大学学位的高经济回报表明,大学文凭在某些情况下可能具有很大的信号价值。在这种情况下,上大学的社会回报率远远低于私人回报率,这就使人们对高等教育公共投资的效率产生了质疑。
第三,我们对区域和全球的人力资本存量进行了深入分析。虽然已有关于中国、印度和俄罗斯的高等教育总体状况的研究,但由于缺乏高等教育技能水平方面的证据,导致这些国家的人力资本发展情况并不完整。我们的研究结果揭示了这些世界大国在培养STEM领域技能型毕业生的能力,这可能对促进经济发展和提升全球竞争力至关重要。鉴于中国、印度和俄罗斯学生的移民倾向,我们的研究结果还为全球高技能STEM知识分子向美国等发达国家移民的趋势提供了背景解释。
机动车检验标志电子化
斯坦福大学(IRB#31585)批准了本研究项目的机构审查委员会审批。所有参与者均已知情同意。未向参与者提供任何补偿。数据收集和分析都不是在无视假设的情况下进行的。
4.1中国、印度和俄罗斯的抽样和分析
我们对计算机科学和电气工程专业的学生进行了抽样调查,这些学生在中国(34%)、印度 (24%)和俄罗斯(24%)的 STEM 专业本科生中占很大比例。。我们首先调研了来自中国、印度和俄罗斯的所有本科(学士学位)计算机科学和电气工程课程,这些课程的要求和内容与美国的本科计算机科学和电气工程课程具有可比性。随后,在这些国家的拥有计算机科学和电气工程课程的高校范围内,我们随机抽取了一些高校。简而言之,我们从中国的六个代表性省份中随机抽取了六所高校。在印度和俄罗斯,我们采用分层随机抽样方法,分别选取50所和34所高校。我们总共抽样了中国的7所精英院校和29所非精英院校、印度的8所精英院校和 42 所非精英院校、俄罗斯的6所精英院校和28所非精英院校。
接下来,我们在样本高校内随机抽取了一些学院。在每个随机抽取的学院中,我们对所有大一和大三学生进行了抽样。我们将每个年级的学生随机分配为两半,其中一半学生参加特定的数学和物理测试,四分之一的学生参加批判性思维测试,另外四分之一的学生参加数据素养测试。中国、印度和俄罗斯的所有电气工程专业以及绝大多数计算机科学专业都会教授数学和物理课程,而且几乎全部在大学前两年内完成授课。然而,少数计算机科学专业在前两年内不教授物理课程,因此俄罗斯(18.6%)和中国(0.7%)的少部分被抽样的大三学生参加了信息学测试,而不是物理测试。因此,我们对物理技能的评估是基于那些在其课程中需要学习物理课程的学生样本。基线测试的响应率很高,在中国有95%的入学学生参加了考试,印度为95%,俄罗斯为87%。总共有来自中国的5102名大一学生和4145名大三学生,来自印度的8232名大一学生和9223名大三学生,以及来自俄罗斯的2607名大一学生和2096名大三学生参加了调查。在大一学生中,36%的参与者为女性,64%的参与者为男性;平均年龄为18.4岁。在大三学生中,39%的参与者为女性,61%的参与者为男性;平均年龄为20.5岁。我们没有使用统计学方法预先确定样本量。据我们所知,我们的样本量已远大于以往使用标准化评估和全国代表性(随机)样本评估大学技能水平的研究。
在基线测试后的将近两年时间里,我们对不同的大一和大三学生子样本进行了跟踪测试(当他们大二和大四结束时)。在基线测试中参加数学和物理测试的大一学生,在后续测试中又进行了第二学年末的数学和物理测试。而在基线测试中参加批判性思维测试的大一学生和大三学生,在后续测试中分别进行了第二学年末和第四学年末的批判性思维测试。跟踪测试的响应率相对较高,在中国有80%的入学学生参加了考试,印度为95%,俄罗斯为90%。
我们通过几个步骤对学生样本技能水平及其增益的估计值进行了计算。为评估特定国家或高校类型、学生组别(第1组的第1年开始及第2年结束;第2组的第3年开始及第4年结束)以及特定科目测试(数学、物理或批判性思维),我们计算了不同国家、高校、年份和测试科目的学生平均分数。
为了估计特定国家、高校类型、测试科目和学生组别(第1组从第1学年开始到第2学年结束;第2组从第3学年开始到第4学年结束)的技能增益情况,我们进行了以下回归分析:
其中,Yijt指大学j的学生i在时间t时(基线或跟踪测试)的特定科目的测试成绩;Fijt是一个虚拟变量,表示跟踪测试(与基线测试相对);εijt是误差项。
我们对第一学年开始(以及第三学年开始)的技能水平估计时,使用了处于基线阶段的学生样本;对第二学年末(以及第四学年末)的技能水平进行估计时,使用了跟踪测试阶段的全部学生样本。增益是基于同时参与基线和跟踪测试阶段的学生测试成绩计算的。第二学年与第一学年水平之间的差异(同样,第四学年与第三学年水平)估计与增益估计不严格相同。我们还使用多重插补法计算了两组备选样本的增益估计:(1)使用参与基线测试的所有学生(无论他们是否参加了跟踪测试);或(2)使用参与跟踪测试的所有学生(无论他们是否参加了基线测试)。未经调整的增益估计值和经过调整的增益估计值在实质上是相同的。
为了比较不同国家之间的技能水平,我们对特定学生组别在特定时间点(第1组从第1学年开始到第2学年结束;第2组从第3学年开始到第4学年结束)参加特定测试(数学、物理或批判性思维)的学生样本成绩进行了以下回归分析:
其中,C’ij表示国家虚拟变量的向量(当因变量为学生的数学或物理分数时,为印度和俄罗斯的二元指示变量;当因变量为学生的批判性思维分数时,为印度、俄罗斯和美国的二元指示变量)。国家虚拟变量的系数估计表明了印度、俄罗斯和美国与未包含在内的国家(中国)之间的技能水平差异;我们使用Stata 15.1中的-lincom-命令计算了各个国家两两之间的点估计值和标准差。
为了比较精英和非精英高校之间的技能水平(或男性和女性学生之间的技能水平),我们进行了类似于方程(2)的回归分析,但是将国家虚拟变量替换为一个表示精英与非精英高校(或女性与男性)的单一二元指示变量。
为了比较不同国家之间的技能增益,我们对特定组别的全部学生样本(第一学年开始到第二学年结束的组别或第三学年开始到第四学年结束的组别)参加特定测试的成绩(数学、物理或批判性思维)进行了以下回归分析:
类似地,为了比较精英和非精英院校之间的技能增益(或男性和女性学生之间的技能增益),我们进行了类似于方程(3)的回归分析,但是将国家虚拟变量替换为一个表示精英与非精英高校状或女性与男性)的单一二元指示变量。
最后,为了探究技能水平和增益的差异在多大程度上是由国家和高校类型的差异或其他因素所影响的,我们用方程(1)、(2)和(3)进行了回归分析,并采用了不同的基线控制措施。这些基线控制措施包括社会经济地位(母亲是否上过大学,父亲是否上过大学,以及基于家庭资产的财富指数),以及参与校外活动的程度(辅导和兼职工作,以及参与实习、创业活动、社区服务、志愿工作和宗教组织)。
为确保具有国家代表性,我们对所有分析估计值和标准差进行了校正,包括多阶段抽样和概率抽样权重等调查设计特征。我们还分别估计了未校正(使用列表删除法)和已校正(使用多重插补法)的技能增益。由于两种情况下技能增益估计在实质上是相同的,因此在正文中只报告了未校正的估计。
4.2 中国、印度和俄罗斯的测试和测试规则
批判性思维测试是由美国教育测验服务(ETS)开发的HEIghten测评内容中的一部分。该测试所评估的框架是根据对高等教育中批判性思维研究的系统回顾而定义的;它反映了发展可靠和有效的论证、评估证据及其应用、理解含义和后果,以及区分因果关系和解释等能力。该测试的设计是文化中立的,因此可以对不同国家背景下的学生进行测试。在基线测试中,对大一和大三学生进行了批判性思维测试。在将近两年后的跟踪测试中,同样的学生再次参加了这一测试。
数学和物理测试是专门为检验各国和各院校计算机科学和电气工程专业学生大一和大二末(相当于大三开始时)的技能而设计的。测试针对到具体年级,测试学生的数学和物理技能,而这些技能是他们在大一开始和大二结束时应该学会的。每门科目的特定年份测试都包含大量的锚定项目,这些项目使分数在不同年份之间相等。不同国家的特定年份测试也完全相同,测试的内容范围在不同国家和年份(以及精英和非精英高校)都属于常规和重要知识点。
针对每种类型的测试,分数都按比例进行了标准化,以便在不同国家和年份之间进行比较。为了便于解释,已标准化的分数进一步转化为z分数(均值为0,标准差为1)。为了得到关于批判性思维的z分数,我们使用了在中国、印度和俄罗斯的基线调查中得到的批判性思维分数的加权平均值和标准差。为了得到数学和物理的z分数,我们使用了在中国、印度和俄罗斯的基线,以及跟踪测试中经过IRT量表标定的分数的加权平均值和标准差。
为确保不同国家和机构的测试条件尽可能相似,我们也采取了一定的措施。首先,在每个国家,考试大约安排在学年第一学期的中途进行。具体来说,中国和俄罗斯在2015年11月底和12月初进行考试,而印度在2017年10月底和11月初进行考试。印度的学年通常从8月开始,而中国和俄罗斯的学年通常从9月开始。其次,如前所述,每个国家的学生参与率都很高,而且具有可比性,远高于 PISA 2015 的最低参与率(80%)要求。当然,如果参与率很低,无反应偏差也不会改变本文的主要结论。第三,我们对考试进行了严格的多阶段翻译、改编和审查。第四,由受过培训的监考员以同样的方式介绍考试内容并进行监考。第五,监考员为学生提供相同的参与激励,特别是,在研究完成后,所有学生都有机会选择获得一份关于他们考试成绩的个性化报告。
在完成两场考试后,学生需回答一份问卷。在问卷中,学生被问及年龄、性别、父母教育水平以及是否参加了自己国家的大学入学考试。我们还向一部分学生(在基线调查中参加了批判性思维或数据素养测试的三年级学生)询问了他们在上课、做与课程直接相关的学校作业以及课外接受辅导或指导方面花费的时间。
4.3 美国的抽样、测试管理和分析
美国大学学生的批判性思维能力的数据是由ETS在2016年至2018年收集的。我们使用了来自美国一系列院校的修过STEM学士学位课程学生的子样本,以构建批判性思维能力水平的比较基准。STEM专业学士学位学生的样本是通过询问学生他们的预期或实际专业来确定的。在卡内基分类方面,样本包括12所博士生学院(1035名学生,占样本的65%)、22所硕士生学院(473名学生,占样本的30%)和9所本科生学院(90名学生,占样本的6%)。样本中约有45%的学生实际上来自排名最高的R1机构——开展最高质量研究活动的博士学位大学。美国STEM学士学位课程学生的分布在博士研究型、硕士和本科学院之间分别为67%、24%和9%(其中在R1机构中为44%),因此样本中学生的跨学院分布与美国学士学位课程中的STEM学生类似。
考虑到在不同年份参与测试学生的抽样中可能存在的不一致性,以及STEM课程的高辍学率,我们进行了回归调整后的增益估计。我们控制了ACT/SAT等值分数(总分和数学分开),以及年龄、性别、少数族裔身份(是或否)、家中是否使用英语(是或否)和高中平均成绩(GPA),来获取校正后的美国学生技能增益估计。GPA值被分为高(3.5至4.0)、中(3.0至3.5)、低(低于3.0)和“未报告”(样本的16%)等类别。51% 的样本可提供 ACT/SAT 等值分数。我们通过在回归中引入虚拟变量来处理缺失值。当使用仅考虑ACT/SAT总分、仅考虑ACT/SAT数学分、两者都考虑或都不考虑的方法时,结果实质上是相同的。
此外,我们还通过将其与基于纵向数据的其他主要研究中的技能增益估计进行比较,进一步验证了我们在美国大学四年内的不同年级批判性思维能力增益估计。我们所报道的在大学四年内批判性思维能力的增益估计值与这两个主要研究中报告的增益值估计相似。
查阅原文:《Nature Human Behaviour》Prashant Loyalka, Ou Lydia Liu, Guirong Li, Elena Kardanova, Igor Chirikov
DOI: 10.1038/s41562-021-01062-3
转自:“百研工坊”微信公众号
如有侵权,请联系本站删除!