0 引 言
随着大数据时代的到来,各类数据呈现爆发式增长,数据的规模、类型、复杂度和价值都得到了极大提升,各个领域如金融、政务、军事等对大数据分析应用技术的需求也快速增长。大数据技术作为新一代信息技术的代表,已经成为国家的战略重点之一。为了满足国家科技自主创新和新时代人才培养的需求,教育部于2017年提出了“新工科”概念[1],在此背景下,许多高校纷纷开设大数据、人工智能等相关课程,旨在培养掌握海量数据处理能力和分析能力的新时代工科人才,并开始探索大数据教学领域中的应用和教学改革。文献[2]中提出在大数据课程的教学过程中引入PBL模式,分别针对问题情境、教师、学生这三大要素介绍了教学设计。文献[3]中针对大数据理论+实践类课程,提出将教学划为4个互相支撑与促进的阶段,并对各阶段的教学模式设计进行了讨论。文献[4]中分析了目前大数据课程教学中存在的问题,并基于此提出“理论、技术、应用、实践”四位一体的大数据课程体系。文献[5]中提出通过改革课程教学模式和考核体系,实现大数据类课程线上教学与线下实践相结合的教学模式。文献[6]中提出在人工智能引论课程采用知识图谱教学方法,开展知识图谱驱动的实践教学、知识图谱问答等课堂教学应用。
问题式学习(Problem Based Learning,PBL) [7]是一种基于问题导向的教学方法,以建构主义学习理论为基础,通过解决复杂且真实问题来培养学生自主解决实际问题的能力和批判性思维,强调主动思考问题而非传统以系统性知识教授为主的教学方法,以此培养学生的创新能力。PBL 在西方发达国家取得了良好的教学效果[8-9],是已经成熟且成为主流的西方教学模式之一。国内院校对PBL教学的可行性进行了论证[10]与试行,获得了良好的效果,并逐渐在更多院校中流行起来。
1 大数据类课程教学现状
一般而言,课程的教学质量的优劣往往取决于多种因素,包括是否新颖的教学模式、学生的基础知识扎实程度等,传统的大数据类课程知识点繁杂,在教学上对教师和学生的能力要求较高,实际教学中表现为如下问题。
(1)教学方法在内容上侧重基础理论讲授,知识点较为僵化,和业界快速变化的前沿问题脱节严重,同时高强度的单向理论灌输导致课堂互动性不强,学生难以完全集中注意力,容易丧失学习兴趣,甚至弃学。
(2)按部就班的教学模式使得教学过程中不同课程的知识点较为孤立,缺乏直观的知识结构展示,学生难以对各知识点进行联动,不能活学活用。
(3)学生的态度问题。大数据类课程是和业界前沿联系紧密的综合性课程,学生对课程的重要性认识不足,在理论学习上,往往采用应试教育的学习方法,通过刷题等方式片面追求考试成绩;在课程的实践中缺乏深入思考,不能满足创新性思维和职业生涯规划的培养要求。
2 基于知识图谱的大数据类课程PBL教学新模式设计思路
依据PBL的教学理念,同时满足教育部“卓越工程师教育培养计划”的培养需求,应在教学过程中强化学生的工程和创新能力,按照计算机和软件行业的通用标准培养人才。
为了满足教学的实践性和综合能力要求,总体思路是根据课程目标和已有资源构建大数据课程知识图谱,并结合PBL以问题为核心的教学模式,设计基于知识图谱的“问题导向→项目驱动→课程思政→质量评价→反馈优化”的教学新模式,设计思路如图1所示。
3 基于知识图谱的大数据类课程PBL教学新模式实践
云计算与大数据是我校计算机学院面向高年级本科生开设的系列课程,包括大数据导论、云计算技术等课程。课程组针对该系列课程开展了教学新模式的实践。
3.1 知识图谱构建
知识图谱(Knowledge Graph)[11]能较好地通过图结构表达客观世界中实体、关系、事件等概念,将海量数据资源进行有效的组织管理,使之更接近客观认知。知识图谱构建一般包括命名实体识别、实体关系抽取和知识融合等环节。实体识别指的是识别出文本中特定类型的实体,如人名、地址等[12];实体关系抽取是构建知识图谱的难点,其目标为挖掘两个甚至多个实体间的联系[13];知识融合将不同的数据融合成一个更统一简洁的形式,为不同知识图谱之间建立互操作性提供基础[14]。该系列课程根据教学目标构建知识图谱,总体流程如图2所示。
(1)数据预处理。由于知识图谱的数据来源广泛且形式、质量不一,存在多样性和异构性等特点。因此,要将不同的数据融合成一个更统一简洁的形式,为不同数据间建立互操作性提供基础。可使用已有的教学资源,包括教学计划、论文、开源系统代码等,以及网络链接爬取和开源知识数据的方式获取。
(2)实体识别和实体关系抽取,对爬取的数据文本,首先进行文本分割、清洗、实体过滤等工作,再利用基于依存句法分析的LTP开源平台进行实体识别与实体关系抽取,得到领域内知识三元组。
(3)课程图谱构建,采用基于neo4j图数据库对实体和关系的三元组数据进行展示。通过这种直观的方式,使学生理解不同知识点间的关联性,为新模式教学打下基础。以云计算技术课程为例,通过对领域论文、百度百科词条、CN-Dbpedia等资源进行文本清洗和分析,共抽取生成了超过8 000条语义三元组,构建的知识图谱如图3所示。
3.2 问题导向
如何设计问题是PBL教学法的核心,课程问题来源主要根据课程教学目标,通过教学调研(课堂投票、课后问卷等),同时结合业界前沿的科研热点和技术问题,设计契合教学知识点的问题案例,并将问题划分给不同的学习小组,教师则以小组为单位,对学生进行指导。比如,对学生在学习该系列课程过程中各知识点的理解难度进行统计调研,结果如图4所示。其中,占比最高的分别是大数据安全和开源大数据平台。针对该结果,在后续的教学中专门设计该知识点相关的问题及项目,增加学生的实践能力训练。
3.3 项目驱动
在问题确立后,新模式的具体实施就成为课程的关键环节。课程在教学过程中以项目开展教学实践,项目来源主要包括课程项目、大学生创新创业项目(STITP)、科研项目等多种渠道。
在教学实践中,针对课程的知识特点,采用基于项目的“分层次+专题式”的教学体系,如图5所示。在理论教学上,将云计算与大数据进行层次划分,将知识点划分为多个专题模式,云计算包括虚拟化与容器、云存储、云监管、云安全和云节能技术专题,大数据则分为大数据采集、大数据处理与应用、典型大数据平台等专题。同时根据专题特点,设计与实际问题联系密切的实验项目。如虚拟化专题提出基于Hipervisor的不同虚拟化技术的对比研究、OpenStack的安装部署等实践;大数据处理专题要求熟悉常用的开源数据处理工具,实现DBScan、Kmeans等常见聚类算法;大数据平台要求学生熟悉经典的Hadoop、Spark等大数据处理平台。通过各专题的项目实践环节培养学生使用各种新工具解决实际工程问题的能力和团队协作能力,推动学生在了解并掌握大规模数据处理技术的基础上,学会应用相关技术解决现实中典型大数据分析等问题。
课程融入PBL基于项目的实践学习理念,注重以学生团队为中心开展项目实践。在课上进行知识点讲解后,学生可自由组队交流,并根据兴趣选择相关的实验课题,讨论后在教师指导下制订实验方案,然后开始组织实施项目的任务分工、代码调试、专题研究报告撰写等活动,最终以小组为单位进行项目答辩。在此过程中,学生由被动的知识灌输转变为主动探索,同时通过讨论深化巩固所学知识。
由于上课人数较多,课程教学中采用“大班+线上线下混合”的方式,依托慕课堂等工具实现练习发布、问题投票、引导课堂讨论、教情统计等,学生可以通过云平台提交实践报告,实现师生的良性互动。
3.4 学习资源推荐
传统的教学模式往往存在资源陈旧、内容僵化等问题,导致学生在学习过程中难以获取有效的知识推荐。本系列课程采用了基于知识图谱的数据挖掘技术辅助教学,实现多课程间知识点间的联动以及学习资源推荐。课程基于构建的课程知识图谱,使用pagerank等基于图排序的算法,根据课程知识实体的内容和链接的重要性进行个性化排序,并将排序结果以词云的方式推荐给学生。词云推荐结果如图6所示。
3.5 课程思政
在面向新工科的发展背景下,根据课程思政的改革要求,课程主要立足点是“立德树人”,强调主流价值观的引导,思政体系如图7所示。
①在职业素养上,注重项目实践中对学生进行系统性的专业实践教育,包括职业道德、行为规范等,引导学生爱国敬业。②在团队协作上,培养学生的实际动手能力和工程组织与实施的能力,通过团队合作的方式培养学生从事该领域工作所需的团队协作、敏捷团队、成果交流等能力。③在日常教学中潜移默化地融入文化因素,展现“文化自信”;在实践教育中介绍企业新技术,如华为的“鸿蒙”、阿里的“伏羲”“女娲”等大数据计算平台以培养、激发学生的民族自豪感。④课程同时也注意结合时事热点案例进行分析,比如在进行大数据安全方面的教学时,引入社会主义核心价值观中的国家安全概念,通过对2022年西北工业大学遭受美国国家安全局网络攻击事件的讨论,增强学生在网络空间中的法律意识和安全意识,帮助其树立正确的网络道德观。⑤在创新能力方面,在项目实践中从多方面如技术、经济、组织等综合角度培养学生思考的习惯,提高思辨能力。
4 教学效果评估
与传统的静态的、单一的评价模式不同,基于PBL理念的教学模式强调项目实践,课程采用面向团队的阶段性评价的方式,包括团队自评、形成性(全过程)评价等多维评价模式,同时利用线上教学辅助工具,结合知识点学习时长、搜索记录、观看频次等多维基础数据,关注整个教学过程,最终形成加权评价结果。
课程对2022—2023年参与该系列课程的学生进行了综合测评,无论是从课堂讲授的学习过程,还是项目实践过程来看,学生的学习主动性和教学质量得到了明显增强,达到了预期效果。此外,本教学方法还应用在如“互联网+”等相关领域的创新实践项目比赛中,学生参与该类项目的质量和频次也出现了明显上升。
5 结 语
融合课程知识图谱和PBL教学模式的大数据课程教学方案,首先基于多种教学资源进行课程知识图谱构建,然后在教学过程中使用项目驱动的教学新模式,使用知识图谱进行辅助教学和学习资源推荐。该方案在我校云计算与大数据系列课程实践后,从课程思政、质量评估、反馈优化等方面取得了较好的教学实践效果。目前本系列课程已入选2022年江苏省本科高校产教融合型一流课程,在后续的教学过程中,将持续优化,结合ChatGPT等新技术,为学生构建个人画像,真正实现“因材施教”。
参考文献:
[1] 陈龙, 张伟, 赵英良, 等. 新工科背景下大学计算机人工智能实验案例设计[J]. 计算机教育, 2022(3): 29-33.
[2] 刘媛媛, 杨晓敏. PBL教学法在大数据课程教学中的应用研究[J]. 计算机时代, 2022, 366(12): 121-123, 126.
[3] 郭庆彪, 吕鑫, 赵兴旺, 等. 面向大数据精准教学的课程教学模式研究[J]. 吉林农业科技学院学报, 2022, 31(3): 100-103, 121.
[4] 李晓丹, 刘云翔, 原鑫鑫, 等. 基于校企合作的大数据课程建设与教学实践[J]. 大学教育, 2022, 146(8): 225-227.
[5] 姜飞, 李明东, 孙雪. 大数据导向下多元混合教学模式在大数据类课程中的应用研究[J]. 兰州文理学院学报(自然科学版), 2021, 35(5): 106-110.
[6] 谢榕, 朱卫平. 人工智能课程领域知识图谱及其创新教学模式[J]. 软件导刊, 2021, 20(12): 179-186.
[7] 崔炳权, 何震宇, 王庆华, 等. PBL教学法的研究综述和评价[J]. 中国高等医学教育, 2009(7): 105, 118.
[8] Lohfeld L, Neville A, Norman G. PBL in undergraduate medical education: A qualitative study of the views of Canadian residents[J]. Advances in Health Sciences Education, 2005, 10(3): 189-214.
[9] Prince K J A H, Van E P W L J, Boshuizen H P A, et al. General competencies of problem‐based learning (PBL) and non‐PBL graduates[J]. Medical Education, 2005, 39(4): 394-401.
[10] 黄亚玲, 刘亚玲, 彭义香, 等. 中国学生应用PBL学习方法可行性论证[J]. 中国高等医学教育, 2007, 121(1): 3-4, 10.
[11] 王萌, 王昊奋, 李博涵, 等. 新一代知识图谱关键技术综述[J]. 计算机研究与发展, 2022, 59(9): 1947-1965
[12] 谢博, 申国伟, 郭春, 等. 基于残差空洞卷积神经网络的网络安全实体识别方法[J]. 网络与信息安全学报, 2020, 6(5): 126-138.
[13] 官赛萍, 靳小龙, 贾岩涛, 等. 面向知识图谱的知识推理研究进展[J]. 软件学报, 2018, 29(10): 2966-2994.
[14] 张天成, 田雪, 孙相会, 等. 知识图谱嵌入技术研究综述[J]. 软件学报, 2023, 34(1): 277-311.
基金项目:国家青年自然科学基金项目“面向结构演化的动态增量图计算性能优化方法研究”(61902194);教育部产学合作协同育人项目“基于知识图谱的云计算课程教学平台研究”(教高司函[2021]18号,202102210004);南京邮电大学教改项目“线上线下混合教学环境下基于多模态知识图谱的可解释性学习效果评价研究”(JG00422JX19)。
第一作者简介:刘强,男,南京邮电大学讲师,工学博士,研究方向为大图计算与数据挖掘,cloudeagle_bupt@sina.com。
引文格式:刘强,徐小龙,赵龙龙,等. 基于知识图谱的大数据类课程PBL教学实践[J].计算机教育,2023(12):325-330.
转自:“计算机教育”微信公众号
如有侵权,请联系本站删除!