投稿问答最小化  关闭

万维书刊APP下载

知识图谱在科研选题中的应用价值探讨

2022/7/21 9:21:28  阅读:282 发布者:

中华医学科研管理杂志, 2022,35(1)田甜, 张永, 王朝晖

摘要目的

本研究以肺部感染研究领域为例,通过分析核心作者机构、研究热点和突现词,探讨科学知识图谱在科研管理的第一步——选题优化中的应用价值。

方法

在中国知网(CNKI)数据库以关键词"肺部感染""肺炎"进行检索,时间范围选取20142020年,选取医学专业领域学科。利用CiteSpace软件生成可视化图谱,对发文机构、关键词共现、主题聚类和时间线突现词进行分析。

结果

共检索13 169篇文献,发文量最多的前5位机构有4位来自于河南省。2020"新型冠状病毒""新型冠状病毒肺炎"为新的热点词。"慢阻肺""血气指标""炎性因子""维生素A"等都是2018年出现的突现词。

结论

科学知识图谱在科学领域发展方面具有客观性、科学性和高效率的特点,在科研工作中选题优化方面具有一定的可行性,也可以作为专家评审课题合理性的参考依据,保证客观和公平,并为科学的科研管理策略提供参考,降低科研成本,提高科研管理工作的效率和水平。

选题是科学研究工作的第一步,也是科研管理的重要组成部分,需要通过科学研究后归纳得出,尊重科学性、创新性、实用性和可行性的原则[],确立有价值的选题需把握课题的研究动态,设计出切实可行的研究路线,提高科研能力,推动医学科学技术发展。科研选题课题来源除了在实际工作中的积累外,科研协作、学术交流以及文献检索也是很重要的途径。为避免低水平或重复立项,提高科研课题的质量,需对选题质量进行优化,以能够通过评审。选取研究领域的学科热点或学术前沿问题是选题策略常见的来源。

文献是知识传播的重要媒介,是科研工作成果的展示,也为后人进行科研工作提供了帮助和借鉴。对某一学科的文献主题进行分析,有助于科研工作者对该领域的演变发展、重大发现、研究热点和未来趋势深入了解。科技论文中的关键词可以反映论文主题,对文献信息检索具有重要作用[],在一定程度上反映了论文的学科结构。使用关键词共现网络,能够将数据全集中的学科结构清晰地展示出来,从宏观上反映一个研究领域内的重点研究内容。

肺部感染是多种疾病的常见并发症,也是致死的主要原因。不同类型的肺炎都有不同并发症的产生风险,提高了诊断的难度,导致临床症状更加复杂,几十年来其研究已有大量文献发表,研究已趋于稳定,新的发现和方法在近7年内可以体现。本文采用CiteSpace软件[]作为研究工具,以肺部感染研究领域为例,选取20142020年在中国知网(CNKI)数据库上发表的医学专业领域论文,对肺部感染近7年的研究发文量、核心作者机构、研究热点和时间线以及突现词进行分析,进一步探讨利用CiteSpace软件在医学科研选题优化中的应用价值。


1 资料与方法

1.1 数据来源

CNKI数据库,以"肺部感染""肺炎"为关键词,分别选取检索时间范围为20142020年,选取医学专业领域学科,去除"中国政治与国际政治""医药卫生方针政策""生物学"等学科。对检索结果去重、删除无关条目。选取医学期刊文献,去除会议和学位论文、报纸和图书等。导出数据并保存为Refworks格式。

1.2 方法1.2.1 软件选择

采用CiteSpace 5.8.R3软件作为主要研究工具。单个时间分区长度为1年;节点类型选择作者、发文机构和关键词等进行合作网络以及共现网络分析。合作网络图谱中的节点表示发文量;共现网络图谱中的节点表示出现频次,各图谱中节点大小与量呈正比。模块值(Q)>0.3表示社团结构是显著的。平均轮廓值(S)>0.5认为聚类是合理的。

1.2.2 数据转换

CNKI数据库检索到的所有文献数据以Refworks格式导出并保存为download_***.txt格式。利用CiteSpace 5.7.R4软件对导出数据进行格式转换,再将格式转换后文献导入软件进行可视化分析。



2 结果

2.1 发文量和核心机构分析

检索共713 169篇肺部感染相关文献,其中2014年为1 787篇,2015年为1 836篇,2016年为1 891篇,2017年为1 804篇,2018年为1 784篇,2019年为1 922篇,2020年为2 145篇。发文量排名前5位机构分别是郑州大学第一附属医院、郑州市第七人民医院、解放军白求恩国际和平医院、河南中医药大学第一附属医院和郑州大学附属洛阳中心医院,其中4所均来自河南省。发文量5篇以上的机构共38(1),共计发文量222篇,占总发文量的1.69%。发文机构最多的省市前5位分别为河南省(70),江苏省(25)、天津市(18)、江西省(15)和河北省(13),表明肺部感染研究的地域分布较广,研究相对分散;河南省研究得较多,具有的高产机构量最多。

12014-2020年肺部感染研究发文机构情况

2.2 关键词共现和聚类分析

2014—2020年关键词图谱显示,共有776个节点,5 591条连线(Density0.018 6)Q值=0.346 7S值=0.679 7。词频数最多的前16位见表2,将"老年""老年人"合并为"老年",共计607次。2014—20196年合并分析前16位热点词共计词频数为17 560次,排名前5位热点词分别为"肺炎"(6 157次,35.06%)"肺部感染"(5 842次,33.27%)"儿童"(745次,4.24%)"危险因素"(744次,4.23%)"老年"(607次,3.46%)2014—2019年研究热点相对稳定,热点词排名前10位顺序仅微弱变化,而2020年排名前10位热点词共计2 904次,其中"新型冠状病毒"(295次,10.16%)"新型冠状病毒肺炎"(116次,4.00%)分别位于第3和第5位,与往年有所不同(3)2014—2019年研究热点相对稳定,但是2020年由于新型冠状病毒疫情的暴发,成为全球公共卫生危机,出现大量与之相关的研究,成为新的科学研究热点,包括病例报告、医院管理、影像学检测、疫情防控以及治疗方法等[]。与之相关的影像学检查比如"体层摄影术""X线计算机"也成为最新的热点词。

220142019年肺部感染研究热点词

32020年肺部感染研究热点词

根据聚类图谱显示,关键词生成的前7个聚类标签分别为0#肺部感染、1#肺炎、2#临床疗效、3#病原菌、4#小儿、5#循证医学和6#气管内(1)。上述聚类标签基本涵盖了国内肺部感染的主要研究方向,最大的聚类中包含关键词"头孢哌酮""脑钠肽""治疗效果""美罗培南""联合用药""细菌性""肺心病""呼吸衰竭""血气指标"等,表明这些方面相互联系较多,是近几年研究最热点的一个聚类。而其他关键词分布比较分散,未形成较强的聚类,即这些研究未与相关领域拓展,较为单一。

17年关键词聚类图谱

2.3 关键词时间线图谱和突现词分析

2014—2020年肺部感染关键词的时间线视图见图2。选取其中有代表性的几个关键词"并发症""病原菌""儿童""降钙素原""耐药性""护理"生成折线图(3)。肺部感染中儿童为高发群体[],一直以来被研究得较多,所以这几年来一直属于研究热点,具有一定的连续性,未来几年也将会不断被研究和探讨。病原菌和护理的研究前几年较多,但是呈逐年下降趋势。降钙素原之前研究得较少,近几年逐渐增加,之后趋于平缓,为近年来新出现的热点。耐药性和并发症发文量较少,均为已研究地较为成熟的领域,无新进展。

220142020年肺部感染关键词的时间线视图

320142020年关键词频次折线图

2014—2020年肺部感染主题共出现64个突现词(4)"慢阻肺""血气指标""炎性因子""维生素A"等都是2018年出现的突现词,近几年对这些方面的研究逐渐增多,如采用维生素联合治疗老年慢阻肺患者社区获得性肺炎,由于其安全性和疗效理想,故在今后的治疗中可以大力推广。由于我国人口老龄化趋势加快,老年呼吸机相关性肺炎和慢性阻塞性肺炎和社区获得性肺炎发病率仍会增加,降钙素原在肺炎诊断上的敏感性和特异性高于传统的炎性因子,并且与肺炎严重程度有一定的相关性,寻找新的炎性因子仍是未来的研究热点。针对老年慢阻肺合并呼吸衰竭,无创呼吸机为非药物治疗的首选方案,然而机械通气期间和拔管后48小时常会导致呼吸机相关性肺炎,为严重并发症,因其诊断金标准为有创性,临床上不易被患者和医生所接受,除了在护理方式上进行优化外,对其预防和控制规范同样重要,对此方面的研究有了一定的经验,但该难题仍需更多深入地研究,并且这也是未来的研究趋势。

42018-2020年肺部感染突现词



3 讨论

医学科研的价值在于解决实际的医学问题,即如何选题,是否具有临床价值,所产生的成果对疾病的预防、诊断和治疗产生的效用。临床上也存在大量尚未解决的问题有待于科学研究。而医学科研人员往往面临着繁重的临床工作,精力不足并且时间紧张,这就需要在工作中统筹安排时间进行科研学习。另外,在科研立项选题中,获得有价值的科学问题最为关键。这就需要对领域有足够的了解,知道其方法和研究模式,以及重要的理论和进展如何,而寻找这些答案需要大量的时间来查阅文献和资料。随着大数据时代的到来,数据密集型计算特征的第四范式科学研究正在兴起,软件在科学研究工作中发挥了重要的作用。有研究发现,我国大部分科研人员认为科学软件对自己的研究工作重要[]。科学知识图谱能够将信息进行过滤和筛选,对研究前沿和热点问题进行分析,对学科动态和发展进行跟踪,简单高效,是科研工作者获取信息的有力工具[]

3.1 核心研究机构分析在科研选题优化中的价值

科研人员在科研选题前期应掌握研究成果和核心作者分布于哪些机构,以及发文情况和科研动态,根据机构知识图谱快速掌握领域核心研究者专家和地区的信息,以寻求相关课题的合作。在科研课题立项管理中,也可以根据各研究领域的高产机构选取评审专家,以保证专家选取的科学性和客观性[]。发文量大的研究机构拥有较强的科研团队,科研能力强,这些机构之间进行合作,可以形成优势互补。若所在地理位置相近,可以形成研究地域集群。比如肺部感染研究领域中,发文量最多的前5位有4所为河南省医疗机构,郑州大学第一附属医院、郑州市第七人民医院、河南中医药大学第一附属医院及郑州大学附属洛阳中心医院研究的方向各有不同,可以互相合作形成研究基地。

3.2 研究热点和前沿分析在科研选题优化中的价值

科学研究对于专业领域中的研究热点、进展或突破应在第一时间掌握相关信息。研究人员在选题策划中需要具备文献查阅或信息整合的能力,有足够的信息敏感度并善于捕捉研究热点和科技成果,才能更好地应用于科学研究的选题策划。关键词是文章的精华提取,能够反映文章的主题。通过关键词的共现分析探索学科热点研究状况[]。知识图谱对期刊文章信息进行分析,不仅能帮助科研人员更新知识和提高学术水平,还能根据可视化结果分析提供聚类结果,帮助科研人员掌握关键信息脉络,从而在宏观层面把握科学研究的热点和前沿,为优化选题提供帮助[]。研究热点即这几年研究者众多,研究成果也较多的领域,且具有一定的连续性。

本研究中主题聚类Q值=0.346 7,说明社团结构是显著的。S值=0.679 7,说明聚类是合理的。0#肺部感染、1#肺炎、2#临床疗效、3#病原菌、4#小儿、5#循证医学和6#气管内这几个聚类标签基本涵盖了国内肺部感染的主要研究方向,结合近7年的热点词进行分析。"肺炎""肺部感染"是研究的主题,"儿童""小儿""老年""新生儿""脑出血""脑卒中"为研究对象,说明肺部感染大多发生在免疫力较为低下的人群中,如老年人和儿童,或者为疾病的严重并发症,如脑出血或卒中而昏迷或偏瘫导致长期卧床从而合并肺部感染。"病原菌""支原体"为病原体,针对病原体在抗感染过程中容易产生耐药性,也是治疗的难点。"危险因素""护理""降钙素原""气管切开"为诊治环节,也是肺部感染研究的重要部分。

时间线视图中每个聚类时间线上包含的几个关键词为主要关键词,随着年份的变化关键词频次相应改变,可以看出每个聚类里关键词的发展情况,每个聚类时间线上包含的几个关键词为主要关键词。根据7年关键词折线图可以看出,"耐药性""并发症"的研究近几年已较为成熟,并无太多新进展;"病原菌"稍有波动;"降钙素原"的研究稳定上升,因血清降钙素原能够有效判断细菌性肺炎及其严重程度,为临床早期对症治疗提供指导[];儿童是肺炎高发群体,对儿童患者的诊治今后也会仍然是这类疾病的热点;"护理"的研究近几年逐年下降,因研究热点范围较小,未形成稳定的研究方向,研究深度和广度有待进一步挖掘。

3.3 突现词分析在选题优化中的价值

突现词即在某一时段出现频次有较大变化的关键词,通过研究突现词的时间跨度,来判断该研究领域的未来趋势,寻找潜在的新兴研究方向、研究手段和方法[]。突现词表现了当年的重要研究点,目前有些研究将突现值较大的关键词作为研究前沿。较早年份的突现词代表过去几年研究的重要转折点,对当前的研究影响较小。

"慢阻肺""血气指标""炎性因子""维生素A"等都是2018年出现的突现词,近几年对这些方面的研究逐渐增多,而"慢阻肺"6.76的最高突现值代表了目前的研究前沿。"血气指标""炎性因子"突现值分别为6.706.62,均能代表今后的发展趋势,对将来的研究有所启示。而时间跨度在早几年的一些突现词,为经历了最高值变化后呈现出一种平缓的发展状态,比如"机械通气""护理体会""药敏分析""真菌感染"等为重点年份在2017年之前的突现词,之前研究得较多已有了一定的研究成果而近几年无重大发现。今后可适当减少对其的研究,将精力转向更需要研究的领域。



4 结论与思考

科研项目管理的本质要求是用行之有效的方法进行知识管理。利用网络技术把体系内的知识资源联系起来,建立知识网络;利用现代管理手段构建的知识共享平台,有利于科研人员之间的学习交流,以提高科研项目的完成质量。现代医学具有庞大学科体系,医学人才所要掌握的知识涉及的学科领域相当繁杂而宽泛。医院作为高技术人才相对密集的机构,科研创新能力是其竞争力的重要体现,医院科研管理中的知识管理尤为重要[]。医院在科研管理中应用知识管理的方法,可大大提高项目的完成质量。项目选题是科研工作的起点和基础,选题的科学性直接影响到项目实施的创新性和可行性。传统科研选题的确定方式存在一定的弊端,体现在选题来源有一定的单一性缺陷,会产生科研选题对象与社会需求脱节或者难以把握最新热点或前沿问题的可能性[]。知识图谱在文献资源与专题知识整合及复杂事实性问题查询方面发挥着重要作用[]。应用知识图谱可视化分析可以帮助科研人员搜集到该专业领域的热点问题,或亟待解决的科学理论与技术问题,预测学科的发展趋势,为科研创造价值,并且帮助科研单位和机构的共同协作或优势互补,降低科研成本,提升科研管理工作的效率和水平。

本文存在的不足主要在于选取中文数据库CNKI数据库作为研究工具,针对中文文献进行分析,仅代表我国该领域的研究结论,无法体现国际上的发展趋势,今后将针对英文数据库,如Web of Science等扩大样本量开展进一步研究。

转自:医学科研与管理空间

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com