投稿问答最小化  关闭

万维书刊APP下载

论文中普遍出现的10个无效关键词

2024/4/28 10:24:26  阅读:22 发布者:

近年来,中国学者每年发表的科技论文有数百万篇,如何在浩瀚的论文海洋中脱颖而出,吸引读者的注意力,提高论文传播力和显示度,关键词起着十分重要的作用。作为文献检索的重要依据,关键词应具有专指性、全面性、规范性等特点。

但实际情况是,科技论文中存在大量的含义宽泛、无实质内容的无效关键词,如应用”“分析”“问题”“研究等等,大大降低了科技论文的检索效率和传播效果。

为此,本文以中国知网为文献来源数据库,结合文献[3-5]及编校实践经验,选取10个科技论文中出现频率较高、指向性不强、含义空泛的关键词,分别检索其在2015—2019年发表的科技论文中的出现频率,分析其年度分布规律及关键词共现网络。

01

检索范围和方法

检索范围:文献来源限定为中国知网基础科学”“工程科技”“工程科技”“农业科技”“医药卫生科技”“信息科技”6类目录下的期刊、会议、学位论文等(即本文所指科技论文)大学学报学院学报博士论文硕士论文”;文献语种限定为中文;关键词限定为应用”“对策”“问题”“管理”“设计”“措施”“影响”“现状”“研究”“发展”;发表时间限定为2015-01-01—2019-1-31

检索方法:以关键词+发表时间”“关键词+发表时间+文献来源为组合检索条件,在中国知网6大类科技文献目录下进行检索,获得各关键词在不同检索条件下的词频分布。为确保检索结果的有效性,每检索一次均随机选取若干篇论文,并核对这些论文中是否包含目标关键词。最后,将所得结果输入Excel软件进行统计分析(检索时间为2020-03-07—03-09)

02

无效关键词的定义和分类

2.1无效关键词的定义

无效关键词是指词义宽泛、不能准确传达论文主题内容、不利于检索的词或词组,或是未经公认的缩写词等。它们与论文主题相关性不大,不能反映单篇科技论文的特点,不具检索价值。

2.2无效关键词的分类

无效关键词的分类目前尚无统一标准。本文根据文献[3.6]将无效关键词分为以下3:1)表示国别或地域的泛而不专的名词,如中国”“美国”“德国;2)“不能表示所属学科专用概念的不足以反映实质内容的词,如方法”“问题”“试验”“研究”“分析;3)加了限定词的复杂短语或是未经公认的缩略词等,如新型甘蓝型油菜品种”“AP”等,它们虽然能反映文章主题,但不利于计算机检索、识别。

03

10个无效关键词 计量学分析

3.1不同年份科技论文中10个无效关键词频率分布

结合已有研究及编校实践经验,本文针对第2类无效关键词展开研究。分别选取应用”“对策”“问题”“管理”“设计”“措施”“影响”“现状”“研究”“发展10个科技论文中出现频率较高的无效关键词,限定文献来源为科技论文,在中国知网进行检索。10个无效关键词在2015—2019年发表的科技论文中的频率(以检索记录表示)及其累计词频(10个无效关键词检索记录条数之和与当年发表的科技论文总篇数的比值)分布如表1所示。由表1可见,整体看,不同年度无效关键词频率分布相对稳定,按检索记录数排序,从高到低依次为应用”“对策”“问题”“管理”“设计”“措施”“影响”“现状”“研究”“发展,呈现出明显规律性。2017年,科技论文发表总量为2 017 727篇,这10个无效关键词检索记录之和达82 732(未排除有2个或多个无效关键词同时出现在同一篇科技论文中的情况),每100篇文章里就有约4篇文章的关键词里包含这10个无效关键词之一,可见无效关键词的使用相当普遍。2015—2019年,应用这一关键词出现频率最高,且其检索记录在20172018年分别达20 26720 203条,明显高于其他9个无效关键词的出现频率,说明科技论文作者选择应用作为关键词的比例较高。纵向来看,2015—2019年这10个无效关键词检索条数随年度的变化并无明显规律性,累计词频范围为3.7%4.1%,其中20152019年的无效关键词累计词频均为3.7%左右(1),说明科技论文作者并未有意地减少无效关键词的使用,无效关键词将会伴随着科技论文作者的写作习惯而长期稳定地存在。

1 2015—2019年科技论文中10个无效关键词频率及累计词频分布

3.2 10个无效关键词共词分析

共词分析法是指通过分析共同出现在同一篇文献中的关键词或主题词,从而鉴别某一学科知识结构和研究热点的方法。目前,基于关键词的共词分析法已被广泛应用于文献计量、信息系统、人工智能等领域。

本文以10个无效关键词为研究对象,分析其在2015—2019年共现关键词(2个关键词同时出现在同一篇文献中的现象)分布情况,结果如图1所示。图1中,2015—201910个无效关键词应用”“对策”“问题”“管理”“设计”“措施”“影响”“现状”“研究”“发展的检索记录总数分别为94 10050 28741 64437 07434 98930 56526 27523 90522 22518 448条。数据来源于中国知网,本文仅展示频率排序第115的共现关键词。

1 2015—201910个无效关键词共词分析

从图1可以看出,2015—2019年同一篇科技论文中同时出现2个无效关键词的现象相当普遍。例如,以问题为检索关键词,与其共现频率最高的关键词为对策,共现频率达15 223(1(c)),也就是说,在一篇以问题为关键词的科技论文中,有大于1/3的概率会同时出现对策这一关键词。分析其余9个无效关键词的共词分布情况也可发现,与这些关键词共现频率较高的往往为无效关键词。例如,按照关键词共现频率排序,2015—2019年与关键词应用共现的无效关键词依次为发展”“设计”“研究,共现频率分别为2 18818781 642(1(a));与关键词现状”“研究”“发展共现频率较高的几乎均为对策”“问题”“应用等无效关键词(1(h)(j)),可见无效关键词共现网络不仅不能反映学科知识结构和研究热点,而且造成了信息资源的浪费。值得一提的是,在本文选取的10个无效关键词排名前15的共现关键词中,有7个共现关键词中出现了建筑建筑工程,这可能与该领域的科技论文发文总量较大有关:建筑为主题词进行检索,2015—2019年累计发文306 196篇,约占科技论文总发文量9 890 018篇的3%

3.3不同期刊科技论文中10个无效关键词频率分布

以本文筛选出的10个无效关键词为检索条件,同时限定文献来源为学院学报大学学报,检索得到2015—2019年不同类型期刊发表的科技论文中的10个无效关键词频率分布及其累计词频分布如表2所示。由表2可见,2015—2019年,发表于大学学报的科技论文明显比学院学报的科技论文多,但学院学报科技论文中无效关键词的出现频率明显比大学学报科技论文的高。例如,2015年,大学学报共检索到67 598篇文献,其中以应用为关键词的文献为100;“学院学报共检索到42 620篇文献,其中以应用为关键词的文献为305条,二者差异显著。由表2还可看出,2015—2019年,大学学报科技论文中的无效关键词累计词频分别为0.73%0.72%0.69%0.58%0.54%学院学报科技论文中的常见无效关键词累计词频分别为3.36%3.34%2.89%2.65%2.56%,二者均随着年度的变化而逐渐降低,呈现出明显的规律性。同时,大学学报科技论文无效关键词累计词频明显比同期学院学报科技论文的低,说明前者关键词标引质量比后者的高。

2 2015—2019年不同类型期刊科技论文中的10个无效关键词频率及累计词频分布

3.4不同学历作者所著科技论文中10个无效关键词累计词频分布

以本文筛选出的10个无效关键词为检索条件,同时限定文献来源为硕士论文博士论文,检索2015—2019年不同学历作者所著科技论文中无效关键词频率分布及其累计词频(10个无效关键词检索条数之和与博士论文硕士论文总篇数的比值)分布,如表3所示。

3 2015—2019 年不同学历作者所著科技论文中的 10 个无效关键词频率及累计词频分布

由表3可见,2015—2019硕士论文总篇数显著高于博士论文总篇数,前者为后者的8.110.5;同时,硕士论文10个无效关键词出现频率明显比博士论文的高,如2019硕士论文中以设计为关键词的检索记录为203条,而博士论文中的检索记录仅为1条。由表3还可见,2015—2019硕士论文中的无效关键词累计词频明显降低,分别为10.43‰8.84‰8.32‰6.93‰5.32‰,与2015年相比,2019硕士论文无效关键词累计词频降幅达48.9%2015—2019博士论文中的无效关键词累计词频整体上也呈下降趋势,分别为2.39‰1.70‰1.71‰1.57‰1.40‰5年间博士论文无效关键词累计词频降幅达41.4%。同时,博士论文中无效关键词累计词频明显比同期硕士论文中的低,说明无效关键词的出现频率与论文作者学历有一定关系。

04

10个无效关键词出现原因及应对措施

4.1  10个无效关键词出现的原因分析

综合分析结果可知,虽然在2015—2019年博士和硕士作者群体已逐渐减少无效关键词的使用,但是在20152019年发表的科技论文中,这10个无效关键词累计词频并无明显变化(约为3.7%),说明无效关键词存在此消彼长的现象。本研究认为无效关键词出现的主要原因包括以下几个。

一是多数科技论文作者未接受有效的指导,不知道如何撰写合适的关键词。有研究表明,多数高校学生承认自己未接受过系统的科研写作训练。屈李纯等针对328名硕士研究生展开调研,发现仅有17.39%的研究生熟悉关键词的选取。其实早在1987年,我国GB/T 7713—1987《科学技术报告、学位论文和学术论文的编写格式》明确规定:每篇论文应选取38个词作为关键词,如有可能,尽量用《汉语主题词表》等词表中提供的规范词语。2019年,国家新闻出版署发布了针对关键词的行业标准CY/T 173—2019《学术出版规范关键词编写规则》,其中阐述了关键词的定义和基本要求。遗憾的是,高等院校中有关科技论文写作的课程和培训仍然较少,很多作者甚至从未听说过《汉语主题词表》,其他企事业单位中的作者接触到最新的标准、规范、写作培训和指导的机会更少,这也就导致了低质量科技论文和无效关键词的稳定存在。例如,在未包括质量”“分析”“技术”“原因等无效关键词的情况下,2015—2019年,仅本文选取的10个无效关键词检索记录总数达381 295;进一步分析这些无效关键词的累计词频可发现,其整体呈先增加后降低的趋势,但变化幅度不大,可见科技论文作者使用无效关键词的现象依然普遍。

二是部分作者未从思想上重视关键词对于论文检索的重要作用。有些中文科技论文作者只在乎论文是否能发表,是否能助其拿到学位或晋升职称,而对论文的关键词标引质量以及论文发表后的学术影响并不关心,这就导致科技论文中存在大量无检索价值的关键词。进一步分析图1还可以发现,作者在选取关键词时,往往只是根据刊物要求,简单地将论文题目拆分为38个关键词,而未仔细鉴别这些关键词是否能够准确地反映该篇论文的特点,导致同一篇论文中无效关键词共现的情况也相当普遍。例如,2015—2019年篇名中同时含应用研究的科技论文检索记录达199 841条,篇名中同时含影响研究的科技论文检索记录达128 358条,这也反映了部分作者从论文标题中选取关键词的随意性。

三是论文审读编校群体(包括论文指导教师和同行评议人员)把关不严。目前,仍然有相当一部分的编校人员秉持着改错不改好的理念,在审读科技论文时仅仅关注变量符号和单位使用不规范、图表和公式编排不合理等,而针对论文关键词等能体现文章亮点的内容就抱着无所谓的态度,虽然也是为他人做嫁衣裳,但难免有不够走心之嫌。例如,2015—2019年来源于学院学报的科技论文总数为180 674篇,其中10个无效关键词的累计词频为14.80%;而来源于大学学报的科技论文总数为322 564篇,其中10个无效关键词的累计词频为3.26%(2),前者累计词频约为后者的4.5倍,可见学院学报的编校群体对关键词的标引质量控制严格程度比大学学报编校群体的低。同时,高等院校教师忙于申请项目、开公司,疏于指导学生进行学术研究及写作的现象依然存在,论文作者因学术不端而被撤稿或是撤销学位的报道也屡见不鲜,可见高等院校中部分导师和同行评议人员对学生学术论文的主体内容审读尚不够仔细,遑论论文中的关键词了。例如,2015—2019博士论文总数为116 093篇,其中10个无效关键词的累计词频为8.78‰;硕士论文总数为1 016 061篇,其中10个无效关键词的累计词频为39.84‰,后者约为前者的4.5(3),可见硕士论文的审读群体对关键词的标引质量控制严格程度比博士论文审读群体的低。

4.2无效关键词的应对措施

我们认为降低科技论文中的无效关键词出现频率的措施主要包括以下几个方面。

一是进一步加强对科技论文作者的指导与培训。这就要求高等院校、各科技期刊编辑部以及其他企事业单位形成合力,建立合理的培训机制,定期开设写作课程或开展写作培训,对作者进行系统而全面的科技论文写作训练,使其加深对论文结构、论文要素、论文写作标准及规范的认识,提高综合写作能力,减少论文无效关键词的选取。例如,吉林大学《中国兽医学报》编辑部针对科技论文写作者开展移动课堂网络教学,取得了较好的效果。

二是科技论文作者应从思想上重视关键词对于文献检索的重要作用,同时在操作上严格执行关键词的编写规则。作者应充分认识到关键词是科技论文检索的信息点,是表达论文主要学术观点的关键性因素,在论文写作中应避免使用无效关键词。CY/T 173—2019规定:关键词编写一般包括论文审读、主题分析、选词和编排;关键词应准确并充分揭示论文主题内容,重要的可检索内容不应遗漏。科技论文作者根据编写规则选取适宜的关键词后,还应以读者的身份进行反推:要检索这一研究领域的科技论文,是否会选择这样的关键词?合理、科学地标引关键词有助于提升文献利用率。

三是论文审读编校群体需对无效关键词进行严格把关。关键词能够反映期刊研究热点和发展方向,关系着期刊的学术质量。论文审读编校群体应重视关键词的标引工作,选取合适的关键词有利于学术文献的有效传播和充分利用,从而有助于提高论文和期刊的学术影响力。例如,已成功入选中国科技期刊卓越行动计划梯队期刊的《中南大学学报(自然科学版)》严把期刊学术质量关,2015—2019年共发表论文2 385篇,其中10个无效关键词的出现频率为0;而《湖南城市学院学报(自然科学版)》同期共发表论文933篇,其中10个无效关键词的检索记录为68条,累计词频达7.3%。可见,论文审读编校群体在关键词的标引质量控制过程中发挥着重要作用。

转自医刊界微信公众号,仅作学习交流,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com