投稿问答最小化  关闭

万维书刊APP下载

制度与个体感知因素对医学科研人员数据重用行为的影响研究

2024/1/27 10:19:42  阅读:30 发布者:

中华医学科研管理杂志 2023年·36卷·06

摘要

目的通过对医学科研人员数据重用行为的影响因素进行研究,有助于精准提出促进措施、规避风险,在政策层面为我国的开放科学工作提供决策支持。

方法基于制度理论和计划行为理论构建数据重用行为影响因素模型,提出6个关于医学科研数据重用行为影响因素的假设,通过问卷调查法收集到187份有效数据,采用结构方程模型检验研究假设。

结果当重用规则越具体完善,科研人员进行科学数据重用的意愿越强烈。研究氛围是影响数据重用行为的最重要的因素,而感知努力会对科研人员的数据重用行为产生消极的影响。

结论我们建议建立科学数据基础设施、完善数据共享平台的元数据方案、提升科研人员的数据素养。

开放科学的基础是科研数据的共享和重用,它直接影响到科研成果的共享、传播、复现和复用 [ 1 ]。科研数据共享是指在组织机构内部和机构之间科学数据传递和获取无障碍,它也是数据重用的前提条件之一。而科研数据重用是指科研人员利用公开的数据平台或其他研究者收集的数据(二手数据),开展新的科学研究,使科研数据得到更加全面的利用和增值,通过重用的方式对科研成果进行可重复性检验,提高了科研成果的可信度和公信力。

目前越来越多的研究人员发现科学数据的重用有着重要的价值,但是在对科研人员数据重用认知的调查方面,整体呈现出认可度较高但是实践水平较低的状况 [ 2 ],而且很高比例的科研人员更倾向于自己收集数据,而不是重用先前的研究数据 [ 3 ]。具体到理论层面,学者Scott [ 4 ]提出的制度理论认为个人的信念成为其行为的基础,受到个人所属的制度环境的影响。Lawrence[ 5 ]也认为个人在采取行动之前会解释哪些行为是合法的,而Icek Ajzen [ 6 ]提出的计划行为理论认为个体的态度、主观规范和感知到的行为控制,通过行为意图的中介影响个体的行为。行为意图的每一个决定因素都受到潜在信念的影响,如行为信念、规范信念和控制信念。因此制度因素和个体感知因素可用于研究科研工作者的数据重用行为。从学科层面来看,医学领域的数据基础设施完善,且已建成了临床试验数据、人口健康调查等公开数据仓库,具有较为成熟的科研数据重用流程和坚实重用基础,科研数据重用机制较为完善 [ 7 ]。因此,本研究结合数据重用概念提出的目的和意义,选取医学科研人员为研究对象,基于制度理论和计划行为理论构建理论模型,通过问卷调查的方式收集样本数据,对模型进行验证,得出医学科研人员数据重用行为影响因素,进一步提出推进我国科研数据重用的政策建议,以完善我国开放科学发展模式。

01

科研数据重用的现状与困境

02

模型建构与研究假设

基于制度理论,本研究选取了研究氛围、数据可获取性、数据质量作为制度因素。基于计划行为理论、本研究选取感知利益、感知风险和感知努力作为个体感知因素,将科研人员的数据重用行为作为因变量,最终形成本研究关于影响科研数据重用行为因素的理论模型( 1

2.1 制度因素

2.1.1 研究氛围

研究氛围是指科研人员们从研究开放和合作的角度对其所在学科的研究氛围的总结性评价。由于数据共享和重用增加了协作和跨学科研究 [ 12 ],拥有开放和协作的学科文化很可能会影响各个学科的数据重用实践。因此,本研究提出以下假设:

H1:一个开放、合作的研究氛围对科研人员重用别人数据的行为有积极的影响。

2.1.2 数据可获取性

数据仓库通过鼓励科研人员存放、管理并使他们的数据可供其他研究人员使用来促进数据重用。之前的研究证明了,数据仓库普遍增强了重用者对数据的信任 [ 13 ],从而促进了数据重用 [ 14 ]。因此,本研究提出以下假设:

H2:数据可获取性对科研人员数据重用行为有积极影响。

2.1.3 数据质量

数据质量是影响数据重用满意度的一个重要因素。Rolland[ 15 ]的研究表明,科研人员在开展科研活动时,较为关注数据集的结构,如果无益于构建自己的数据集或者不能正确解读和使用该数据集,那么在数据重用过程中会存在顾虑。Faniel[ 16 ]在数据重用满意度的调查中发现,科研人员倾向于采用数据纬度丰富、结构完整、获取和使用难度低的数据,且数据可信度和文档质量对于满意度有正反馈。因此,本研究提出以下假设:

H3:数据质量对科研人员数据重用行为有积极影响。

2.2 个体感知因素

2.2.1 感知利益

科学工作者逐渐认识到,利用已有数据进行再利用,不仅节约了时间,而且还能为科学研究提供新的思路。在评估整个数据重用过程的时候,科研人员将根据过去的数据重用经历和经验,来确定他们的感知利益,其中包括数据重用对于科研效率的提升、重用过程所耗费的精力等感知。感知效率越高、能量投入越少,科研人员的感知收益越大。因此,本研究提出以下假设:

H4:科研人员在数据重用中感知到的利益对重用别人数据的行为有积极的影响。

2.2.2 感知风险

感知风险指的是数据重用中可能涉及的任何潜在风险,包括因曲解他人的研究数据或者侵犯知识产权等问题造成的负面结果及主观感知。Laure发现,研究者们最关注的问题是,他们可能会对资料进行不当使用或曲解。如果这些资料被曲解了,那么会得出错误的结果,并最终威胁与数据相关的原始工作 [ 17 ]。数据重用所涉及到的感知上的担忧会使科研人员不愿重用其他科研人员的数据。因此,本研究提出以下假设:

H5:科研人员在数据重用中感知到的风险性重用别人数据的行为有消极的影响。

2.2.3 感知努力

感知努力是指科研人员为了满足当前研究需求,花费时间和精力获取数据、分析数据所感知到的难易程度 [ 18 ]。重用其他科研人员的数据可能需要投入大量的时间和精力来检索、理解和处理数据 [ 16 ]当科研人员用于搜集、识别、处理二手数据所耗费的时间精力成本远高于自己去收集、分析数据的成本时,数据重用会成为一种阻碍,即感知努力会阻碍科研人员重用其他科研人员的数据 [ 18 ]。因此,本研究提出以下假设:

H6:科研人员在数据重用中感知到的努力对重用别人数据的行为有消极的影响。

03

研究设计

3.1 问卷设计

本研究采用调查问卷的方式进行实证研究的数据采集,问卷包括三个部分共33个问题:第一部分调查科研人员是否有数据重用的经历或遇到过困难;第二部分调查科研人员的数据重用行为。问卷釆用5级李克特量表,从"完全不同意""非常同意"进行计分;第三部分调查科研人员的基本信息。

3.2 问卷发放情况

本研究的问卷以线上发放为主(网络问卷),以线下方式为辅(纸质问卷)(在线问卷内容见:https//www.wjx.cn/vm/PpUppe7.aspx#)。本研究的调查对象为来自北京、湖北地区高校以及附属医疗机构的医学科研人员。调研时间历时3个月,共回收问卷202份,其中有效问卷187份。

3.3 数据分析方法

问卷回收后,利用SPSS 27.0软件对问卷进行信度检验,采用Cronbach′α对收集到的数据进行信度检验,采用最大似然法进行模型拟合,主要是测试样本的可靠性。采用结构方程模型软件AMOS 23.0,对问卷的效度和模型假设进行检验,结构方程模型作为理论验证性模型。本研究中科研人员的数据重用行为结果变量,制度因素和个体感知因素为自变量。

04

研究结果

经过对回收问卷的数据统计,本文从样本特征、问卷信效度、结构方程模型等方面进行分析,主要结果如下。

4.1 描述性分析

调查样本的人口统计特征如 1 所示,在性别方面被调查者女性多于男性,分别占比65.78%34.22%,年龄主要集中在21~30岁之间,占61.50%,文化程度集中于硕士和博士(包括在读硕士生和在读博士生)。被调查者主要身份是在读学生(52.94%),其余调查对象的职称主要集中在中级和副高级,别占比14.44%13.90%,符合本研究对调查对象群体的限制,可以保证调查对象能够更好地理解研究的内容。78.61%的被调查者的专业背景主要集中在临床医学、公共卫生和预防、药学3个学科领域。有效样本来源于不同地区,使本研究的调研情况具有较好的代表性。

在开始调查科研数据重用影响因素之前,我们先对被调查者的数据重用经历进行调查:有148人有数据重用的经历,占总样本的79.15%。另有39人没有重用经历,主要原因集中在数据重用规则不清楚(58.97%)以及数据可获取性问题(51.28%)。曾经使用过的公开数据来源主要有网络文献数据库(50.27%),如专利和文献数据,以及政府机构公布的数据(48.66%),如卫生统计年鉴、传染病疫情数据等。在使用科研数据过程中遇到的障碍主要有数据缺失不完整(68.45%)、数据不连续(58.29%)和字段定义模糊(55.61%)。通过了解被调查者的科研数据重用经历,为接下来的调查打下了良好的基础。

4.2 信度与效度分析

在数据重用行为影响因素理论模型( 1 )中共有7个变量,细分为25个观测变量,从 表2 可以看出,模型整体Cronbach′α值为0.84,信度较好。潜在变量的组合信度(CR)和平均变异量抽取值(AVE)可作为检验潜变量的收敛效度指标,本研究中CR0.85AVE0.63,说明模型的效度较好。另外, 表2 中因子载荷代表了潜变量对观测变量的解释程度,因子载荷越大,说明关系越密切,即观察变量对潜变量的解释程度越强。在本研究中,我们认为大于0.3的因子载荷是合适的。

4.3 结构方程模型分析

基于模型具有良好的信效度和适配度,使用AMOS结构方程的路径分析进行假设的验证分析,检验研究假设是否成立( 3 )

可见,除H2H3H5P>0.05,假设不成立外,其余的H1H4H6三个假设均成立,即研究氛围、感知利益对对科研人员重用别人数据的行为有积极的影响,而感知努力对重用别人数据的行为有消极的影响。最终模型及变量间相互影响关系的路径系数如 图2 所示。标准化路径系数(Stamdardized regression weights)表示变量之间作用关系维度,大于0则说明呈正相关,值越大则关联关系越强。除了考虑路径系数,我们还会检验 P值是否显著。

05

讨论

规范、成熟、完整的重用规则更有利于科研人员开展数据重用活动。完善的数据重用规则能够增强科研人员进行数据重用的意愿。因此,政策规则越健全、科研人员进行科学数据重用的满意度更高 [ 19 ]。研究发现,研究氛围是影响数据重用行为的最重要的因素。这一发现与Kim等学者 [ 20 ]的结果不一致,我们在问卷中问到"您所从事的领域或学科中,数据重用是一个常见的做法?我的同行或老师鼓励我进行数据重用?我所在的研究机构有支持开展数据重用的资源?"造成这一结果可能的原因是在生物医学领域,重用科研数据是一个常见的研究方法,由于敏感数据获取的困难,寻找开放数据(统计年鉴、基因数据、蛋白质数据等)开展科学研究成为主要途径之一。本研究没有发现数据获取性和数据质量与科研人员重用数据的行为存在任何显著的关系,也许是因为研究氛围对科研人员的影响更大,所调查的人群中大部分来自于在读研究生,本身所在的科研机构具有良好的电子资源建设环境,能够获取到很多非公开的数据资源,且质量较高、数据较完整。研究发现感知利益是影响数据重用意图的最重要因素,对于科研人员来说,数据的有用性很重要,如果他们发现数据满足他们的需求,他们愿意努力重用数据。因此这项研究证实,科研人员对数据有用性的认识可以促进数据重用行为。

研究还表明当收集二手数据开展科学研究时,如果在定位数据、获取数据集的使用许可、对数据集进行预处理等行为花费的时间和精力超过自己收集一手数据时,科研人员可能倾向于不重用他人的科研数据,因此感知努力会对科研人员的数据重用行为产生消极的影响。数据重用通常需要不同层次的人力资源来解决问题和技术支持来简化过程。提供这些资源和支持可以促进科研人员在重用数据方面的舒适感,并有助于最大限度地减少个人在数据重用方面的努力。

06

建议与启示

医学科研数据重用行为受到制度因素和个体感知因素的双重影响,本文根据问卷调查和结构方程模型分析结果,并立足于我国科研数据管理发展现状,从3个方面提出建议。

6.1 建立有利于共享与重用的科学数据基础设施

FAIR的实现依赖于数据的长期、稳定、安全地存储,以及数据的识别和可定位、可访问、可互操作等基础设施。另外,科学数据基础结构不仅包括数据仓库平台,还必须为出版物制订数字目标识别码 [ 21 ],以及为其他种类目标(生物试剂、医疗器械等)制订永久识别码,以便更好地支持执行FAIR原则;为实现多个数据源的融合,建立专门的领域知识图谱。

6.2 完善数据共享平台的元数据方案

数据库和数据共享平台是保存数据的重要载体。研究发现,感知努力负向影响数据重用行为,因此,可以通过完善数据共享平台的元数据方案,这将有助于提高科研人员对数据重用的信任程度,降低重用难度。

相对主观的体验,如数据共享平台的功能是否完备,数据获取过程是否方便,也会影响研究人员的感知努力,进而影响研究人员的满意度。功能完备的数据共享平台,能够便于科研人员快速、便捷地获取数据,即降低其数据重用的感知努力,显著提高了科研人员对数据重用体验的满意度。对数据共享平台进行优化,一方面可以保证多源数据类型可供用户选择,例如政府出版的数据经常被科研人员使用,还应保障数字资源的时效性,以提供最新的科研资讯促进科研人员创新;另一方面,在UI界面操作方面,应当操作便捷、简洁,降低科研人员的感知努力程度,提高获取信息的效率。例如在数据检索方面,提供多角度、高级检索方式,甚至融入AI技术自动构建检索策略,优化科研人员采集、整理数据的流程,促进数据重用。

6.3 提升科研人员的数据素养

研究发现,数据重用氛围对数据重用行为具有明显的正向影响。因此完善的数据素养教育培训内容具有重要的意义价值,应该着重培养科研人员的数据使用意识、数据获取能力、数据评估能力、数据处理能力、数据移植能力、数据可视化能力等 [ 22 ]。除此之外,学术图书馆还应帮助未来的科研人员,了解科研数据重用的益处,并提供相关的技能培训,比如可以开展小组培训、举办相关的讲座以及研讨会等,为科研团队营造出一种整体的科研数据重用氛围和认同感。协助所在单位的研究人员或团队,为学科数据管理提供数据管理服务;通过建立"数据馆员"岗位,更多地关注在开放科研数据环境中的各类科研数据管理,尤其是数据质量控制。鼓励科研人员在特定的数据知识库中存储非保密数据,提高已有数据的可发现性,从而进一步提高科研人员的学术视野,实现科研数据的二次利用。

07

结语

综上所述,如何实现数据的重用,将直接关系到我国的科研经费管理、科研项目管理以及实际应用的发展。当重用规则越具体完善,科研人员进行科学数据重用的意愿越强烈。研究氛围是影响数据重用行为的最重要的因素,而感知努力会对科研人员的数据重用行为产生消极的影响。我们建议建立科学数据基础设施、完善数据共享平台的元数据方案、提升科研人员的数据素养。

转自:“医学科研与管理空间”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com