投稿问答最小化  关闭

万维书刊APP下载

Nature Communications | 全球生物多样性信息偏差及影响因素

2024/1/17 17:15:25  阅读:41 发布者:

【摘要】关于物种分布的可获取数字信息 (DAI) 的偏差严重阻碍了生物多样性和生态系统功能保护以及解决核心生态和进化问题的发展。要实现生物多样性保护的国际目标,就必须确定信息空缺并优先采取行动。通过整合21170种陆生脊椎动物物种的1.57亿个点记录的分布图,本研究发现:除了少数采样完整的区域之外,大部分地区的物种分布点记录信息 (DAI) 都非常有限,而且在空间尺度上非常不平衡。令人惊讶的是,许多大的新兴经济体国家在全球DAI中的贡献度甚至低于物种丰富的热带发展中国家。多模型推断结果表明:多样性数据的完整性主要受限于研究区与研究人员的距离、当地可用的研究资金和参与数据共享网络的频率,而不是通常假设的交通基础设施或西方数据贡献者的数量及科研经费。本研究结果强调了整合非西方数据源和加强合作能够有效地满足社会生物多样性信息需求的迫切需要。

【引言】

《生物多样性公约》(Convention on Biological Diversity, CBD)的主要缔约方已就到2020年改善生物多样性状况的20个目标达成一致 (https://www.cbd.int/sp/targets/)——爱知目标 (Aichi Target)。爱知目标-19的具体要求是建立一个先进和共享的生物多样性知识数据库。物种分布信息是生物多样性知识的核心,有助于在快速变化的世界中有效管理生物多样性和相关生态系统功能。物种分布信息对于实现多个爱知目标以及最近启动的生物多样性和生态系统服务政府间科学政策平台  (the Intergovernmental science-policy Platform on Biodiversity and Ecosystem Services, IPBES) 的评估工作提供了至关重要的信息。整合物种分布数据的全球行动 [如全球生物多样性信息设施 (Global Biodiversity Information Facility, GBIF)] 为从各种数据源 (特别是博物馆标本和实地观测) 获取大量物种发生记录提供了平台。这些记录提供了关于物种何时何地出现的重要信息,并已经广泛用于生态学、进化和保护研究。与非数字化或不公开共享的专家知识或数据集相比,像GBIF这样的数字化可访问信息(Digital Accessible Information, DAI/DAK) 能够被更多用户访问并使用。尽管最近的一项研究发现GBIF-facilitated DAI的数据量正在日益增加,但仍存在不明确的“taxonomic coveragerecord completenessgeographic biases”,即物种覆盖度、记录完整性和地理偏倚性问题。

DAI往往存在严重的空白和偏倚性,在生态建模和保护研究中需要谨慎考虑这些问题。这些数据缺陷可能是由实地观测、博物馆标本数字化或生物多样性数据共享网络的数据采集和汇总方式局限造成的。对于生物多样性数据偏倚性的社会经济和地理驱动因素可能包括:财政资金和资源不足 (inadequate financial and institutional resources)、国际科学合作不佳(poor international scientific cooperation)、缺乏获取渠道或区域安全问题 (lack of access or regional safety concerns),或者侧重于具有一定吸引力的地区 (focus on regions with certain appeal),如特有种集中区、物种丰富地区或自然保护区 (endemism-, species-rich or protected areas)。识别造成多样性信息偏差和阻碍信息传播的因素被认为是《生物多样性公约》政治和科学层面的优先事项。到目前为止,全球DAI偏差的大小和空间位置以及影响因素的普遍性和相对重要性仍然不清楚,进而严重阻碍了未来数据采集和整合工作的优先次序。此外,整合生物多样性信息的全球行动在改善和分享生物多样性知识方面的贡献和有效性仍然没有得到评估。

本文对GBIF21170种鸟类、哺乳动物和两栖动物的1.57亿个地理和物种的分布点记录进行了评估,这些数据来源于160个数据出版商 (包括开展分类学和地理学研究的小型机构、国际活跃的博物馆和公众科学计划)。本研究确定了当期影响全球DAI生物多样性数据完整性 (biodiversity inventory completeness) 的因素,并确定了促进多样性数据完整性发展的优先区域和活动。本研究发现:生物多样性数据缺口主要存在于大的新兴经济体,DAI主要受限于研究区与数据贡献者的距离 (distance to data contributors)、当地可获得的研究资金 (locally available research funding) 和数据共享的政策背景 (political commitment to data sharing)。为了有效地推进全球DAI,应优先努力促进全球数据共享网络发展和整合非西方数据源。

Fig.1 Global unevenness and gaps in the DAI on distributions of 21,170 species of terrestrial vertebrates (birds, mammals and amphibians).

【研究结果与讨论】

【全球DAI中物种分布数据的格局】在110公里网格大小下,全球陆生脊椎动物记录的数据密度差异达到了5个数量级 (Fig.1a),在欧洲、北美、中美洲和澳大利亚的部分地区达到峰值。相反,48%的亚洲、35%的非洲和21%的南美洲网格中没有脊椎动物分布记录。在110公里的空间尺度上,从点记录得到的物种丰富度与预期的丰富度 (基于物种分布范围地区得到的多样性图) 不一致 (Fig.1b, c),尽管它们之间的空间模式呈现出弱关联,但在所有12029个网格单元格中,只有4.2%的网格单元的数据完整性达到了80%以上 (Fig.1d)

完整性 (Completeness) 的定义为数据点记录的丰富度占预期丰富度的百分比,在一定程度上可以用记录密度来预测。然而,尽管在新北极和澳大利亚 (Nearctic and Australasia) 的大部分地区,高记录密度会产生高完整性,但在物种更丰富的新热带和非洲热带 (Neo- and Afrotropics) 地区,高数据密度并不意味着高完整性 (Fig.1abdeFig.S1D),即完整性同时受记录密度和当地物种丰富度的影响。东古北界和印多马拉雅界 (Eastern Palaearctic and Indomalayan realms) 的完整性特别低。全球主要生物地理区内的生物群系的平均完整性也有很大差异 (Fig. 1e)。具体来说:热带和亚热带森林 (tropical and subtropical forests)、草原和稀树草原 (grasslands and savannas)、以及北方森林和冻土带生物群落 (boreal forests and tundra biomes) 的生物分布记录仍然严重不足。令人惊讶的是,本文没有检测出明显的“热带数据偏差 (tropical data gap)(热带地区的平均完整性与其他非热带地区对比,max-t test, PDut = 0.27, N = 4717/7286)。相反,亚洲 (包括温带地区)、非洲北部和巴西的大部分地区都出现了严重的数据空缺 (这些地区的平均完整性与其他地区对比,max-t test, PDut<0.01, N = 6089/5914)

Fig.S1 Relationships between record density and inventory completeness in global digital accessible informationfor three vertebrate groups at the 110 km grain. A) Record density, B) Inventory Completeness, C) Scatter plots of relation between inventory completeness and record density with deviance explained (d²) based non non-zero grid cells, D) Spatial arrangement of residuals of a binomial generalized linear model (logit link) explaining inventory completeness with record density.

尽管在三个脊椎动物类群之间数据完整性的地理分布存在广泛的重叠(Fig.2a),但它们的完整性格局之间仅呈现中等强度的正相关(rs = 0.65-0.74max-t test, PDut<0.001, N = 323-11522),该结果表明单个类群的完整性格局不能很好地用于预测其他未评估的生物类群,并强调了区分不同生物类群信息偏差特异性的必要性。与鸟类相比,哺乳动物和两栖动物的记录要少得多 (~335万和~130万与~1.52亿相比),哺乳动物和两栖动物的记录完完整性水平也明显更低 (Tukeys testPDut<0.001, N = 280-11757)。即使在110 km的网格尺度上,也仅有鸟类的数据记录完整性超过了80%,而且仅存在于北美、欧洲和澳大利亚。将空间网格进一步粗化到440880公里时,鸟类相、哺乳动物和两栖动物的完整性都大大增加了,但必然也会导致推理和应用的范围缩小。太粗泛的空间尺度不足以解决生态学中的大多数问题,而且由于土地利用和保护行动通常设定在公里级或更小的尺度上,因此太粗的空间尺度不适合进行有效的资源管理。大多数物种分布模型 (SDMs) 将记录与小尺度的环境数据连接起来进行外推,由于它们对环境偏差的敏感性,因此无法提供一般性的补救措施。在大范围内普遍存在的数据空缺 (如在880公里的空间尺度上,亚洲大部分区域的完整性只有20%Fig.2a),该结果表明:对于许多具有高保护价值的地区仍然没有足够多的物种现存数据。大多数物种的全球采样点数量远低于SDM最低要求的50-100个。

Fig.2 Spatial variation in point record-based inventory completeness for three vertebrate taxa at different spatial grains.

【有效解决信息空缺】这些普遍存在的数据空缺现象突显了识别并解决导致数据完整性低的根本原因的必要性。了解数据偏倚性的关键驱动因素对于确定数据采集和整合工作的优先次序非常重要。此外,数据偏倚性的驱动因素可以明确地纳入生物多样性模型。为此,本文检验了12个假设,分为5大类:吸引力 (appeal)、可及度 (accessibility,)、安全性 (security)、科学整合全球化 (international scientific integration)、财政和机构资源 (financial and institutional resources) (Fig.3Fig.S3-6)。大多数假设在本研究的多模型推理框架 (multi-model inference framework) 中都得到了部分支持,表明了地理和社会经济因素对数据完整性的复杂相互作用 (Fig.3Fig.S5)。根据生物类群和空间尺度的不同,数据完整性的最小充分统计量模型 (minimum adequate model, MAM) 解释了60%-78%的变异,不同生物类群之间因子的相对重要性比空间尺度之间的差异更大 (取决于预测因子,方差分析中“taxon”之间因子的解释率“spatial grain”高16.5%-72.5%)

Fig.S2 Spatial variation in record-based inventory completeness for three vertebrate taxa at four spatial grains.

Fig.S3 Maps of predictor variables used to model point record density and inventory completeness (110 km grain).

Fig.S4 Grid cells selected for models of point record density and inventory completeness.

数据收集过程的驱动因素被归因于区域或物种的“吸引力 (appeal)”,如研究人员更偏爱保护区、山地或其他物种多样性高、稀有种和分布范围受限物种多的地区。在鸟类和哺乳动物中,特有物种丰富度对区域数据完整性有强烈的正向影响,而保护区面积的影响较弱。令人惊讶的是,本研究发现从城市附近到机场的可及度 (on-ground accessibility) 的重要性相对较低 (Fig.3),以往通常认为可及度会强烈地影响数据采集。相比之下,到数据提供机构的空间距离 (spatial distance to data-contributing institutions) 一直是数据完整性和数据密度的关键预测因素 (Fig.3Fig.S5),表明维持野外采样和标本运输的交通成本或代价对全球生物多样性信息的地理偏倚性有显著影响。不安全性 (Insecure conditions) 可能会阻碍野外数据采集,但本研究几乎没有发现安全性 (security) 在影响数据完整性或记录密度方面很重要 (Fig.3Fig.S5)。本研究假设融入科学活动指数 (即国家在生态学中的H-指数乘以国际合作水平) 与数据完整性密切相关,因为它应该反映研究成果公开的可能性。然而,融入科学活动指数并不是解释数据完整性或记录密度的重要因子 (Fig.3Fig.S5)。相反,GBIF的参与一直是决定DAI数据完整性的重要因素。此外,国家研究经费 (研发总支出 gross expenditure on research and development) 与完整性呈强正相关 (Fig.3),与先前的观点一致。然而,令人惊讶的是,数据出版机构所在国家的研究经费并不影响本地区生物多样性数据的完整性。最后,出版商规模 (publisher size,根据数据量贡献估计) 只能微弱地解释哺乳动物和两栖动物的数据完整性,但它对鸟类的影响要大得多,其中最大的数据贡献者不是博物馆,而是公众科学观察 (citizen-science observations) 的汇总平台 (Avian Knowledge NetworkINaturalist),表明公众科学能为提高DAI的数据完整性提供潜力,而不仅仅是依赖基于国际研究机构。

Fig.S5 Determinants of point record density and inventory completeness.

大多数完整性的限制因素主要是影响了现有数据的数字化,而不是该领域新记录的野外采集。虽然充足的研究资金对于产生大量的生物多样性DAI是至关重要的,但本研究结果表明:研究资金的增加通常会产生更多的研究论文,而并没有直接提高当地缩小DAI数据偏差的能力,因为这些资金并没有直接用到科研数据的整合和共享方面 (Fig.3:‘Scientific activitiesversus GBIF participation)。一个可能的原因是当前的数据存档政策和学术奖励制度不支持数据共享活动。这个结果说明:仅靠最大或资金最充足的博物馆无法保证遥远地区的数据完整性,除非数据整合和共享活动得到当地有利条件的支持,如当地可获得的研究资金、当地研究机构的共同协作以及国家对数据共享的政策支持。因此,缩小DAI数据偏差的最有效战略可能是直接支持已确定存在数据偏差地区附近机构的工作,并确保其支持参与国际数据共享方案。发达国家 (通常是多样性较低的国家) 数据整合和共享的专用资金和专业人员可以更好地用于支持因缺乏专门知识或网络基础设施而落后的国家的努力,如通过建立直接伙伴关系或建设援助。

Fig.3 Determinants of inventory completeness in DAI on species distributions.

整合更多数据来提高完整性是非常有必要的:本文的最最小充分统计量模型 (minimum adequate model, MAM) 解释的69%-95%完整性偏差也可以用数据记录密度的差异来解释。然而,本文发现数据整合和共享的有效性仍有很大的提升空间:如果代表三个脊椎动物类群每个物种在每110公里的网格范围内出现一次,要实现该空间尺度下全球100%的数据完整性就需要370万条理想的采样记录。目前在1.57亿条数据记录中,370万个物种-网格组合内只有21.6%的有效记录得到了验证,这表明少数区域存在着大量的信息冗余 (Fig.4)。这种密集的且局部的采样和数据收集可能有利于当地的保护工作以及科学工作,但肯定不利于全球尺度的数据需求。而且,在最需要高分辨率数据集以支持实现多个爱知目标 (Aichi Targets) 的地区,DAI的数据偏差尤其严重。有针对性地整合可能包含缺失物种-网格组合的数据源,可以有效且迅速地缩小全球DAI中的数据偏差和地理偏倚性。进一步看,这将有助于从SDM或尺度缩小 (downscaling approaches) 方法中建立稳健的小尺度物种分布模型,以获得比以前更大、在地理上更具代表性的物种样本,进而有力地支持各种爱知目标 (Aichi Targets),如为尽量减少生物多样性损失而进行土地利用规划 (Target 7),为保护区创建物种清单并改善全球保护区网络 (Target 11),保护受威胁物种(Target 12),绘制地图并保护相关生态系统服务 (Target 14)

Fig.4 Redundancy of information in 157 M globally mobilized point records that constitute DAI on species distributions.

减小DAI数据偏差的直接渠道在国家层面上最为明显:本研究发现在控制了所有因素的影响 (解释了92.1%-97.2%的跨国差异) 之后,国家属性仍然解释了数据完整性变异的一大部分 (D22.4%~7.1%),表明国家的政治、法律、历史、语言或文化因素的重要作用。如果全球各国都同样致力于提供获取其生物多样性信息,正如《生物多样性公约》签署国所同意的那样,数据完整性应该主要受可用财政资源的限制。然而,国家层面的数据完整性与人均国内生产总值 (per capita gross domestic product) (r2 = 0.34, P<0.001Fig.5a, b)或总保护支出 (r2 = 0.16P<0.001)的相关性并不高。值得注意的是,包括巴西、中国、印度、印度尼西亚、俄罗斯或土耳其在内的几个大的新兴经济体国家的生物多样性数据完整性明显低于全球平均水平 (Fig.5bc),考虑到全球和国内消费不断增长对其生物多样性造成的压力越来越大,这种现状 (新兴经济体对生物多样性数据共享不积极) 是令人担忧的。能否成功地为全球生物多样性保护建立充分的信息基础,从而为环境可持续性制定全球政策,将取决于全球大的新兴经济体国家的支持,并可能主要取决于政治因素而不是经济因素。例如,虽然墨西哥的生物多样性巨大而需要大量人力和物力,但由于其早期对建立国家生物多样性方案的政治支持,墨西哥在生物多样性信息学方面发挥了主导作用。巴西、中国和俄罗斯等经济强国的数据庞大的机构合计占缺失的物种-网格组合的31% (Fig.5c),这些数据共享后能为全球可获取的物种分布信息做出重大贡献。

随着巴西等国最近宣布将放宽生物多样性研究限制,并且将改善和开放其数据存储,巴西国家项目 (speciesLink: http://splink.cria.org.br) 将越来越多地纳入全球DAI。此外,能够实现持续重新评估的工具(http://patterns.mol.org/completeness) 可以帮助研究人员评估或解释数据偏差,并监测数据共享的进展。跨生物类群的全球评估是更有效地理解和缩小物种分布信息的偏差所需的众多步骤中的第一步。虽然陆生脊椎动物只占已描述物种的1.6%,但解决在脊椎动物中出现的重要因素可能是弥合生物多样性数据偏差的最大希望。至关重要的是,本研究的结果对生物类群的依赖性很强,需要将物种分布信息的评估扩展到多样性更丰富的生物类群,如鱼类、植物和无脊椎动物。比较已共享的记录量和已描述物种数量之间的比率表明:在这些群体间的DAI差距可能要严重1~3个数量级 [每个物种的平均记录:四足动物 (31032)6909;鱼类(31658)347种;维管植物 (283701)317种;无脊椎动物 (138万种)31种;参考20146GBIF网站的物种数量)

Fig.5 Gaps in DAI on species distributions at the country level.

如此严重且广泛的数据偏差需要更全面的解决方案。本研究的评估强调了提高基于机构的数据整合和共享效率的潜在途径,但也指出了这条途径的局限性。来自生物收集的点记录只是众多数据来源的一种,有针对性地调动其他方式来满足生物多样性信息需求。由训练有素的野外生物学家领导的、彻底的生物多样性清查将继续在为未调查的生物多样性地区生成第一手数据方面发挥重要作用。此外,诸如公众科学项目 (citizen science

projects) 之类的新方法已经以相对较低的成本为某些生物类群提供了越来越多有价值的记录。新的奖励制度 (Improved reward systems)、数据发布机制 (new data publishing mechanisms) 和期刊要求 (journal requirements) 可以激励科学家和项目团队共享生物多样性数据。非政府保护组织或政府组织所掌握的生物多样性信息可通过鼓励机制 (supportive mechanisms) 加以利用,如各国家承诺的进展 (Target 19)  进行更强有力的评价和归属,以及采用更广泛的方式处理敏感信息 (如受威胁物种)

更好地利用现有的信息是降低数据偏差的另一条途径。新的贝叶斯建模方法 (Bayesian modelling approaches) 可以解决经典SDM的局限性,如通过跨空间尺度连接不同的数据类型或通过明确建模引起偏差的过程。以地理区域或特定生物类群为重点的数据平台[eBird或澳大利亚生物地图集 (Atlas of Living australia)]提供了一条将丰富的数据与模型结合使用的渠道。新的生物多样性信息基础设施 (Map of Life) 也是一条整合不同数据源的方案,并通过最合适的建模工具将这些信息与环境信息联系起来,以解决全球物种分布及其变化问题。

生物多样性的迅速丧失 (Rapid biodiversity loss)、有限的资金 (limited funding) 以及与直接保护投资的潜在权衡需要我们优先考虑将未来收集和整合生物多样性记录存放到DAI中。有针对性地整合现有信息和评估数据偏差以及持续评估DAI满足保护需求的有效性,与政治利益攸关方、机构和科学家加强对生物多样性数据共享的承诺是同等重要的。随着实现《生物多样性公约》爱知目标的时间越来越少,迫切需要制定并实施更有效的数据使用、整合及共享的全球方案。

【参考文献】

Meyer, C., H. Kreft, R. Guralnick, and W. Jetz. 2015. Global priorities for an effective information basis of biodiversity distributions. Nature Communications 6:8221.

转自:“生态科研笔记”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com