投稿问答最小化  关闭

万维书刊APP下载

TOP期刊新观点!没有最好的模型,通过多模式集合解决土地利用情景建模的局限性

2023/9/26 10:10:22  阅读:38 发布者:

01

文章导读

人们对人类社会对生物圈影响的广泛关注,让空间明确的土地利用模型被广泛用于预测和理解未来的土地利用变化。在这些模型中,已知影响土地利用动态的解释因素或变量(模型驱动因素)用于计算过渡潜力图,而该图确定模拟了每个时间步长内土地利用的空间分配。研究发现对于模型驱动因素,其问题不在于这些因素是否是重要的驱动因素,而在于它们在特定地理区域的影响程度。因此,本文在SIMLANDER建模框架的基础上,对模型驱动因素和其他相关考虑因素进行讨论,获取选择模型组成部分的影响,为土地利用建模提供一些有用的指导方针。

02

文章摘要

元胞自动机模型是探索未来土地变化路径的流行工具,但大多模拟建模的方法往往过于狭隘地关注与历史参考图的校准,从而限制了可能结果的多样性。与人们普遍认为的观点相反,研究者认为没有“最佳模型”,因为其模型规范和校准精度取决于研究目标。所以本文提出了一种多模型集成方法,其中主要是针对多个度量对广泛的模型和校准规则集进行系统测试。基于西班牙的一个案例研究发现没有一个模型在所有统计数据中都表现良好,这说明了为了获得最佳性能而挑选统计数据的危险。因而本文的案例研究在模型设计中考虑了历史土地变化,它有助于模拟紧凑型城市发展,但限制了模拟结果的可变性。另外,无障碍模型驱动因素不但改善了城市模式的复制,而且无障碍的适用性也有助于模拟侵占自然区域的低密度开发。因此,与其放弃基于少量指标与参考图一致性较低的校准,该研究人员认为还应该努力了解每个指标的具体意义,并利用这些信息丰富模拟结果的多样性。

03

方法

3.1. 八种模型

1)简约模型

2)可访问性模型

3)适宜性模型

4)典型模型

5)路径依赖模型

6)动态路径相关模型

7)组合模型

8)动态组合模型

为了演示本文提出的多模型集成方法,研究使用了Roodposhti等人描述的自动校准程序,在IML ANDER R环境的建模框架的基础上,将构建的不同模型(1)分为六组或块:邻域动态(N),可达性(A),适宜性(S),随机性(v),历史土地利用动态(L)和惯性(I)。本研究主要使用了1956年、1977年、1999年和2007年的四张土地利用地图(1,图1)。历史土地利用动态(L)包含在四个模型的过渡势计算中,是通过1956年、1977年和1999年的土地利用地图通过计算获得的。通过使用相同的1999个规则集(2007个模拟结果)模拟每个模型在50-400年期间的土地利用变化,并将其与2007年的土地利用参考地图进行比较,评估了八个模型之间的差异。为了确保模型之间的差异不是由于随机性引起的,所以对所有模型运行时,使用 set.seed 函数保持随机参数v不变。由于本研究的目的是比较相同分配土地变化量的不同模型,因此根据历史线性增长趋势计算要模拟的土地利用变化量,称为土地利用需求。

1. 1956年以来研究区域主要城市的城市增长(阴影边界表示城市增长的限制区域)

1. LUC 驱动程序、说明、单位和数据源

04

结果

该研究将根据基准测试讨论每个模型的性能,并参考图2-5与其他模型进行比较,所遵循的实验程序允许充分理解元胞自动机生成的选项的全部多样性。

4.1  一般观察

首先,可以看出,在任何模型(PDMDPDMCMDCM)中包括路径依赖性都会显著降低其可变性,如这些模型的四分位距比其他模型窄得多(23)。其次,类级统计数据(2(B.1-B.5))突出了模拟和参考地图之间的一些重要差异,尽管没有一个模型在所有统计数据中表现良好。例如,一些模型接近参考数据集的边缘密度、团块度和总核心面积(尤其是后者)。然而,对于质量分形维数和斑块密度,几乎所有模拟的匹配都差得多。补丁级别的统计数据(3)讲述了一个类似的故事,一些模型的仿真结果能够近似核心单元数、形状、分形维数和核心面积的参考数据集,但不能近似周长和周长面积比。这一发现警告了挑选统计数据时,获得最佳性能的危险。

2. 所有型号的校准结果;逐个单元格统计(A)和类级模式指标(B.1B.5)。对于类级模式指标,水平线表示参考地图(2007 年土地利用)中每个统计数据获得的分数

3. 所有型号的校准结果;补丁级模式指标(AF)。水平线表示参考地图中每个统计数据(2007 年土地利用)获得的分数

4.2  模型间比较

模型之间存在重要差异。首先,进行逐个单元一致性统计,命中率显示如(2A),路径依赖模型(PDMDPDM)在没有包含其他参数的情况下实现了最高命中率,并且当包含其他参数(CMDCM)时,命中率降低。从这个意义上说,只要模型保持简单,在模型中包括历史土地变化区域是有效的(RQ2)。动态路径相关模型(DPDM)结果表明,包括反馈环路来考虑模型运行时更改的土地面积会进一步提高命中率。将路径相关模型与其他参数(CMDCM)相结合可降低命中率,但在这两种情况下,大多数结果都显示命中率高于典型(TM)和适宜性模型 (SM)变体。与其他路径相关模型相比,动态组合模型(DCM)的命中率统计量的表现更差。在少数情况下,简约模型(PM)和可访问性模型(AM)确实实现了与路径相关模型相当的命中率(2A)

对于模式指标而言,产生最高命中率的简单路径相关模型(PDMDPDM)在类级别和补丁级别指标上的性能最差,非动态路径相关模型(PDM)的性能仅略好于动态路径相关模型 (DPDM)。所有其他模型(TMPMAMSMCMDCM)产生的模拟可以更有效地复制模式。组合模型(CMDCM)在团块性、边缘密度和斑块密度(类水平)和形状(斑块水平)方面总体上优于其他模型,但在核心统计(类水平的总核心面积和补丁水平的核心单元数量和核心面积)和分形维数(斑块水平)方面表现较差。TMPMAM在此统计数据中表现最佳。

4 根据类级统计量(丛块性(4A)和补丁级别统计量(分形维度)(4B)绘制命中率,非常有效地显示了命中率和模式指标之间的关系。随着模式变得不那么聚合(较低的团块性)并趋向于更复杂的几何形式(更高的分形维数),模型相对于未命中次数(较低的命中率)也得分更少。这证明了模式和预测准确性之间的明显权衡。因此,在预测准确性方面,由命中率衡量的最高评分规则集是聚合最多的(最高的团块度),并且具有最小的分形复杂度(最低的分形维数)。对于组合模型(CMDCM),结果聚集在三个明确定义的块中(4,编号为1-3),显然表明两个关键的过渡阈值或临界点,与复杂性相关的行为。在TMAM图中也有一些证据表明这种行为。详细探索这种行为是未来工作的优先事项。

4. 散点图显示所有模型的所有校准结果;A:命中率(x)与团块(y);B:命中率(x)与分形维数(y)。水平线表示在y轴上给定的测量值的参考地图获得的分数。数字1-3表示组合模型和动态组合模型的关键转换。

4证实了这样的结果,即在路径相关模型(PDMDPDM)之后,简约模型(PM)为命中率统计提供了整体最佳性能。因此,简约模型回答了该研究的第二个研究问题(城市土地变化模型可以有多简约,其关键的基本要素是什么?),提醒研究者尽管经过三十年的演变,怀特和恩格伦提出的简单模型与本文的简约模型非常相似,是一个优秀且有用的模型,在添加其他元素(如可访问性、适宜性或分区)之前应始终考虑它。正如预期的那样,由于唯一的驱动因素是像元邻域(N)、现有城市土地利用(I)和随机因子(v)。因此,正如校准结果的高度可变性所显示的那样,该模型对各种校准运行产生的邻域规则变化都非常敏感。这种可变性是很有用的,两个图的斜率都非常陡峭,表明非常复杂的对象(分形维数指数>1.5),具有高度的像元散射(团块性<0.6),让人联想到非常分散、低密度的土地利用模式,可以使用 PM获得,而不会显著降低命中率。一小群规则集的命中率约为73%,与参考地图的聚合模式非常匹配。添加可访问性和适宜性参数(AMSM)会降低预测精度,但会给出一组结果,这些结果精确复制了参考地图的分形维数。事实上,这个集群在团块性方面表现不佳(PM 为此指标提供了更紧密的匹配),这表明团块度和分形维度指标虽然相似,但并不完全可以互换。分形维数作为形状复杂性的指标,是面体级别更敏感的线性指标。因此,与团块统计量相比,分形维数是可访问性参数影响的更好度量。

4.3  分区

分区测试的结果如图5所示。首先,应该指出的是,分区图记录的分区边界并不表示绝对排除所有城市发展;如图5中的x截距所示,通过2007年参考地图在分区区域内记录了1105个城市土地单元。其次,由图5可知,在模型(PDMDPDMCM DCM)中引入路径依赖性可能有助于排除分区区域而无需分区图的假设大致正确。这些模型产生的更保守和紧凑的新土地分配意味着很少有细胞侵占现有建成土地以外的区域。对于其他模型(TMPMAMSM),就存在相当大的差异,实际上比前面的图中显示的差异更大。包括无障碍设施的模型(TMAMCMDCM)与未包括无障碍区域的模型相比,与一般分区区域的重叠程度较低。PM包括约20个模拟,其中超过6000个城市土地单元落入分区区域,在SM的情况下,大多数模拟在分区区域中有超过6000个城市土地单元。可能的解释是,分区区域大多远离交通网络,因此包含可访问性参数的模拟比不包含可访问性参数的模拟更有可能避开它们。这些结果突出了SM与其他模型之间的主要差异,这些差异在前面的图表中无法理解(234)。显然,在该模型中以地形坡度表示的物理适宜性是在运输网络未来配置未知的情况下模拟非常分散的开发对自然保护区的影响的有用工具。从分区比较练习可以得出,虽然路径相关模型可靠地避开分区区域,但包含可访问性参数(TCAAMCMDCM)的模型也非常有效。不包括路径依赖性或可访问性(PMSM)的模型则要少得多。

5. 散点图显示所有模型的所有校准结果;A:分区交叉点计数(x)与团块(y);B:分区交叉点计数(x)与分形维数(y)。水平线和垂直线表示在x轴和y轴上给出的测量值的参考地图获得的分数。

4.4  选择模型集合

对上述多模式校准集合的系统探索允许开发一系列充分利用不同样本群体的土地利用模拟方案,而不是从单一模型中选择单一校准结果的通常方法,从而严格限制未来的模拟。表2显示了不同模型和规则集的选择,这些模型和规则集是通过研究前几节中描述的结果分布(2345)将校准结果与所选的特定指标进行排名而获得的。如果特定模型针对多个指标表现良好,则使用排名程序来选择规则集,使用相关指标的几何平均值来确保每个指标的权重相等。如果目的是包括融合分布的尾部,则无需使用排名程序只需要从融合中选择最高或最低值。图6-14显示了表2。图15提供了一个决策流程图,可帮助读者根据本文提供的建议选择模型。

6. 场景 1aDPDM,最高人力资源

7. 场景 1b_1、上午、最高心率、最高 CL

8. 场景 2aPM,最低团块,最高分形维数

9. 场景 2bAM,最低团块,最高分形维数

10. 方案3a_1 AM,最适合总核心区域

11. 方案 3a_3DCM,最适合补丁密度

12. 场景 3a_4TM。最适合核心面积指数和分形维数

13. 场景 3b_1CM,最适合命中率、团块和斑块密度

14. 情景4SM,城市土地与保护区交叉点最多的模型(以灰色显示)。显示整个研究区域允许欣赏受斜率变量(C), 强烈影响的模式(AB

2. 选定的模型和规则集,根据所描述指标的应用及其与现实世界动态的关系,代表融合中的不同点。

15. 帮助从融合中选择模型的决策流程图

05

讨论

所选规则集的应用结果如表2,它不仅显示单个模型中的变异性,还显示自动校准融合中所有模型的变异性。分布远端的结果(参见散点图:图 4和图 5)旨在了解每个模型的全部可变性,但通常看起来不切实际。但它们提供了有关模型行为的重要信息。所以该研究者认为未来的情景建模结果应该包括这些结果,将其作为传达模型不确定性的一种方式,即在最极端的情况下可视化每个模型中规则的逻辑结论。例如,使用 DPDM 生成的场景1a(6)显示了模型的逻辑结论,该模型将历史路径依赖性优先于所有其他因素,因此在简单的逐个单元精度(所有模型的最高命中率)上表现最佳。在这种情况下,DPDM 已成功针对命中率进行了优化,但该模型在对未来城市土地的模拟结果似乎过于聚合,并且模拟运行之间几乎没有变化(6)。方案1b尝试使用 AM 模拟传输网络的效果,同时保持分布的高度聚集性。在这里,排名程序用于选择具有最高团块度(1b_1)或最低分形维数(1 b_2)的最佳命中率。正如预期的那样,结果(7)给出了比情景1a更加聚合的土地模式,且可达性的影响可以连接单独的城市群。虽然这在视觉上似乎没有吸引力,但这些信息作为理解聚合分布上限的手段是很有用的。相反,情景2a2b显示了散射现象,通过给出最低得分团块和最高得分分形维数的规则集来测量,对于包含传输网络(AM)和不包含传输网络的模型(PM)。在图8中可以看到 2007 年尚未成为城市土地的所有内容都分散在地图上,显然是随机的,每次新的模拟运行都选择了略有不同的分散模式。虽然这似乎难以置信,但这是一个合乎逻辑的结论,在这种情况下,放弃了将发展集中在现有地区的所有伪装。场景2b(9)引入了传输网络,但保持了过度的散射,从而产生了奇怪的带状发展模式。场景3a 旨在复制参考地图的模式,有助于了解未来模拟结果与起始地图的偏差。结果自然会根据所选的模式指标(或指标组合)和使用的模型而有所不同。然而,在这里可以看到模型之间的一些趋同(10和图11)——这表明从几个模型中仔细选择几个紧密匹配的规则集能够最大限度地减少不确定性。不同模式指标之间的权衡(场景 3a_4:图12)以及模式相似性和逐个细胞准确性之间的权衡(场景 3 b_1:图13)产生类似的结果。情景4(14)包括地形坡度形式的邻域性、随机性和适宜性,是保护区对低密度城市发展侵蚀的敏感性的一个非常有效的模型,这种现象被称为“自然城市化”,在本次的研究区(Prados Velasco)中广为人知。在这种情况下,似乎通过排除可达性驱动因素并选择具有非常高色散指标(CL,高FD)的校准,新的低密度城市地区出现在任何平坦的土地上,无论这些位置的可达性低和与城市中心的距离如何。这些正是第二套房主在自然美景中寻求的特征——他们不是常年住在那里,而是以最低的成本寻找最美丽的位置。虽然情景4中使用的模型可以进一步完善,使保护区对住房具有吸引力,但是请注意这些地区的发展并不受到积极鼓励。这种模式似乎是对在一个非常分散和解放的规划体系下可能结果的合理近似,社会动态是由逃离城市中心的愿望驱动的,正如一些国家在covid-19大流行期间所记录的那样。

5.1 提出的方法能否解决土地利用建模方法的一些局限性?

在引言中,研究人员列举了现有土地利用建模方法的一些众所周知的缺点。需要注意到的是,统计模型容易受到多重共线性和可修改报告单元问题等问题的影响,机器学习倾向于产生不透明的过渡规则(黑盒问题),非自动试错方法乏味且风险看似任意。而这里描述的方法确实避免或解决了其中的许多缺陷。对模型驱动程序的各种配置进行严格的测试和比较(多模型方法)解决了多重共线性问题。虽然这在之前已经注意到,但该研究人员认为半自动试错法比统计数字运算更透明,此外,通过研究结果针对多个指标的整个分布可以看出,本次研究可以完全避免“最佳拟合”的棘手问题。通过测试从最简单到最复杂的整个模型参数化集合,还可以避免过度规范。为了支持冯等人的研究,这里还展示了非常简单的模型如何通过某些指标比更复杂的模型产生更好的结果。可修改的报告单元问题,或最初已知的MAUP,都是方法可以通过系统测试不同规模或分辨率来解决的另一个方面。这里的脚本(补充材料)提供了一种自动化最初由Díaz-Pacheco等人描述的过程的方法,其中以不同的分辨率测试不同的规则来比较结果。通常,通过检查整个分布并为将来的场景模拟选择不同的规则集,例如关键转换阈值的任一侧,可以避免过度拟合(参见图4,动态组合模型结果,由数字1-3表示)。对多个透明描述的规则进行系统测试避免了某些机器学习方法(特别是人工神经网络)提出的概念“黑匣子”问题。最后,通过随机采样参数空间来自动化规则搜索,从而解决了与试错法相关的任意性问题,并表示整个分布,例如箱线图和散点图(例如图 2-5)

认识到不同参数选择产生的可变性,并鉴于选择方式的高度不确定性,这可能往往取决于所采用的技术与变量的选择一样多。最近的一些研究者已开始采用更全面的土地利用模拟方法,该方法主要是对不同的结果进行多次测试,或寻求多个接近最优的校准规则而不是收敛于单个解决方案。然而,学术奖励制度不利于综合,导致人们倾向于发表许多高度相似的论文,且只讨论更广泛问题的一小部分。本文试图将这些不同的想法结合在一起,以弥合不同空间模拟建模方法之间的差距,并通过统一的方法论愿景来指导未来的研究:多模型集成方法。

06

原文信息

原文题目:

Theres no best model! Addressing limitations of land-use scenario modelling through multi-model ensembles

原文作者:

Hewitt et al.

期刊名:

International Journal of Geographical Information Science

发表时间:

2022/02

原文连接:

https://doi.org/10.1080/13658816.2022.2098299

源:发展地理学

转自:“生态遥感前沿”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com