期刊:INTERNATIONAL JOURNAL OF GEOGRAPHICAL INFORMATION SCIENCE
题目:A cellular automaton integrating spatial case-based reasoning for predicting local landslide hazards
摘要:预测滑坡灾害有利于地质灾害防治。本文提出了一种集成空间案例推理(SCBR)的新型元胞自动机(CA),即 SCBR-CA,用于预测局部尺度的滑坡灾害。该模型不仅提取空间场景特征进行计算,而且实现了动态预测,这意味着只需要一次输入即可获得连续预测。实验在中国四川省芦山县进行。利用卷积神经网络(CNN)获得初始静态滑坡危险区划结果后,利用SCBR-CA模型对2016-2025年滑坡危险区划结果进行预测。为了进行比较,引入了 CA 与 CNN 的结合(CNN-CA)。使用受试者工作特征曲线的曲线下面积(AUC)和 Moran’s I 指数来评估模型的性能。实验结果表明,SCBR-CA的AUC和Moran's I指数值略优于CNN-CA,动态预测的滑坡危险区划结果与静态区划结果相当或优于静态区划,这表明SCBR-CA模型可以有效预测滑坡灾害。当地存在山体滑坡危险。
研究结论
本文的主要贡献在于提出了用于预测未来当地滑坡灾害的 SCBR-CA 模型。
①与传统的滑坡灾害动态预测方法相比,SCBR-CA方法可以基于一次输入来预测滑坡灾害随时间的分布,包括未来的分布,使得该方法方便高效。②与CNN-CA模型相比,SCBR-CA可以显式地提取空间场景特征并进行语义空间计算。空间特征提取过程清晰,计算方法简单。避免了复杂的参数计算,并考虑了时空关系。 CNN-CA模型中使用的网络结构和参数设置策略复杂且难以解释。这些弱点使得 CNN-CA 模型无法表现得更好,因为无法从输入数据中获得更具代表性的空间特征。此外,③SCBR-CA模型可以通过直接扩展案例库来动态、简单、高效地更新演化规则,从而保证模型的适应性。通过迁移学习,每次运行模型时都必须重新训练CNN-CA模型的参数才能达到相同的效果。因此,SCBR-CA是新颖、有效且相对有利的。
SCBR-CA 模型也有一些局限性。
①由于需要执行耗时的计算,案例库的增加降低了动态预测的效率。另外,②空间特征的挖掘不足,目前仅提取空间场景特征进行语义空间计算。此外,③滑坡灾害预测中元胞空间的规则网格划分忽略了地理空间对象的异质性和不规则分布;因此,动态预测结果不能完全反映现实情况。
总体而言,SCBR-CA模型可以有效地提供局部滑坡灾害的动态预测。然而,不同研究区地质环境和灾害发展特征的差异,导致滑坡影响因素复杂多样(Chae等,2017)。因此,必须通过在不同地区进行更多涉及动态滑坡灾害预测的实验来进一步检验和提高所提出的SCBR-CA的适用性。
引言
滑坡是岩体或土体在重力作用下沿斜坡滑落而引起的地质灾害(Dung等,2021)。许多因素会影响滑坡的形成和发展,并且这些因素因地区而异。一般来说,影响因素分为两大类:内源性和外源性(Corominas et al. 2013)。内源因素的变化可能会导致亚稳态的斜率。例如,坡度、岩性、高程、地质构造等因素直接控制滑坡的发展。外生因素主要是指使边坡由临界稳定状态转变为不稳定状态的因素。地震和降雨是常见的外源因素。此外,改变坡度的人类活动,例如修建道路和挖掘渠道,滑坡灾害预测涉及对滑坡相关因素的分析,以估计滑坡可能发生的时间、地点和程度(Shano 等人,2020)。本文的滑坡灾害预测研究是局部而非详细的场地级别(工作比例尺为1:250,000,测绘面积约为1000 km2)。这意味着特定的物理特征,例如单个滑坡的形态结构,被忽略,滑坡通常被视为具有各种属性的点,并与网格单元或坡度单元形式的评估单元相关联(Abraham et al. 2021) )。在局部尺度上,基于物理的模型,例如无限坡度模型和位移时间监测模型(Kuriakose 2010,Macciotta et al. 2016)可能很难应用,因为此类模型通常需要大量有关地下条件的详细数据并且对这些数据中的小错误非常敏感(Stanley et al. 2021)。滑坡灾害预测结果有助于指导灾害防治和土地利用规划的选择决策,探索便捷高效的滑坡灾害预测方法具有重要意义。
现有的滑坡灾害研究主要涉及静态评价和动态预测两类方法。近年来,危害静态评价方法已经成熟。滑坡灾害评价常用方法主要包括模糊综合评价、层次分析法等定性评价方法(Vahidnia等,2010,Ma等,2013)、信息量、Logistic回归等统计方法(Singh等,2013)等。Kumar 2017,Jennifer et al. 2021),以及神经网络和支持向量机等机器学习模型(Marjanovi�c et al. 2018,Pham et al. 2019,Tang et al. 2020)。其中,卷积神经网络(CNN)(LeCun et al. 1998)广泛应用于图像处理和目标检测任务,由于能够自动提取特征并适应非线性特征,在地质灾害分析中取得了优异的效果。值得注意的是,CNN 在滑坡检测、识别(Sameen and Pradhan 2019、Ji et al. 2020、Mohan et al. 2021)和评估(Sameen et al. 2020、Ghorbanzadeh et al. 2021、Zhao et al. 2021)方面表现良好。Ma 等人,2021)。上述方法的应用很少考虑时间,并且没有捕获滑坡从状态A到状态B的变化。此外,那些经过训练的固定参数模型通常只能评估一次,而不是连续评估。在滑坡灾害的背景下,不仅应评估滑坡发生的空间概率,还应考虑时间变化对滑坡活动的影响。
动态滑坡灾害预测方法分为两类。一是将诱发滑坡发生的因素数据与静态滑坡灾害评价结果进行加权叠加,实现对某个地区近期滑坡灾害的预测。例如,可以构建基于贝叶斯概率方法并考虑降雨、地震和人类活动等滑坡触发因素的模型,以获得滑坡灾害的动态预测(Raia et al. 2014,Tan et al. 2015,Rosi等人,2016 年;Piciullo 等人,2017 年;Strauch 等人,2018 年;Shu 等人,2019 年)。这样的方法是有效的。然而,由于滑坡的复杂性和非线性特征,仅依靠某一时间因素不足以动态评估滑坡灾害的综合性,预测结果的时效性有待提高。
在动态预测案例二中,将动态模型与智能模型相结合,构建动态时空滑坡灾害预测模型。例如,动态Gumbel和瞬态降雨入渗模型以及基于网格的区域边坡稳定性模型可以与多层感知器模型、粒子群算法、长短期记忆网络和CNN相结合,以预测不同区域未来的滑坡灾害(Le和Kawagoe 2018、Kumar 等人 2018、Zhang 等人 2018、Yang 等人 2019、Zhang 等人 2019)。这些方法可以有效地表达滑坡物理动力学的非线性特征和方面;然而,它们通常分别预测滑坡的时间和空间概率。然而,在大多数情况下,空间和时间维度不应分开(Lombardo et al. 2020)。而且,此类模型没有充分考虑空间语义计算和空间特征,一些空间特征信息可能对于预测地质现象非常重要,例如滑坡(Lombardo et al. 2020),从而影响预测结果的准确性
一些数学模型同时考虑空间和时间。冯·诺依曼 (von Neumann, 1951) 描述了一种基于细胞自动机 (CA) 的模型,用于评估植物发育、DNA 进化和胚胎发生等现象,并证明 CA 所表现出的动态类似于自我繁殖和发育过程中涉及的生物过程。进化。CA 是一种理论机器学习器,由称为单元的元素组成。每个单元都有一个值或状态,并连接到某些相邻单元,以便它们形成一维或多维晶格。细胞的状态以离散的时间步长变化。单元的新状态是使用预定义的规则根据所连接的相邻单元的先前状态计算出来的。CA 模拟复杂系统或过程的能力使其广泛适用于物理、化学和地理领域的多种现象。例如,具有不同数量的可能状态、连接的邻居以及计算新状态的规则的 CA 用于模拟洪水风险、植被变化、土地利用变化、森林火灾或其他危险(Piegari 和 Di Maio 2014,Iudin 等) . 2015,Wang 等人,2018,Li 等人,2019,Lupiano 等人,2020,Zhai 等人,2020,Torres 等人,2022)。滑坡系统是一个具有非线性、随机性、各向异性和自相似性的复杂系统(Ma et al., 2013)。CA 可以模拟复杂的系统或现象,但预定义的进化规则将是关键。滑坡灾害受多种不同影响因素的影响不同,各因素不仅在时间和空间上存在差异,而且相互关联、相互制约(Ma et al.,2021)。很难清楚地定义每个因素在地质滑坡模型演化中的作用以及用 CA 制定适当的动态演化规则。因此,直接应用传统CA进行滑坡灾害动态预测存在局限性。
在这项研究中,基于案例的推理(CBR)(Schank和Abelson 1977,Aamodt和Plaza,1994)被用来解决与滑坡灾害动态预测的CA传统演化规则相关的问题。 CBR涉及通过相似性推理利用先前的经验来解决新问题,从而提供自学习能力。作为人工智能的一个分支,CBR 为解决涉及复杂规则和获取专家知识有限的问题提供了一种有利的方法(Biswas 等,2014)。值得注意的是,这种类型的推理已广泛应用于天气预报、医疗诊断和交通规划等许多领域(Kamatchi and Parvathi 2019,Bentaiba-Lagrid et al. 2020,Louati et al. 2021)。
在地球科学领域,研究人员应用CBR来解决滑坡管理决策问题,并基于遥感图像进行滑坡检测(Homem et al. 2020、Wu et al. 2020、Wang et al. 2020)。虽然以往的研究案例已经解决了与空间现象相关的问题,但以往的方法大多基于属性相似性推理,缺乏空间相似性推理。例如,在CBR用于地理环境模拟的一项应用中,虽然考虑了空间因素,但仍然纯粹根据属性值计算相似度。少数研究人员探索了空间 CBR(SCBR)(Du et al. 2010,Chen et al. 2018);然而,不同地理现象的空间特征是不同的。在局部尺度的滑坡灾害动态预测中,考虑滑坡地质体之间复杂的空间关系以及提取空间特征时,进行空间相似性推理对于提高预测的准确性和有效性非常重要。
因此,我们提出了一种集成基于空间案例推理的新型CA,即SCBR-CA,来预测滑坡灾害。在中国四川省芦山市进行了滑坡灾害动态预测试验。实验中采用CNN模型获得滑坡灾害静态评价结果,并利用SCBR建立SCBR-CA模型的演化规则进行动态预测。为了提供对比,引入了与 CNN 相结合的 CA 模型,该模型与 SCBR-CA 的区别仅在于其演化规则。
研究区概况
选择中国四川省雅安市芦山县作为研究区(图1);该区呈南北走向的狭长地带,相对高差4732m,总体地形呈南低北高的格局。全县面积1166.39平方公里,截至2019年,庐山总人口接近11万人。庐山年平均降水量1260毫米。从空间上看,降雨量自南向北递减。从地层来看,由于显生宙没有寒武系、石炭系地层,所以其他地层全部出露。庐山处于龙门山断裂前缘构造带,地质构造活跃。自2013年4月20日发生里氏7.0级地震以来,小地震频繁发生,较大地震为4.1级(2014年)和6.1级(2022年)。海拔、水文和地震事件的结合导致了许多山体滑坡。
研究数据
在庐山进行了实地调查,评估当地的滑坡和周围的环境状况。然后,结合因子选择原则(Intrieri and Gigli,2016),选取12个因子作为滑坡灾害预测的驱动因子:海拔、坡度、坡向、地层、距断层距离、年平均降水量、距震中距离、土地利用、植被覆盖度 (VFC)、距河流的距离、距道路的距离以及人口密度。每个因素的原始数据源如表 1 所示。
研究方法
本文的研究过程主要包括数据处理、滑坡灾害静态评价、滑坡灾害动态预测、模型验证等。该方法的架构如图 2 所示。
(1)历史滑坡
滑坡灾害预测的基本假设是,即将发生滑坡的环境条件与同一地区历史滑坡的环境条件相似(Morello 等,2014)。因此,历史滑坡包含了大量对于预测未来滑坡至关重要的信息,例如空间位置、大小、每次山体滑坡的类型、日期、活动以及受山体滑坡威胁的人口和财产。庐山共收集滑坡记录及影响因子361条。所有因素均根据滑坡统计数据进行分级。滑坡数据显示,最大的滑坡面积达1.6万平方米,部分较小的滑坡面积达200平方米。先前的研究表明,历史上的滑坡通常会在 7 至 10 年内变得不活跃(Fan 等人,2019);因此,本研究收集历史滑坡的时间间隔为6年(如2010年至2015年)。在距滑坡点500 m以上、滑坡影响可忽略不计的区域随机生成等量的非滑坡点。
(2)评价单元
评价单元的确定与研究区的范围和原始数据的准确性有关。考虑到单元划分后所需的计算量以及划分后的评价单元的属性能否反映该地区的实际特征(Carrara and Pike, 2008),滑坡选取单元大小为30×30m的规则网格。危害评估和预测。单元的内部被认为是均匀的。最终将整个研究区域划分为1,323,696个网格单元。每个单元都与十二个评估因子值和一个唯一标识符 (ID) 相关联。
(3)基于CNN的滑坡灾害静态评估
1.CNN模型构建
CNN具有很强的非线性学习和拟合能力,无需输入和输出之间预先定义的数学映射公式即可搜索和提取特征。 CNN 使用不同的卷积核根据不同批次的数据不断调整空间中的特征搜索(Ma et al. 2021)。滑坡灾害与各影响因素之间存在着复杂的非线性关系。实际地质空间中的网格单元通常不是独立的,每个评价单元的滑坡灾害危险等级不仅取决于网格单元的因子属性值,还取决于周围单元的因子分布。CNN的卷积窗口不断地在输入因子数据空间上移动,以获得滑坡和因子之间的相关性信息,这些相关性通常很难解释。在一定程度上,CNN 可以补偿地质体的隔离,这种隔离可以通过将地质空间人工理想化划分为规则网格单元来实现。因此,构建了基于一维CNN(即CNN-1D)和多个网络层的顺序线性堆叠的模型(Wang等人,2019),用于滑坡灾害的静态评估。该模型主要由输入层、卷积层、池化层、全连接层和输出层组成(图3)。我们将评价因素的数量定义为m,并将每个评价单元表示为m维向量。在这种方法中,以 m × 1 格式组织的 k 个基本单元被输入到网络中,其中 1 表示通道数。输入数据由卷积层接收以进行特征提取。
2.滑坡危险分级(提出了一种新的滑坡灾害分类标准)
长期以来,定义区域滑坡灾害的分类标准一直是一个挑战(Yan et al. 2019)。自然断点法和经验断点法是流行的分类方法(Klai et al. 2020)。利用自然断点法,可以根据数据的特征快速、轻松地对价值段进行分类;然而,使用基于数学理论的分类,并且忽略与值相关的语义,使得这种方法有些僵化。经验断点法需要专家级的经验。研究人员普遍发现很难正确有效地使用这种方法。参考以往的研究,我们结合概率统计理论和定性数值信息,提出了一种新的滑坡灾害分类标准。新的分类过程包括三个步骤。首先,将样本(由12个评价因子值和滑坡或非滑坡的多个网格单元组成的样本集)输入到CNN模型中,对滑坡灾害进行静态评价。根据样本的实际类别,去除评价错误的样本,保留评价正确的样本,以减轻模型误差对分类标准制定的影响。接下来,分别计算滑坡样本概率和非滑坡样本概率的平均值和标准差。最后,将滑坡发生的平均概率减去标准差得到的概率作为该单元被分类为滑坡单元的概率下限。这个较低的阈值被认为是高度和中度滑坡灾害之间的界限。类似地,将非滑坡概率的均值与标准差相加得到的概率用作单元被分类为非滑坡单元的概率的上阈值。该上限阈值被视为低危险区和中危险区之间的边界。
3.SCBR-CA
CA 通常由六个部分组成:元胞空间、单元、演化规则、有限状态集、邻居和离散时间集。演化规律的确定是构建局部滑坡灾害动态预测CA模型的关键。演化规律决定了一定时期内空间单元内滑坡灾害状态如何变化,从而直接影响预测结果的时效性和准确性(Liucci等,2017)。此外,滑坡具有复杂的时空特征,引发滑坡的因素也十分复杂。因此,滑坡灾害的时空变化很难用简单的线性算法或基于静态知识的演化规则来表示。因此,提取空间场景特征的案例相似度推理是结合CA构建SCBR-CA模型,用于预测滑坡灾害(图4)。我们将整个研究区域定义为细胞空间。之前划分的评估单元作为单元格,每个单元格被分配一个唯一的ID。考虑到小区的实际地理空间邻近性,SCBR-CA模型基于摩尔型邻居;即每个中心单元有八个相连的邻居。滑坡危险级别用作单元状态。给定单元的离散状态集是 f1, 2, 3g。值 1、2 和 3 分别表示滑坡灾害的低度、中度和高度。每个细胞都有一个初始状态(So)。定义了单元大小、邻居数量、初始单元状态等模型参数后,T时刻单元空间内的所有单元同步执行演化规则,得到下一个时刻T的预测滑坡灾害评估结果þ 1. 两个时刻之间的时间间隔是SCBR-CA的演化步骤。基于SCBR的演化规则构造如下。
4.基于案例的单元格表示
在实现进化规则之前,使用特征向量方法将单元组织成案例(Slam et al. 2020)。在不知道属性特征和解之间的显式数学关系或不考虑属性相关性的情况下构建案例。一个案例由两部分组成:特点和解决方案。式(4)中,S0,S1,...,Sn为特征向量,由对应单元及其邻域在时间T的滑坡灾害状态值组成,构成空间场景特征。S0表示当前(中央)单元的状态,S1,...,Sn表示每个图4的状态。SCBR-CA。红色单元代表中心单元,蓝色单元代表邻居,下标 0-8 代表邻居方向。时间 T 时的单元状态用 SO 表示,时间 T + 1 时的状态用 S 表示。X 表示未知情况,Y 表示具有建议解决方案的未知情况。10 J. CHEN 等人的 n 个相邻位置的单元格。值得注意的是,单元空间边界处的单元可能没有n个相邻单元。为了保持邻域结构一致,我们将缺失位置的单元状态设置为0。r是解,表示单元在时间T + 1时的滑坡危险状态。对于未知情况,r值为空。在案例表示之后,细胞状态预测的过程开始解决未知案例。
5.案例库建设
当所有单元都用案例表示后,需要使用已知案例构建案例库。然后,我们以两个时间间隔从具有已知滑坡危险状态的单元中提取危险状态信息,以形成已知案例。两个已知状态的间隔之间的时间差反映了SCBR-CA模型中执行演化规则所需的实际时间。然后采用分层随机抽样的方式提取一些已知案例,形成案例库。
6.空间场景相似推理
基于单元表示形成的情况是地理空间情况,其中状态特征是具有位置信息的空间数据。对象的地理分布通常取决于空间特征,例如空间数据的方向、拓扑、距离和形态(Catani et al. 2016)。在这项研究中,空间场景特征被挖掘并集成到未知案例的解决过程中。通过计算空间场景之间的相似度,我们从案例库中检索与未知案例最相似的已知案例。已知情况的解作为未知情况的结果状态解,然后可以获得预测的细胞状态。两个空间场景之间的相似性取决于特征值和特征分布模式的差异(Xavier et al. 2017)。当中心单元及其邻居的状态表示为案例的特征时,底层空间场景特征的案例特征向量可以抽象为二维空间中的折线(图 5)。然后可以根据空间场景特征计算两个案例之间的相似度。计算 Dkl,即两条折叠线上所有点对的绝对高度差的平均值,以表示两个案例特征的数值相似度。Skl,两条折叠线形态的相似度,可以通过所有点对的高度差和这些高度差的平均值之间的期望来测量。两种情况的最终相似度为Ckl。
7.案例库动态更新
通过分层随机抽样,可以将正确预测的案例按比例添加到案例库中,从而实现案例库的动态更新和知识增长。如果案例库包含丰富的案例知识,模型正确、有效、快速解决复杂问题的能力就会增强。至此,滑坡灾害动态预测SCBR-CA模型构建完成。
(4)评估指标
实际的滑坡是评估滑坡灾害评估结果可靠性的理想选择。本研究使用受试者工作特征曲线的曲线下面积(AUC)来评估模型的性能。曲线越靠近图左上方,AUC值越大,说明滑坡灾害评估结果准确(Feizizadeh等,2013)。为了从更多角度检验SCBR-CA模型的可靠性,还应用了其他评价指标;这些指标包括总体准确率、召回率、精确率和 Fmeasure (F1)(Hand 和 Christen 2018)。此外,莫兰指数(Moran 1950)用于评估观测到的滑坡灾害与预测的滑坡灾害之间的空间特征差异,特别是聚集模式的差异。较小的差异表明预测与观察到的危险更加一致。滑坡专家还对 36 个滑坡进行了现场调查,以评估 SCBR-CA 模型的可用性和准确性。
(5)实验装置
按比例分层随机抽取含有或不含有滑坡的评价单元后,按照实验方案开始后续实验(图2)。CNN模型用于滑坡灾害静态评价的样本如表2所示。根据静态评价结果提取各单元(cell)的灾害状态数据,进行滑坡灾害动态预测实验。2015年和2016年滑坡灾害发生情况。2015年滑坡灾害三个灾害等级各抽取20%,得到264,739 个样本(单位)。然后将它们分为 211,789 个训练样本、26,473 个验证样本和 26,477 个测试样本以进行准确性评估。为了验证SCBR-CA模型的可用性和适用性,我们使用CNN-CA模型进行比较。CNN-CA模型的结构如图6所示。SCBR-CA和CNN-CA模型使用相同的样本数据。特别是,SCBR-CA 不需要训练。因此,我们结合训练集和验证集中的样本建立了SCBR-CA模型的初始案例库,其中包括238,262个案例。SCBR-CA 和 CNN-CA 模型的准确性是使用相同的样本测试集计算的。此外,SCBR-CA模型的案例库通过分层随机选择2%的正确预测案例来动态扩充。
所有模型均使用Python实现,CNN结构基于Keras深度学习框架(Molayil 2019)和开源Neural Network Intelligence自动引用工具构建。本研究中使用的因素分类数据是离散分类数据。我们使用one-hot编码(Okada et al. 2019)处理CNN输入数据,并将离散分类数据映射到欧几里德空间,同时扩展输入数据特征,从而最小化对模型的相应影响。实验中用于CNN训练的模型参数如表3所示。
转自:“生态遥感前沿”微信公众号
如有侵权,请联系本站删除!