投稿问答最小化  关闭

万维书刊APP下载

基于Arcpy与SVM的滑坡易发性评价

2023/2/7 15:08:26  阅读:127 发布者:

以下文章来源于M姐实验室 ,作者M

小组编号:B360(一等奖)

作品名称:基于ArcpySVM的滑坡易发性评价

作者单位:长安大学

小组成员:黄武彪,孟岭恩,张宏宇,杨璟

指导老师:丁明涛,李振洪

作品视频

作品介绍

1 设计思想

滑坡灾害的发生每年给全世界各个国家的建设和人民的生命、财产造成重大损失。降雨、地震和洪水等自然灾害的发生常常会诱发一系列滑坡的发生。滑坡易发性是根据研究区历史滑坡数据,综合分析研究区内各种地形地质、水文、人类活动等因素,确定研究区内未来发生滑坡的概率。开展滑坡灾害空间易发性评估能够知道“什么地方容易发生滑坡”,以此实现滑坡灾害的针对性防治,对于滑坡灾害风险管理、人类生命财产安全以及城市未来规划有着重要意义。

2022628日,国家防汛抗旱总指挥部全体会议对地质灾害防治工作提出明确要求:加快推进地质灾害调查评价,提升综合遥感早期识别能力,持续提高监测预警水平,抓好重大地质灾害隐患综合治理。

有关滑坡易发性制图的工具箱大多是基于专家经验的模型或统计模型,如证据权法、频率比法等。这种方法原理简单,易于实施,但精度较差。目前仅少数研究涉及基于机器学习方法的滑坡易发性制图工具的开发。同时,大多数工具仅涉及模型训练及预测部分,并未包含整个滑坡易发性制图的过程。此外,某些工具在使用过程中所需参数量较大,给使用者带来一些不必要的麻烦,且某些因子或机器学习参数的选取需要一定程度的专业知识,因此,这些工具对用户并不友好。

在基于机器学习的易发性制图中,大多数研究仅以滑坡点点位所对应的单个因子像素值作为样本进行模型训练。但实际滑坡发生时往往是一个面,且滑坡发生受其周围环境信息对滑坡发生的影响,因此基于单个像素点构建样本存在一些问题。实现面尺度数据样本构建往往较复杂,且耗时较长。

针对上述问题,本作品开发了一个基于SVMLSM全流程工具箱,该工具箱包括从数据预处理到因子筛选,SVM模型训练及评估到易发性图预测,涉及整个易发性图制作过程。且本工具箱仅基于ArcGIS平台使用,避免了跨平台操作,尽可能减少用户参数输入,操作简单、方便、界面友好。基于滑动窗口的易发性预测过程较耗时,本工具提供一种“多进程”快速预测工具,充分提高滑坡易发性图的制作效率。同时,构建了一种基于面数据的多通道块数据集快速制作工具,提高数据集制作效率。此外,该工具还可用于滑坡识别等样本制作。值得说明的是,本工具箱包括但不限于用于基于SVM的滑坡易发性制图工作,还可用于其他基于SVM的二分类问题。

2 主要功能

本工具箱旨在提供一个全链条、快速、用户友好型支持向量机滑坡易发性制图工具箱,工具箱包括1 影响因子制作”、“2 数据集制作与因子筛选”、“3 模型训练及预测”三个子工具箱,基于模型构建器与Python脚本实现了11个功能,工具箱如图1所示。

1 SVM-LSM工具箱

影响因子制作

滑坡影响因子是通过对研究区滑坡灾害发生机理的研究,从而确定的对滑坡发生有影响的各类因子。滑坡的发生受各种影响因素的影响,目前,影响因素的选择没有一个统一的标准。地形因子、地质因子和人类活动是滑坡发生的最常用的影响因子。基于此,本工具箱提供了一个基于DEM生成相关地形因子的工具(DEM相关因子计算);一个将道路、断层、河流这些线矢量数据转换为连续型栅格数据的工具(线数据转连续型因子);以及一个从NASA下载的GPM降雨量数据(NetCDF-4)处理工具(降雨量数据处理(日)、降雨量数据处理(月))。

数据集制作与因子筛选

在进行机器学习模型训练时,需要一定的样本作为输入。在影响因子制作完成的基础上,本工具箱提供了非滑坡数据点生成,数据样本制作、数据集划分和皮尔逊相关系数(Pearson correlation coefficient, PCC)与信息增益比(information gain ratio, IGR)计算。通过数据集划分将样本按一定比例划分为训练集和测试集,训练集用来训练模型,测试集用来检验模型的泛化性,防止模型过拟合。通过生成的数据样本计算PCCIGR,综合考虑计算结果,以相关性越低,重要性越大为原则剔除相关性较强且对滑坡发生影响不大的因子。

模型训练及预测

在数据集制作与因子筛选完成后,首先利用“待预测影像生成”将不同因子层按某一顺序进行叠加,构成多通道栅格数据,即为待预测影像,该影像用于样本制作及易发性图预测。然后利用“SVM模型训练及精度评定”生成给定各组参数下的SVM模型并给出每个模型精度的评定结果。最后使用“易发性图预测”工具,根据最优参数模型对研究区滑坡易发性进行预测,得到研究区滑坡易发性图。

3 实例应用

以陕西省延安市吴起县为例,利用所开发的工具箱开展滑坡易发性评估工作,总体流程图如图2所示。主要包括数据收集,数据预处理,批量裁剪各因子层,因子筛选与样本制作,模型训练及精度评定,易发性图预测六个步骤。

2 SVM-LSM流程图

基于所开发出的SVM-LSM工具箱,根据图2流程,最终生成吴起县的滑坡易发性图与精度评价ROC曲线分别如图3和图4所示。最优模型(gamma0.02C2时)的AUC值为0.8029,且大量滑坡点都落在高易发和极高易发区中,表明我们的工具箱在滑坡易发性评估中预测结果较好。

3 吴起县滑坡易发性分级图

4 ROC曲线

在吴起县案例中,对所开发的工具箱分别在ArcGISArcGIS Pro下的运行时间的统计,结果如表1所示。

1 吴起县各工具在不同软件下的运行时间统计

从表1可以看出,SVM-LSM工具箱在ArcGIS下单进程使用的总时间为5h 19m 27s,在ArcGIS Pro下单进程使用的总时间为2h 58m 39s,运行效率提高了44.08%。运行时间的主要差距集中在“易发性图预测”工具。同时,SVM-LSM工具箱在ArcGIS下多进程运行的总时间为2h 48m 3s,在ArcGIS Pro多进程中的运行的总时间为1h 52m 4s,运行效率提高了33.31%。运行时间上的主要差异集中在“SVM模型训练和精度评定”工具。因此,建议使用具有64PythonArcGIS Pro运行该工具箱。此外,在ArcGIS平台下,“易发性图预测(多进程)”工具的运行时间为2h 48m 3s,“易发性图预测(单进程)”工具的运行时间为5h 19m 27s,运行时间缩短了近2h 31m 24s,运行效率提高了47.39%。在ArcGIS Pro平台下,“易发性图预测(多进程)”工具的运行时间为20m 12s,“易发性图预测(单进程)”工具的运行时间为1h 26m 47s,将运行时间缩短了近1h 6m 35s,运行效率提高了76.72%。这表明,该工具中的滑动窗口多进程预测工具可以大大提高易发性制图的效率。

4 作品特点

与传统滑坡易发性工作相比,本作品主要有以下特点:

1) 传统的易发性评估流程复杂,需要跨多个平台;通过研发出SVM-LSM工具箱,将所有操作集成至ArcGIS平台;

2) 传统统计方法精度差,本作品使用机器学习算法——支持向量机(SVM)开展滑坡的易发性评估;

3) 传统的利用机器学习方法进行易发性评估初学者上手慢,本工具箱尽可能减少用户参数输入,界面对用户友好;

4) 传统的机器学习滑动窗口易发性评估效率慢,通过“多进程”易发性预测工具,大大提高运行效率。

5 总结与展望

基于SVM的滑坡易发性制图的集成工具:SVM-LSM 工具箱。该工具箱包含影响因子制作、数据集制作与因子筛选、模型训练及预测三个子工具箱,涉及整个易发性制图的全过程。该工具可集成至ArcGISArcGIS Pro中,界面对用户友好,易于上手实现,且提供多进程预测,大大提高预测效率。该模型具有良好的预测性能,预测准确性较高。该工具箱不仅优化了繁琐的易发性制图流程,还解决了传统开展工作需要跨多个平台的缺点,同时又大大提高了模型预测效率,对于使用机器学习开展LSM工作具有重要的意义和实用价值。之后我们将打算加入更多的机器学习模型,开发自动参数调优功能,进一步提高工具箱的易用性和通用性。

工具箱获取方式(免费下载):

https://github.com/HuangWBill/SVM-LSM-Toolbox

转自:“测绘学术资讯”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com