本文转自灾害与环境遥感。
文献分享✦
基于OpenStreetMap的全球城市建筑数据完整性与不平等的时空分析
题目: A spatio-temporal analysis investigating completeness and inequalities of global urban building data in OpenStreetMap
期 刊: Nature Communications
1
导读
在全球城市分析中,建筑数据是评估若干重要城市目标进展情况的重要资产。先前的研究将OSM与权威数据进行了比较,以提供有关选定城市OSM完整性的详细见解。然而,由于缺少参考数据或缺少可用数据,需要做更多的工作来将方法转移到其他地区。
2023年7月发表于《Nature Communications》的 "A spatio-temporal analysis investigating complete-ness and inequalities of global urban building data in OpenStreetMap" 一文使用机器学习模型来推断全球13189个城市群的OSM建筑存量数据的完整性。此外,该研究将城市隔离的研究方法应用于分析OSM种的地理不平等现象,实现对城市OSM建筑完整性的演变进行全面评估。
2
方法简述
(1)建筑数据
该研究针对全球13189各城市中心进行。使用Global Human Settlement Layer Urban Centres Database (GHS-UCBD) 数据库来划定研究区,网格采用与GHS-UCBD的栅格数据集相同的结构。此外,该研究整合了一组外部数据集作为可参考的建筑数据集。
(2)解释变量
表1 机器学习模型中使用的解释变量的汇总统计和特征重要性(Gini重要性)。
该研究从主要道路的每个网格单元的OSM中提取了以公里为单位的路网长度。再利用内在质量评估方法,研究了OSM道路数据完整性的空间变化。因此,对每个城市中心的道路网络完整性进行估计,并按世界区域进行了汇总。
(3)建筑面积预测模型
该研究使用随机森林 (Random Forest, RF) 模型来预测每个网格单元的总体建筑面积(以平方米为单位)。此外,该研究采用了基于k均值聚类的空间交叉验证方法来评估所提出的建筑面积预测的性能。
(4)城市OSM建筑完整性
该研究使用面积比法(参考建筑面积/ OSM建筑面积)计算了每个城市中心的OSM建筑完整性。
首先,通过汇总每个城市中心的所有网格单元的值来获得总体预测建筑面积。通过计算OSM建筑面积与预测建筑面积的比值,每年得出每个城市中心的OSM建筑完备性。
此外,还计算了每个时间序列的95%置信区间。SHDI分类基于联合国开发计划署定义的截断点68:低人类发展水平(SHDI< 0.550)、中等人类发展水平(SHDI: 0.550 - 0.699)、高人类发展水平(SHDI: 0.700-0.799)、极高人类发展水平(SHDI> 0.800)。城市规模分类基于经合组织69定义的人口阈值: 小城市地区(50k-200k)、中等城市地区(200k-500k)、大都市地区(500k-1.5M)、大城市地区(>1.5M)。
该研究调查了通过 HOT Tasking Manager 进行的人道主义制图以及 Apple、Meta、MapBox、Microsoft 和 Kaart 公司制图对整体完整性和不平等度量的影响。
采用 Moran's I 指数来衡量城市 OSM 建筑完整性的全球空间自相关性的指标。使用相同的空间权重矩阵来计算欧洲和中亚以及撒哈拉以南非洲地区的局部空间自相关性。
(5)城市内部OSM建筑完整性
为了确保足够的样本量,我们仅针对最小面积为25平方公里的城市中心计算了城市内部评估的不平等度量。对于最终的4722个城市中心,使用上述每平方公里网格单元的面积比方法导出了局部OSM建筑完整性。同样,按上述方法计算每个城市中心的局部OSM完备性的基尼系数和Moran’s I全球空间自相关。
3
研究结果与分析
(1)城市OSM建筑完整性
图1 城市 OSM 建筑完整性的时间演变。a : 世界各地区和 b: 次国家人类发展指数(SHDI)组的平均值。完整度是根据随机森林(Random Forests)模型和每个城市中心的年度 OSM 建筑面积汇总得出的建筑面积预测值。阴影区域代表每条线的 95% 置信区间。SHDI 等级是根据联合国开发计划署确定的分界点68 确定的: 低人类发展指数 (SHDI < 0.550)、中人类发展指数 (SHDI: 0.550-0.699)、高人类发展指数 (SHDI:0.700-0.799)、极高人类发展指数 (SHDI > 0.800)。因此,建筑完整性估计值的不确定性随着距离 2020 年的增加而增加。这并没有反映在置信区间中,因为这种额外的不确定性很难量化。
图2 13189 个城市中心的 OSM 建筑完整性的空间分布。方括号种内容为每个完整度类别所包含的城市中心总数。
图3 完整性的非空间和空间不平等度量。世界各地区 (a) 城市 OSM 建筑完整性的均匀性和 (b) 聚类的时间演变。Moran's I 衡量空间自相关性,正值表示空间聚类。在实践中,Moran's I 的值通常在-0.5 到 1.15 之间,零表示不存在全球空间自相关性。
前人对各类灾害易发性模型的讨论仅停留在因子重要性与易发性区域的空间分布上,未就每个因子内部对预测概率的影响进行探讨。本文利用部分依赖图(PDP)来解释评价因子内部不同取值区间对隧道地热灾害预测概率的影响。结果显示:重要性排名前3的评价因子(地表温度、断层密度和地震动峰值加速度)与隧道地热灾害预测概率均成正相关关系,即对隧道地热灾害的发生有促进作用。
图4 按重要性排序的前三个评价因素的部分依赖图:(a) 地表温度; (b) 断层密度; (c) 地震动峰值加速度。
图5 完整性的局部空间自相关性。a, b 欧洲和中亚地区以及 c, d 撒哈拉以南非洲地区的城市中心在两个时间点上的比较。根据每个城市中心的建筑完好率值是否高于(高)或低于(低)全球平均值,以及其邻近地区的加权平均值是否高于或低于全球平均值,对其进行分类。在此基础上,定义了四个象限:高-高(HH)、低-高(LH)、低-低(LL)和高-低(HL)。高-高表示完整度值高的群组,低-低表示完整度值低的群组,而低-高和高-低表示空间离群值,即城市地区的完整度值出乎其邻近地区的意料。
(2)城市内部OSM建筑完整性
图6 基于OSM建筑完整性、基尼系数G和Moran’s I的城市中心集聚聚类,每个点代表一个最小面积为25平方公里的城市中心。由于基尼系数和Moran系数无法可靠地估计,因此较小的城市中心被忽略。
图7 城市内部OSM建筑完整性。选定城市中心的空间分布(a-f)。对于每个城市中心,我们报告了总体OSM完整性c、基尼系数G和Moran‘s I。对于任何城市中心,单元大小总是一平方公里。集群与图5相同。树状图(c)中显示了每个集群中城市中心的数量。
图8 城市中心层OSM建筑完备性的时间演化。包括每个集群和选定的城市中心的完整性(a-e)。集群与图5相同。
4
主要结论
首先,该研究提出了一种基于随机森林的机器学习回归方法,以评估13189个城市中心(由欧盟委员会定义)的OSM建筑完整性。利用来自商业和权威来源的大量开放建筑数据作为训练数据,并利用OSM全历史数据在全球范围内进行时空数据分析。该模型进一步依赖从遥感数据(土地覆盖、人口分布、夜间灯光)、次国家人类发展指数(SHDI)和城市道路网络密度获得的信息作为预测指标。
其次,该研究建立在广泛的方法技能的基础上,研究城市隔离,并将其转移到分析OSM内的地理不平等。这使我们能够对城市OSM建筑完整性的演变进行全面评估,其中包括自2008年以来为OSM提供的所有数据。
5
借鉴与启发
研究人员或决策者进一步开发这些数据集和其他数据质量评估方法,有助于量化社区参与的高度不均衡的地理分布。通过将完整地图与有关地区的社会人口特征结合起来,将有可能确保公平和平衡地选择目标地理区域,以减少OSM在全球、区域或城市内一级的现有数据不平等。
文章信息:
HERFORT B, LAUTENBACH S, PORTO DE ALBUQUERQUE J, et al. A spatio-temporal analysis investigating completeness and inequalities of global urban building data in OpenStreetMap[J]. Nature Communications, 2023, 14(1).
DOI: https://doi.org/10.1038/s41467-023-39698-6
投稿来源:
李亚兰, 2021级硕士研究生
研究方向:建筑垃圾识别
邮箱:2108160321011@stu.bucea.edu.cn
转自:“生态遥感前沿”微信公众号
如有侵权,请联系本站删除!