基于多源地理大数据的城市多中心识别方法

2023/8/30 17:27:14　阅读：89　发布者：

基于多源地理大数据的城市多中心识别方法

吕永强1, 于新伟1, 杨朔1, 郑新奇2

1.山东建筑大学测绘地理信息学院,济南 250101

2.中国地质大学(北京)信息工程学院,北京 100083

摘要:

地理大数据的出现为城市空间结构研究提供了新的数据源,如何利用地理大数据识别城市多中心空间结构是目前学术界研究热点。文章提出了一种基于多源地理大数据的城市多中心识别方法,使用基于分水岭的区域分割算法获取研究区内部空间单元,使用两阶段城市中心识别算法识别了城市的主中心与次中心,并对所提方法的识别结果进行了对比验证,研究结果表明: ①基于分水岭的区域分割算法可以有效地挖掘夜间灯光数据的空间特征,获取的基础空间单元可适用于识别城市空间结构; ②微博签到数据可以较好地反映城市人类活动,基于微博签到数据与两阶段城市中心识别方法获取的城市中心与城市规划设定的城市中心基本吻合。文章提出的应用地理大数据识别城市多中心的方法,对拓展地理大数据的应用领域、丰富现有城市空间结构研究的方法具有重要意义。

0 引言

自改革开放以来,中国正经历着史无前例的快速城市化过程,城市化率由1978年的17.9%增长到2019年的60.6%,与此同时,快速城市化过程也带来诸如交通拥堵[3]、环境恶化、住房紧缺[5]等城市问题。为实现城市的健康可持续发展,中国主要城市相继出台相应规划政策以发展多中心城市空间结构,但中国城市多中心空间结构的发展情况仍缺乏全面系统的研究。因此,准确地识别城市多中心既是目前城市问题研究的重要内容,也在规划评估等方面具有重要的现实意义。城市多中心识别受数据可得性的限制较为严重,现有识别方法也多基于就业、人口等统计数据,但统计数据周期较长、获取难度较大,使得大空间范围、长时间序列城市多中心识别研究受到限制; 现有中国城市多中心识别研究的空间单元以街道(乡镇)行政区划为主,街道(乡镇)行政区划面积及空间分异较大,不仅会影响人口/就业密度的计算,同时街道(乡镇)行政区划内部细节特征被忽略,这很大程度限制了统计数据在城市多中心识别研究中的应用。

随着大数据时代的到来,手机信令、社交媒体签到、兴趣点(point of interest,POI)等地理大数据以其能反映人类活动的特征,为城市多中心识别研究提供了新的数据选择。与传统的统计数据相比,地理大数据具有精度高、覆盖面广、更新快、数据量大等优点,能够弥补传统数据周期长且难以获取等缺点,但其空间分布不稳定且具有严重的空间变异性。与基于传统统计数据的城市多中心识别研究相比,基于地理大数据的城市多中心识别研究案例相对较少,研究中使用的方法多为阈值法或空间统计法,且相关研究中空间单元多为规则格网。因此,如何为地理空间大数据提供稳定的空间单元是城市多中心识别研究的重要议题。NPP-VIIRS夜间灯光数据在社会经济指标估算和城市化等研究中取得了广泛应用。受道路、机场、港口、工业园等内部灯光的影响,NPP-VIIRS数据不能准确表征城市内部经济指标与人类活动,但数据较高的空间稳定性使其在描述城市景观格局与基础设施分布方面表现出更大的潜力。部分学者使用NPP-VIIRS夜间灯光数据对城市内部区域进行区块分割,进而用于城市多中心识别研究。Cai等使用多主体的面向对象分割算法框架对夜间灯光数据进行分割; Lou等使用eCognition软件中的多尺度分割算法对夜间灯光数据进行分割。然而,现有2种算法较为复杂,且算法中参数的设定对2种区域分割算法结果影响较大,这些特点使得面向对象分割算法框架的应用受到限制。

本文提出了一种新的基于夜间灯光数据与地理大数据的城市多中心识别方法框架,首先使用分水岭分割算法对NPP-VIIRS夜间灯光数据进行区域分割,获取城市多中心识别研究的基本空间单元; 其次使用微博签到数据表征城市内部人类活动,使用两阶段方法识别城市中心进而分析城市空间结构特征; 最后以北京、上海、重庆为例,验证本文提出的城市中心识别框架的可靠性。本研究拓展了基于地理空间大数据的城市空间结构研究思路与方法,对中国城市多中心空间结构发展分析和规划评估等具有较强参考价值。

1 研究区概况与数据源

1.1 研究区概况

本文选取2015年北京、上海、重庆3个特大城市的市辖区作为研究区,研究区范围如图1所示。为保证研究区的连续性,上海市崇明区,重庆市万州区、黔江区不作为本文的研究区,2015年11月北京市密云县和延庆县撤县设区,故本研究不将其纳入研究范围。北京、上海作为中国最著名的2个超大型城市,其城市空间结构实证研究案例较多,可与本文研究成果进行对比分析; 3个城市在地理区位与地形条件方面存在差异,可用于验证本文研究方法的可靠性。

图1 研究区示意图

1.2 数据源及其预处理

1)NPP-VIIRS夜间灯光数据。NPP-VIIRS夜间灯光数据来源于美国国家海洋和大气管理局(https://ngdc.noaa.gov/eog/viirs/),本文使用排除了散射光影响的“vcmcfg”格式月合成DNB数据(2014年12月),此数据为地理栅格数据,空间分辨率为15″,单位为nano·Watt·cm-2·sr-1。使用ArcMap软件对数据进行坐标转换与重采样,将其坐标系转换为Albers Equal Area,空间分辨率为500 m,并使用研究区矢量面数据进行裁剪,获取覆盖研究区的栅格数据。

2)新浪微博签到数据。研究表明,与手机信令数据和POI数据相比,社交媒体签到数据更适用于城市空间结构的相关研究[9,19]。本文使用新浪微博签到数据来源于GitHub(https://github.com/lzxue/WeiboDataShare),数据获取时间为2014年11月,全国总签到次数1.652亿次,数据量大,覆盖时空范围广,保证微博数据的时空稳定性。选取北京、上海、重庆3市签到数据,利用每个签到点显示的经纬度坐标将其转化为矢量点。

2 研究方法

2.1 基于分水岭的区域分割算法

城市内部空间单元的缺失使得基于人类活动点数据的城市多中心识别研究受到限制,为实现基于地理大数据的城市多中心识别,必须获取城市内部稳定的空间单元。与DMSP-OLS夜间灯光数据相比,NPP-VIIRS夜间灯光数据不受灯光饱和效应的影响,能够很好地区分城市内部精细尺度上的空间差异。如图2所示,NPP-VIIRS夜间灯光数据在区域尺度上显示出基本的空间分布特征,灯光强度较大的区域形成了类似地形中的“山峰”,而“山峰”之间的灯光强度低值形成了类似于地形中的“山谷”。每个“山峰”的顶点可认为是灯光强度的热点,热点在城市区域中表现出较大的空间差异,热点区根据灯光强度最大值点及影响范围可对城市区域范围进行像元尺度分割。因此,基于灯光影像的区域分割过程转换为求灯光热点及其影响范围的过程。

本文使用基于分水岭的区域分割算法对NPP-VIIRS灯光影像进行分割,分水岭算法是一种基于拓扑的形态分割算法,算法将图像视为拓扑地貌,获取局部极小值及其影响区域(集水盆)的分界线。利用MATLAB软件中内置的分水岭算法对图像进行处理,在算法过程中,将灯光强度视为海拔高度,为使输入的影像符合分水岭算法的要求,需对灯光影像进行变换。

2.2 两阶段城市多中心识别

识别城市多中心是城市空间结构研究的重要环节。城市中心一般包含2方面特征: ①中心内部要素(就业和人口等活动)密度显著高于周边区域; ②城市中心范围内要素总量足够大使其对周边区域具有一定影响。常用的识别方法主要包含阈值法、空间聚类模型、参数模型、非参数模型法,其中,阈值法最为简便,但阈值的设定依赖于研究者对研究区的先验知识; 空间聚类模型、参数模型与非参数模型不依赖先验知识,但空间聚类模型多用于格网数据,难以识别郊区的中心; 参数模型假设城市以主中心为原点对称分布,与真实的城市发展不符; 非参数模型可以更好地拟合城市密度曲面,识别出中心城区及郊区的次中心,但方法操作较为复杂。本文参考Lee的研究,对原始的非参数模型方法进行改进,采用两阶段方法识别城市中心。

3 结果与分析

3.1 区域分割算法结果

使用基于分水岭的区域分割算法对北京、上海、重庆城市范围内NPP-VIIRS夜间灯光数据进行区域分割,并将分割后的子区域转为矢量面数据,结合微博签到点数据,采用叠置分析的方式计算每个空间单元内部的微博签到点密度,基于分水岭算法的分割结果如图3所示。城市空间单元统计结果如表1所示。

图3 基于分水岭的区域分割算法结果

表1 城市空间单元统计

北京、上海、重庆分别有1 192个、775个、1 706个空间单元,空间单元平均面积分别为10.22 km2,7.03 km2,16.80 km2,空间单元数量与研究区面积呈现正相关关系,且郊区空间单元一般大于城市中心空间单元。对比3个城市空间单元来看,重庆市空间单元面积的平均值、最大值及标准差最大,北京市次之,上海市最小。上海市地处长三角平原,经济发展水平最高,因此其内部空间单元面积差异最小; 重庆市地形以山地丘陵为主,灯光分布较为分散,部分山地地区灯光基本为0,因此郊区空间单元面积最大值为124.13 km2,远大于中心城区,各个空间单元面积差异最大; 北京市介乎两者之间,空间单元平均大小与差异位于中间。从3个城市各空间单元微博签到点数量及密度来看,上海市微博签到点数量最大,平均密度最大,北京次之,重庆最低,从点密度的空间分布来看,3个城市显示出不同的内部空间结构特征。

3.2 城市多中心识别结果

使用两阶段的城市多中心识别算法,基于空间单元微博签到点密度数据识别3个城市的多中心,识别结果如图4和表2所示。北京、上海、重庆表现出多中心的城市空间结构,其内部的中心数量分别为17,11,12。其中,北京市17个城市中心微博签到点数量约占全市的83.78%,主中心面积为524 km2,其内部微博签到点数量为15 033 714,占全部中心内签到点数量的86.31%; 上海市11个城市中心微博签到点数量约占全市的86.26%,主中心面积为498 km2,其内部微博签到点数量占全部中心签到点数量的86.79%; 重庆市12个城市中心微博签到点数量约占全市的91.30%,主中心面积为421 km2,其内部微博签到点占全部中心签到点数量的80.08%。从3个城市中心的空间分布情况来看,北京市的次中心主要集中在近郊区,部分远郊区的新城新区中心也可识别为次中心; 上海市的次中心空间分布上距离城市主中心较远; 重庆市受内部山地地形的影响,次中心分布更为分散。从3个城市内部签到点数量来看,城市内部的活动主要集聚在城市中心,其中主中心集聚了绝大部分的人类活动,在城市空间结构中发挥着重要作用; 城市内部存在着相当数量的次中心,但次中心内人类活动相对于主中心较少,次中心的发育程度较弱,城市仍表现为强主中心的多中心空间结构。

图4 两阶段法城市中心识别结果

表2 城市中心指标统计

4 讨论

4.1 空间单元对比分析

空间单元的大小会影响密度计算结果,进而影响城市空间结构识别结果,栅格单元过小,将导致空间单元密度出现大量零值; 空间单元过大,空间单元密度计算结果空间异质性过小,进而影响城市中心识别效果。因此,选取合适的空间单元是城市空间结构研究的重要环节。本文对前人研究中不同城市选取的空间单元面积进行统计,结果如表3所示。美国城市多中心识别研究中,常以普查区(census tracts)作为研究单元,研究选用的空间单元面积从1.09 km2到19.19 km2不等; 首尔市城市多中心识别研究中以邑、面、洞(eup-myeon-dong)作为基本单元,平均面积约为12.64 km2; 巴塞罗那与巴黎分别以自治市(municipalities)、市镇(communes)作为基本研究单元,平均面积各为19.51 km2与9.28 km2; 中国城市多中心识别研究中,常以街道(乡镇)作为基本空间单元,面积分别为38.14 km2(北京)、26.48 km2(上海)、44.47 km2(广州)、44.51 km2(深圳)。街道(乡镇)空间单元平均面积以及城市中心与郊区空间单元面积差异相比国外基本空间单元均较大,这会对城市多中心识别结果造成一定影响,因此,寻找平均面积及面积差异均较小的空间单元成为中国城市空间结构研究的重点与难点。

表3 不同研究中选取的空间单元平均面积

如表1所示,基于分水岭的区域分割算法划分的北京、上海、重庆3市空间单元面积平均值及标准差分比为10.22 km2,7.03 km2,16.80 km2以及10.45 km2,4.87 km2,14.67 km2,其面积大小与西方城市选用的空间单元面积较为接近,且其空间单元面积标准差相较于街道(乡镇)也有较大程度降低(北京市街道(乡镇)面积标准差为53.4 km2); 与多主体的面向对象分割算法结果相比,本文得到的空间单元平均面积与面积差异更小,且空间单元的边界更为平滑。由此可知,本文基于分水岭的区域分割算法得到的空间单元大小合适,且城市中心与郊区空间单元的一致性方面效果更好,适用于城市多中心识别的相关研究。

4.2 城市中心识别结果对比分析

为保证城市中心识别结果的可靠性,本文收集3个城市对标2020年的《城市总体规划》,并将《城市总体规划》划定的城市中心与本文识别的城市多中心进行对比,验证本文城市多中心识别算法的准确性。

《北京城市总体规划(2004—2020)》中将北京市中心城市设为城市主中心,这与本文识别结果相同,除通州次中心因城市发展与主中心连接成片之外,石景山、昌平、房山、顺义、怀柔、大兴等区中心街道均被识别为城市次中心,北京经济技术开发区、沙河地区也被识别为城市次中心,平谷区中心街道以及永乐经济开发区内部微博签到点较少,没有被识别为城市次中心; 除规划划定的次中心之外,本文还将北京首都国际机场、瀛海—马驹桥、北七家镇、东小口—来广营识别为次中心。《上海城市总体规划(1999—2020)》中设定的城市主中心与本文识别结果近似,城市规划设定的11个次中心中,除城桥地区不在研究区范围之外,其余中心均可在本文研究结果中找到,但其中闵行—奉贤、松江—青浦因城市发展等原因,2个市辖区次中心逐渐合并; 除城市规划划定的次中心之外,奉贤海湾旅游区也被识别为上海市次中心(可在2035年城市总体规划中看到)。《重庆市总体规划(2007—2020)》设定重庆都市区“多中心组团式”空间结构,本文识别的城市主中心以渝中区为中心,沙坪坝区、北碚区与主中心较远,被识别为城市次中心,这与城市规划中设定的主中心略有差别; 次中心中,除綦江、南川2个次中心发育水平较低之外,合川、璧山、江津、长寿均能识别为显著的城市次中心; 此外,重庆都市区之外的巴南、涪陵、铜梁、大足、永川也被识别为城市次中心。

总体来看,本文基于地理大数据的城市多中心识别方法对3个城市主中心、次中心的识别效果较好,识别结果与城市规划设定的城市中心基本吻合,城市多中心识别方法结果总体上接近于城市空间结构真实状况。

5 结论

本文基于微博签到数据、夜间灯光数据等易于获取的地理大数据,使用基于分水岭的区域分割算法以及两阶段城市中心识别算法识别了3个城市的多中心,并对本文方法的研究成果进行了对比验证,得到相关结论如下:

1)基于分水岭的区域分割算法可以打破现有城市行政区划的限制,更好地获取城市空间单元; 与前人空间结构研究成果对比发现,算法划分的空间单元面积的均值与方差均小于城市街道(区县)空间单元,适合应用于城市空间结构的相关研究。

2)基于微博签到数据以及两阶段城市中心识别方法,可以识别出北京、上海、重庆3个城市的多中心,识别结果与城市规划设定的城市多中心结构基本吻合,本文城市中心识别方法结果满足分析需要。

3)提出了一种新的应用地理大数据识别城市多中心的方法,此方法可应用于基于其他地理大数据的全球大城市城市空间结构研究,并对拓展地理大数据的应用领域、丰富现有城市空间结构研究的方法具有重要意义。

本研究中微博签到数据可以很大程度上代指人类活动,但微博用户基本不涉及老人、儿童及贫困人群,因此数据本身存在一定偏差,下一步可使用手机信令、微信点数据等地理大数据作为本文基础数据进行城市空间结构研究; 本文方法城市中心识别过程中,微博点总量阈值的选取会对结果造成一定影响; 此外,本文研究方法适用于中心城区面积较大的大城市,而中小城市中心城区面积较小,识别的空间单元较少,不容易识别出多中心空间结构。（原文有删减）

【作者简介】吕永强(1989-),男,博士,讲师。研究方向为GIS空间分析与建模。

lvyongqiang19@sdjzu.edu.cn。

【基金资助】山东省自然科学基金青年项目“基于多源数据的中国城市多中心空间结构时空演化特征及其影响因素研究”(ZR2020QD021)

【引用格式】吕永强, 于新伟, 杨朔, 郑新奇. 基于多源地理大数据的城市多中心识别方法[J]. 自然资源遥感, 2023, 35(2): 132-139.

转自：“测绘学术资讯”微信公众号

如有侵权，请联系本站删除！

上一篇： 历史建筑综合测绘应用研究
下一篇： 多层次空间语义约束的道路参数化建模研究

投稿问答最小化 关闭

基于多源地理大数据的城市多中心识别方法

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

基于多源地理大数据的城市多中心识别方法

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭