城市是一个开放而庞大的系统,是人类社会发展到一定阶段的产物。城市中存在着多种结构,包括城市空间结构、城市社会结构、城市文化结构、城市经济结构、城市人口结构以及城市功能结构等。其中,城市空间结构是城市的功能组织在城市空间上的投影,反映着城市中各物质元素在空间区位上的分布特征和组织规律,是城市结构中的基础结构。城市空间结构的研究是以往城市地理学及城市规划学研究城市空间的核心内容之一[1]。新常态时期,中国经济和城市进入新的发展阶段,传统的城市发展模式面临诸多问题,对城市规划理念、策略和建设提出新的要求和挑战,要求突出以人为本的创新驱动,加强空间资源的优化配置,优化城市空间结构,加强存量利用[2]。而加强城市功能区的合理规划,即通过对土地利用情况进行空间分析及空间调整[3],确定合理的城市功能区空间布局,使其在提高城市土地利用效率的基础上,可以将各项产业聚集起来,并发挥最大效能。开展城市功能区的研究有利于合理、健康地规划未来城市,使城市空间得到高效充分的利用。同时,城市功能区的发现,为人类生活、工作和交通提供了各方面的便利。例如,游客可以通过城市的功能分区快速地区分商业区和景区,从而减少出行规划时间;本地居民也可通过寻找类似的功能区来扩展他们对城市的认识。这些区域功能,部分由城市规划者人为设计,部分根据人们的实际生活方式自然形成,并随着城市的发展而有所改变。对城市中功能区域的理解可以帮助人们快速的理解复杂的城市,校准城市规划并促进其他应用。
传统的研究主要采用调研统计的方法,通过对人们出行日志的记录和问卷调查等方式进行研究。此种研究具有很大的局限性,不仅耗费大量的人力物力财力,而且效率低下,其次调查者会将主观意见和看法带入研究中,研究结果受到主观因素的影响,使得人们难以判断数据的准确性和结论的可靠性,故试验难以重复。大数据时代为城市功能区研究提供了丰富的数据源,使得对城市空间的研究突破了人力的限制。新的数据源促进新的研究方法的出现。近年来,许多学者开始使用手机数据[4-6]、城市POI数据[7-13]、浮动车轨迹数据[14-16]、高分辨率遥感影像[17-23]以及社交媒体数据[24-25]开展城市功能区划分、土地利用分类和土地利用监测等方面的研究,通过对这些时空大数据的分析可以发现以往采集的样本无法揭示的城市功能区空间分布情况。
同时,随着机器学习和数据挖掘等技术研究深入,相继有学者以城市POI数据和浮动车轨迹数据为研究数据,通过借鉴机器学习相关理论、数据挖掘工具和建立模型等来研究城市功能结构。如文献[26]借鉴文本挖掘领域的概率主题模型理论来发现城市功能分区,然而这种方法在一定程度上只考虑了POI频数对城市功能分区的影响,忽略了POI空间分布特征对分区的作用。考虑到基于POI的序列与土地利用类型之间的关系可以通过连续的空间语言模型来量化[27],文献[28]引入Google的Word2Vec的开源深度学习语言模型,通过贪婪算法将区域内的POI排列成满足距离最短的POI序列。利用Word2Vec模型可以根据文档中的上下文关系将单词投影到高维向量空间的原理,构建区域向量,来研究城市功能区。但该方法也存在一些不足。如图 1(a)所示,该方法在一定程度上考虑了POI间的线性位置关系,未顾及到POI与周围POI间的非线性空间分布关系。基于此,本文采用空间共位模式方法挖掘POI的非线性空间上下文关系。如图 1(b)所示,本文方法通过挖掘不同类型POI的空间聚集情况,来反映POI上下文空间关系。最后,以北京市核心功能区为例,对核心功能区域内不同类型的功能区进行识别,并用LDA、Word2Vec进行了对比分析。
|
| 图 1 两种方法的对比 Fig. 1 Comparison of the two methods |
1 研究区域和数据
如图 2所示,研究区域位于北京市核心功能区,总面积为302 km2,是中国经济最发达的地区之一。同时作为中国政治、文化、科教中心,北京的另一特征是人口密度大、道路网密集且发达,城市结构复杂、包含有多种混合的土地利用类型,如居民地、娱乐场所、科教区等。
|
| 图 2 北京市的核心功能区域 Fig. 2 Beijing's core functional area |
在本文研究中,道路数据为从Open MapStreet(http://download.geofabrik.de/asia/china.html)下载的2018年道路网数据。POI数据集是通过百度地图服务(http://map.baidu.com)提供的应用程序编程接口(API)获取的,约包含250 000条POI记录,几乎涵盖了所有的设施类型。浮动车轨迹数据每隔5 s左右采集一次,记录的基本信息包括出租车的车牌号码、时间、经纬度、速度、方位和载客状态等。考虑到GPS数据的稳定性,本文采用2012年11月5日(周一)到2012年11月25日(周日),历时3周的GPS数据(见表 1)。
| 数据 | 数量 | 详细说明 |
| 北京市区划图 | 选取北京市五环内为研究对象 | |
| 道路网数据 | 293 446段 | 选取高速公路、省道、城市主干道及城市次干道的道路功能等级为道路分割对象 |
| 兴趣点数据 | 258 820个 | 包括商务住宅、餐饮服务、风景名胜、公共设施、公司企业、购物服务、交通设施、金融保险、科教文化、生活服务、休闲体育、医疗保健、政府机构等各种类型的POI |
| 浮动车轨迹数据 | 12 000辆 (约8亿条) |
选取研究对象范围内的所有GPS点 |
2 研究思路与方法
本文研究过程如图 3所示,考虑到不同功能区的POI配置不同,而空间共位模式可以找出现实世界中具有强空间关系的空间子集。因此,本文采用空间共位模式挖掘POI空间组合模式,以此来表征POI间的空间分布关系,并计算出可以反映POI组合关系的指标;其次,构建区域表达来感知在交通分析区(traffic analysis area,TAZ)尺度下的城市功能结构。该过程主要包括以下4个部分:①通过城市道路网构建TAZ;②根据空间共位模式,挖掘POI潜在上下文关系;③提取POI空间信息,构建区域特征向量;④功能区标注。以下各小节对其进行详细介绍。
|
| 图 3 基于空间共位模式的城市功能区识别的详细过程 Fig. 3 Workflow of urban land use identification using spatial co-location mode |
2.1 TAZ构建
路网通常主要由高速公路和环形道路等一些基本道路构成,其在城市中纵横分布对城市空间形成自然分割。本文将道路对城市划分形成的区域定义为TAZ。客观上,普遍认为每个分割区域都是承担社会功能的基本单位,因为POI通常位于区域内部,人类也在区域内进行社会经济活动以满足日常生活娱乐、购物等需要。TAZ是承载人类社会经济活动的基本单位,也是城市功能划分的基本单位。
本文选择栅格数据模型来表示道路网络,采用形态学图像分割技术来解决城市区域划分问题,栅格数据表示的道路网络是二进制图像(其中“0”表示道路段,“1”表示空白区域)。如图 4(a),原始的矢量道路网中存在许多噪声区域,如道路中的人行道、环形立交桥区域等,这些区域影响区域划分结果。为了移除这些不必要的细节部分,首先使用形态学操作中的膨胀法[29]来加厚道路,填补图像上的小洞和一些不必要的细节,如图 4(b)。其次,道路膨胀操作后变得很粗糙,使用形态学图像处理的细化操作[29],在保持原始道路网拓扑结构的条件下,来提取道路的骨架,如图 4(c),此操作可以恢复因膨胀操作而减少的区域大小。最后,如图 4(d),通过连通区域标记操作,聚集“1”标签网格来查找各个区域[29],形成TAZ。
|
| 图 4 交通分析区的形成过程 Fig. 4 The formation process of TAZ |
2.2 POIs的空间上下文关系挖掘
在早期的大多数研究中,研究者在研究区域功能时,由于缺乏合适的模型,仅仅只考虑POI统计信息,忽略了POI空间分布特征对区域功能的影响。受此影响,在本文中引入空间共位模式挖掘算法[30],它主要作为空间数据分析和地理上下文感知的重要手段,来发现现实世界中具有空间临近关系的地理实体对象或事件。在计算机领域,它属于空间数据库中的关联规则挖掘。本文利用空间共位模式这一性质来挖掘POI潜在上下文关系,提取POI空间信息。
空间共位模式,是指在同一区域内频繁关联的特征集合,用于发现在现实世界中具有强空间关系的特征子集。在TAZ内POI空间分布也有很强的关联性,如大型商场里有ATM机,学校附近有饭店等。基于此,本文采用空间共位模式来挖掘区域内POI潜在上下文关系,提取空间信息,构建区域表达。共位模式挖掘取决于空间类型和空间邻域的定义。基于此,挖掘POI潜在上下文关系分为3个步骤:①确定空间类型,根据预定义的邻域阈值构建领域关系图,确定上下文关系;②生成共位模式,挖掘POI潜在上下文关系;③根据最小参与指数阈值,对生成的共位模式进行筛减,获得频繁共位模式,提取空间信息。通过对试验数据的分析与验证,本文选择共位模式的大小为3。
2.2.1 空间上下文关系POIs上下文关系取决于空间类型和空间距离阈值的定义。在传统研究中,研究者们通常将现实世界抽象成无限均匀和各向同性的空间,采用欧氏距离来计算两个对象间的分离程度,确定邻域距离[31]。然而,需要注意的是,如图 5所示,城市设施点常沿道路分布,城市空间中的物理运动通常受到道路网络约束。因此,POI上下文关系挖掘应考虑具体的道路情况,使用道路网络距离来分析和研究社会经济功能将更可靠和更有意义[32]。
|
| 图 5 POI设施点沿路网分布 Fig. 5 The distribution of facility POIs along the street network in the study area |
如图 6(a)所示,本文将现实世界道路网络抽象为由G=(N, E)表示的图结构,其中街道被抽象为边的集合(即E),街道的交叉点对应于一组节点(即N)。然后,通过最近邻搜索树将地理实体映射到道路网络的边上,并通过线性参考表示。如实体Oi通过元组〈e, pos〉来描述,其中,e表示距离实体Oi最近的边,pos代表着从e的起点到实体投影处的网络距离。因此,在这样的网络结构中,网络空间的邻近关系可以被进一步定义为:对于两个网络对象Oi、Oj, 若是从Oi的映射处到位置Oj的最短网络距离小于或等于用户指定的阈值,则相邻。考虑到地理研究专家曾指出人在城市环境下最适宜的步行距离为200~300 m,在研究中,通过计算研究区域内所有地理实体的k近邻为基础来确定邻域距离。即在计算出所有设施的k近邻网络距离后,选择这些距离的平均值作为邻域阈值[33-34]。本文通过计算确定距离阈值为300 m。
|
| 图 6 网络空间下的距离度量及共位模式挖掘 Fig. 6 Distance measurement and co-location pattern mining in cyberspace |
定义1:对于给定I、J、K 3种类型的POI,根据网络距离来定义其空间上下文关系spatial_relationship, 构建共位模式P,挖掘出POI的潜在上下文关系。其具体定义如下
(1)
式中,road_distance(m, n)表示地理实体m、n的网络距离,spatial_relationship表示满足网络距离条件I、J、K 3种POI类型的空间分布关系,P(fi, fj, fk)为共位模式。
2.2.2 挖掘上下文关系城市空间中的POI,总是以聚集状态分布,一个POI位置的选择受其相邻POI的影响,并且不同区域内POI共位关系有所差异。对于商业区域来说,超市、餐饮、ATM更容易分布在一起;而对于教育区域而言,科研楼、小卖部、操场的组合则更明显。本文通过空间共位模式挖掘POI的共位模式,以此来反映POI空间分布的潜在非线性上下文关系,并根据POI组合的差异来反映区域的功能差异。为了衡量不同空间共位模式间频繁性的差异,本文引入文献[35]中所介绍的参与指数来衡量空间共位模式的普遍性。为了解释参与指数指标,须先介绍与其密切相关的指标-参与率的概念。
定义2:给定道路网络中特定类型的POI如f1、f1、…、fk和共位模式P{fi, fj, fk},则类型fi在模式P{fi, fj, fk}中的参与比率PR(P{fi, fj, fk}, fi)为
(2)
式中,|I(P{fi, fj, fk}, fi)|表示包含在共位模式P{fi, fj, fk}中,类型fi不同对象的数量;|I(fi)|为类型fi对象的总数。若PR值较高则表明一个空间特征与模式中的其他空间特征具有强空间共位关系。基于这个参与率指标,参与指数PI的正式定义如下:
定义3:对于一个网络共位模式P{fi, fj, fk},结合参与比率定义可得参与指数的定义如下
(3)
定义4:对于一个网络共位模式P{fi, fj, fk},若PI(P{fi, fj, fk})大于用户指定的最小参与指数,则该模式为频繁模式,即
如图 6(b)所示,在同一TAZ中存在空间特征A、B、C、D,共位模式有{A, B, C}、{A, B, D}、{A, C, D}、{B, C, D},根据式(2)可知:PR({A, B, C},A)=1/4、PR({A, B, C},B)=1/3、PR({A, B, C},C)=1/3;PR({A, B, D},A)=1/4、PR({A, B, D},B)=1/3、PR({A, B, D},D)=1/2;PR({A, C, D},A)=1/4、PR({A, C, D},C)=1/3、PR({A, C, D},D)=1/2;PR({B, C, D},B)=1/3、PR({B, C, D},C)=1/3、PR({B, C, D},D)=1/2。同时根据式(3)可求得:PI({A, B, C})=1/4,PI({A, B, D})=1/4,PI({A, C, D})=1/4,PI({B, C, D})=1/3。本文主要利用空间共位模式挖掘TAZ中不同类型POI的潜在上下文关系,采用参与指数来量化POI空间关系,提取POI的空间分布信息。
2.3 区域特征表达为了更好地度量区域间相似性,构建区域表达尤为重要。本文根据定义1来发现TAZ中的共位模式,挖掘POI空间上下文关系,并根据定义2、定义3量化空间共位模式,提取POI空间分布信息。根据定义4获取频繁共位模式,结合式(1)、式(2)、式(3)及式(4)构建TAZ的特征表达如下
(4)
式中,Vector_of_TAZm表示第m个TAZ的区域特征向量;PI1(fi, fj, fk)为第m个TAZ中模式P1(fi, fj, fk)的参与指数。
2.4 标注功能区对于TAZ特征向量,通过聚类实现相同功能区域的聚类,之后需要根据区域实际功能进行区域标识。城市功能区的分类标准很多,功能区的划分也各不相同,本文主要根据社会功能和居民需求结合POI的语义信息进行划分,主要可以分为居住区、风景名胜区、商业娱乐区等[36-37]。本文通过结合POI、出租车轨迹数据及人为标注从3个方面来识别功能区:
(1) 通过构建频数密度(frequency density, FD)和类型比例(category ratio, CR)作为研究单元内POI的统计特征[37],识别区域的功能性质。公式如下
(5)
(6)
式中,i表示POI类型;ni表示TAZ中第i种类型POI数量;Ni表示第i种类型POI总数; Fi为第i种类型POI占该类型POI总数的频数密度;Ci表示第i种类型POI的频数密度占单元内所有类型POI频数密度比例。
(2) 计算不同类型功能区在周末和工作日的O/D值,即在不同时间离开/到达该功能区的频次,探索该类型区域人群移动规律,从而推测功能区类型。
另外计算不同类型功能区在周末和工作日的移动模式频率,即计算从00:00开始到24:00结束的时间段内,从其他类型功能区到该功能区及从该功能区到其他类型区的频次,并形成热点分布图,以此来研究不同功能类型区域间的交互。其中,横坐标表示一天内时间变化,纵坐标代表不同的功能区,颜色越深表示交互频次越高,反之亦然。
(3) 经验标注。对于一个长久居住在一个城市中的经验者,他们非常清楚地知道城市的地标建筑和最能体现城市特色的区域。例如,区域中包含的北京大学、清华大学,大家肯定会认同这个区域是一个教育用地。在试验中完成聚类,得到城市功能区后,有经验的人们可以帮助我们更好地标注、识别功能区,可以得到更详细、准确的城市功能分区结果。
3 功能区识别 3.1 交通分析区尺度上的区域聚合如图 4(a),道路网共有路段293 446条,从中挑选出主要道路52 751条,采用形态学图像分割技术对研究区域进行划分,生成424个TAZ,同时对POI数据根据语义信息及社会功能等信息分成13个类别,其满足人们日常生活的基本需求。利用ArcGIS中内置的交集制表工具,确定POI落在哪个单元内,采用空间共位模式,在TAZ的尺度上挖掘POI潜在的上下文关系, 提取POI空间信息,构建区域表达向量,见表 2。由于篇幅所限,本文只列举了部分TAZ的表达形式,通过聚类算法进行区域聚类,如图 10(c)所示,使得同一簇内的TAZ具有相似功能,不同簇表示的功能不同。
| TAZ | PI(餐饮服务、公司企业、交通设施服务) | PI(公司企业、交通设施服务、金融保险服务) | PI(餐饮服务、交通设施服务、科教文化服务) | … |
| 102 | 0.895 348 837 | 0.767 441 86 | 0.813 953 488 | … |
| 103 | 0.930 041 152 | 0.901 234 568 | 0.913 580 247 | … |
| 104 | 0.670 025 189 | 0.362 720 403 | 0.627 551 02 | … |
| 105 | 0.960 264 901 | 0.792 857 143 | 0.909 090 909 | … |
| | | | | |
|
| 图 10 不同方法聚类结果 Fig. 10 The recognition results of urban functional areas by different methods |
3.2 识别功能区
根据2.3节介绍的城市功能区识别方法,结合POI类型比例排序(表 3)、工作日/周末的到达/离开每个功能区的热点图(图 7、图 8)以及周末/工作日各个时间段的流量特征(图 9),对聚类结果进行功能识别。
| POI | C0 | C1 | C2 | C3 | C4 | |||||||||
| CR | IR | CR | IR | CR | IR | CR | IR | CR | IR | |||||
| 商务住宅 | 7.584 | 9 | 7.482 | 5 | 8.201 | 3 | 8.058 | 5 | 5.353 | 9 | ||||
| 餐饮服务 | 8.047 | 7 | 6.408 | 10 | 6.783 | 13 | 7.562 | 9 | 7.431 | 6 | ||||
| 风景名胜 | 4.097 | 13 | 12.819 | 1 | 6.927 | 12 | 5.483 | 13 | 11.213 | 3 | ||||
| 公共设施 | 5.060 | 12 | 9.744 | 2 | 7.064 | 11 | 6.428 | 12 | 13.190 | 1 | ||||
| 公司企业 | 8.393 | 4 | 6.178 | 11 | 7.770 | 8 | 7.364 | 10 | 12.819 | 2 | ||||
| 购物服务 | 6.920 | 11 | 8.960 | 4 | 8.499 | 1 | 7.202 | 11 | 9.123 | 4 | ||||
| 交通设施 | 8.638 | 3 | 7.469 | 6 | 8.346 | 2 | 8.762 | 1 | 7.120 | 7 | ||||
| 金融保险 | 11.358 | 1 | 4.956 | 13 | 8.048 | 4 | 8.472 | 3 | 5.197 | 11 | ||||
| 科教文化 | 8.193 | 5 | 6.942 | 9 | 7.784 | 6 | 8.621 | 2 | 5.250 | 10 | ||||
| 生活服务 | 8.050 | 6 | 5.711 | 12 | 7.779 | 7 | 8.036 | 6 | 4.028 | 12 | ||||
| 休闲体育 | 8.754 | 2 | 8.983 | 3 | 7.999 | 5 | 7.867 | 7 | 8.231 | 5 | ||||
| 医疗保健 | 7.181 | 10 | 7.303 | 7 | 7.669 | 9 | 8.464 | 4 | 3.983 | 13 | ||||
| 政府机构 | 7.725 | 8 | 7.044 | 8 | 7.130 | 10 | 7.681 | 8 | 7.061 | 8 | ||||
|
| 图 7 工作日到达与离开功能区域C0、C1、C2、C3、C4 Fig. 7 Workday arrival/departure regions of C0, C1, C2, C3, C4 |
|
| 图 8 周末到达与离开功能区域C0、C1、C2、C3、C4 Fig. 8 Weekend arrival/departure regions of C0, C1, C2, C3, C4 |
|
| 图 9 工作日和周末到达/离开功能区域的频次 Fig. 9 Frequency of arrival/departure of functional regions on weekdays and weekends |
3.2.1 商业服务设施及娱乐用地(C0)
从该区域POI数据的类型占比率可以看出,该功能区域具有以餐饮、购物、交通设施、金融服务及公司企业(主要为写字楼、商业大厦等)为主的兴趣点分布特征。北京市著名的商业购物地区西单和国贸也分布在其中,同时从具有交通流量特征的图 9可以看出该区域在工作日的下班时间段(17:00—20:00)会出现到达的流量高峰。说明很多居民下班后会来到该地区消费购物,参加娱乐活动,以释放工作压力。
3.2.2 风景名胜旅游区(C1)通过表 3可知在该区域内分布比例最高的兴趣点是风景名胜。从设施配置角度来看,该区域内公共设施、购物服务、交通设施等类型POI占有较大比率,符合风景名胜区存在较多公共厕所,购物超市和停车场的分布情况,是典型的风景区POI配置模式。通过流量分析,发现该区域的工作日和休息日的出行流量差别不大,早上基本没有出行高峰期,周末10:00—15:00之间存在较高的到达峰值。
3.2.3 公共管理及科研教育用地(C2)在该区域内存在较多科研机构和学校等POI信息(例如:清华大学、北京大学、北京理工大学、中国科学院大学等),与学校师生生活相关的购物服务、金融(主要为银行、ATM等)、住宅及运动相关的休闲体育等POI在该区域内也有一定的占比率。该分布模式,满足学校师生日常购物、存取钱、运动等基本生活需求。从流量分析来看,发现在工作日到达C2的的峰值出现在8:00—10:00, 而离开的峰值主要分布在17:00—18:00,这与学校学生的上下学的出行行为一致。同时区域间的流量分析来看,周末前往C0的人流比工作日的时候要略小但也相差不大。在工作日和休息日,前往C0的人流主要集中在10:00—18:00,这与当前大学生的生活情况较为一致。
3.2.4 成熟居住区(C3)该区域内兴趣点分布较广,且为居民生活服务的医疗保健、教育(科教文化)、交通设施、政府机构及社会团体、住宿等兴趣点配套均衡;满足居民日常生活的购物、餐饮和生活服务等设施也有一定的分布,是典型城市居民居住区的兴趣点分布。从流量分析来看,工作日8:00—9:00是居民出行高峰期,晚上20:00—21:00是居民回程高峰期。对于周末,居民的出行高峰主要在12:00—16:00, 回程高峰主要集中在下午。同时从区域间移动模式来看,工作日从C0到C3的人流量主要集中在17:00—20:00, 符合居民下班后会进行购物、娱乐等活动。从C0到C2的流量主要集中值在早上8:00—9:00, 该时间段是学生上学高峰期。
3.2.5 待开发工业区(C4)该区域主要分布在城区外围,沿城市的周边分布,符合待开发工业区的分布情况。同时该区域内具有以公司企业、购物和公共设施等为主的兴趣点分布特征,从交通流量来看,该区域内的流量较少,符合工业区对出租车吸引力较弱的特性。
3.2.6 未识别区域(C5)因其区域内的POI数目数据过少,不足以挖掘出共位模式和训练模型。所以,本文未对这个类型的区域进行分析。
4 结果分析 4.1 结果验证为了检验空间共位模式模型应用于城市功能区识别的效果,参考百度在线地图地理信息,将本文研究试验得到的功能区划分结果与北京市的百度在线地图、居民的出行特征进行对比分析。试验结果表明,引入空间共位模式的城市功能区识别方法对北京市主要功能分区能进行有效的识别。其中若干典型的对比区域见表 4。
| 对照项目 | 对比结果 |
| 对照区域 | 北京大学、清华大学等高校聚集区域 |
| 对照图 |
|
| 识别结果 | 识别图中A区域(红色)为科研教育区域与百度地图A区域一致 |
| 对照区域 | 圆明园、颐和园等风景名胜区域 |
| 对照图 |
|
| 识别结果 | B区域在百度地图中为风景名胜区域与识别图中的B区域(黄色)相互对应 |
| 对照区域 | 北京著名的商业中心——西单、国贸 |
| 对照图 |
|
| 识别结果 | 识别图中C区域(浅咖色)为商业用地与百度地图中的西单、国贸相对应 |
| 对照区域 | 北京市著名的居住区域——望京 |
| 对照图 |
|
| 识别结果 | 百度地图中的D区域与识别图中的居住区D区域(橙色)一致 |
| 对照区域 | 距离北京市著名工业园-宏大工业园较近的经开万佳国际机械厂 |
| 对照图 |
|
| 识别结果 | 识别图中的E(棕红色)区域为待开发工业区与对照图中的E区域相对应 |
| 对照区域 | 科研院所、学校聚集区域 |
| 对照图 |
|
| 识别结果 | 识别图中的F(红色)区域为教育用地与对照图中的F区域相对应 |
| 对照区域 | 科研院所、学校聚集区域 |
| 对照图 |
|
| 识别结果 | 识别图中的F(红色)区域为教育用地与对照图中的F区域相对应 |
4.2 有效性与准确度分析 4.2.1 方法的有效性分析
空间共位模式能够发现现实世界中具有强空间关系的空间特征子集,将其应用于城市POI,能够发现不同区域POI配置情况。该模型能够很好地挖掘POI潜在的上下文关系。为了验证POI空间分布对城市功能区识别的影响,本文采用两种流行的功能区识别方法与本文提出的方法进行对比分析,从不同的方面做对比,从侧面印证本文方法的有效性。
(1) LDA模型:基于主题建模对城市功能区进行划分,是目前较流行的方法。本文采用隐含狄利克雷分布[38](latent Drichilet allocation, LDA)对研究区域进行功能区划分,其识别结果如图 10(a)。该方法在一定程度上考虑了POI的语义信息,但本质上还是通过POI频数来推断区域功能。
(2) Word2Vec模型:基于LDA模型的方法只考虑了POI频数信息,忽略了POI的空间关联性,而Word2Vec模型顾及了POI空间分布关系中的线性位置关系[39],一定程度上增强了功能区识别效果。识别结果如图 10(b)所示。
从图 10的(a)、(b)、(c)可以看出LDA、Word2Vec及本文方法有相似的功能区输出,然而,仍然存在一些本文方法优于LDA和Word2Vec的区域。图 10(a)中A区域(颐和园)为风景名胜区域,D区域(清华大学)为教育区域,而LDA方法错误地将他们归为一类,C区域为中关村区域,这是中国的硅谷,很多科技公司的大厦聚集于此,是典型的商业区域。B为国贸商场是典型的购物、娱乐场所属于商业娱乐区域,它们没有被归为一类。E区域(望京地区)为典型的居住区域,错误将其和B区域当作同一类区域。在图 10(b)中可以看到区域A为圆明园遗址为风景名胜区域,B区域是天坛公园的所在地,也属于典型的风景名胜区域,在图 10(b)中将其分为不同类别,同时区域C和D分别为西单、商贸,均是典型的商业中心,也没有将他们分到一类。
与上面两种流行方法对比,本文提出的空间共位模式挖掘方法能够更好地顾及POI空间分布的关联性。它能够有效挖掘出一个POI同周围多个POI间的非线性空间关系,可以更好地挖掘POI潜在上下文关系,获取相对更加丰富的空间信息。如图 10(c)所示,对于LDA和Word2Vec模型分类错误或者分类不准确的区域,在本文方法中有较好的分类结果。
4.2.2 准确度分析为更好地量化比较不同方法对城市功能区的识别精度,本文随机选择了部分区域,并请具有一定地理知识背景的多名专家对其进行标注,以此作为该单元的标签。采用分类方法对试验区域进行分类,不同方法得到的识别精度见表 5。
| 分类方法 | 商业服务设施及娱乐用地 | 风景名胜旅游区 | 公共管理及科研教育用地 | 成熟居住区 | 待开发工业区 | 总体识别率 |
| 本文方法 | 84.21 | 76.92 | 73.33 | 85.71 | 50.00 | 80.37 |
| Word2Vec | 68.42 | 46.15 | 53.33 | 68.57 | 33.33 | 61.68 |
| LDA | 55.26 | 38.46 | 40.00 | 60.00 | 33.33 | 51.40 |
从表 5可以看出,在城市功能区识别中LDA方法表现最差。在此方法中特征值的获取在一定程度上依赖于POI的分布频数,忽略了POI间的空间关联性。相比较而言,Word2Vec通过构建词序在一定程度上顾及到了POI的线性位置关系,获得了较LDA更好的结果。线性空间关系能挖掘出的空间信息是有限的,相较而言非线性空间关系能表达更多的空间信息。通过分析,本文提出的方法能获得较高的识别精度,能很好地表达城市土地利用类型与POI的空间分布格局之间的关系。
5 结论本文采用空间共位模式来挖掘单元内POI间的非线性空间分布关系,根据单元内模式的参与率来对区域间的功能相似性进行度量。通过结合区域内POI类型比率、区域的交通流量分析及人为标注区域功能等辅助手段对城市功能区域进行识别,共得到6种类别的功能区,分别为商业服务设施及娱乐用地、风景名胜旅游区、公共管理及科研教育用地、成熟的居住区、待开发工业区及未分类区域。本研究基于北京市的POI数据和浮动车轨迹数据,通过数据采集、数据处理、模式挖掘和聚类、标注等一系列工作对北京市城市功能区进行了识别,并对试验结果进行检验。首先,针对北京市部分具有代表性的地块,将最终的识别结果与北京市百度地图进行对比,具有较好的吻合度。本文方法较LDA和Word2Vec具有较好的验证结果。其次,通过随机选择部分区域经具备一定地理背景的专家标注后对识别结果进行验证,发现本文方法具有较好的识别结果,对试验区域识别的整体准确率为80.37%,而Word2Vec和LDA的识别准确率略低,分别为61.78%、51.40%。由此可以看出,在顾及POI潜在上下文关系的条件下,本文方法对城市功能区识别可以得到更好的结果,也从侧面反映了POI空间分布信息对功能区识别的影响。
在本文中仅采用浮动车轨迹数据来探究人群出行行为,虽然能够在一定程度上反映出人群的出行规律,但是还不够全面,今后拟结合公交车数据、地铁数据等公共交通数据开展进一步研究。同时在本文的探究过程中,未考虑同一类别下不同等级的POI对功能分区的影响,这也值得进一步研究。此外,本文只考虑了区域的单一功能,而未考虑到区域大多是由不同功能按功能强度组合成的混合功能区域,在后续的工作中,区域的不同功能强度也是一个研究方向。
| [1] |
胡俊. 中国城市:模式与演进[M]. 北京: 中国建筑工业出版社, 1995. HU Jun. Chinese cities:patterns and evolution[M]. Beijing: China Architecture & Building Press, 1995. |
| [2] |
刘可心, 王龙.面向升级的城市规划发展思考[C]//规划60年: 成就与挑战——2016中国城市规划年会论文集(区域规划与城市经济).沈阳: 中国城市规划年会, 2016. LIU Kexin, WANG Long. Thinking on urban planning and development oriented to upgrading[C]//Urban Planning of the Past 60 Years: Proceedings of the Annual National Planning Conference 2016: Regional Planning and City Economy. Shenyang: Urban Planning Society of China, 2016. |
| [3] |
王卫华, 王开泳. 北京城市功能区演变与优化调控[J]. 中国名城, 2014(6): 32-37. WANG Weihua, WANG Kaiyong. The evolution and optimization control of function areas in Beijing[J]. China Ancient City, 2014(6): 32-37. DOI:10.3969/j.issn.1674-4144.2014.06.005 |
| [4] |
PEI Tao, SOBOLEVSKY S, RATTI C, et al. A new insight into land use classification based on aggregated mobile phone data[J]. International Journal of Geographical Information Science, 2014, 28(9): 1988-2007. DOI:10.1080/13658816.2014.913794 |
| [5] |
宋雪涛, 蒲英霞, 刘大伟, 等. 利用行人轨迹挖掘城市区域功能属性[J]. 测绘学报, 2015, 44(S1): 82-88. SONG Xuetao, PU Yingxia, LIU Dawei, et al. Mining urban functional areas using pedestrians' movement trajectories[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(S1): 82-88. DOI:10.11947/j.AGCS.2015.F048 |
| [6] |
TOOLE J L, ULM M, GONZÁLEZ M C, et al. Inferring land use from mobile phone activity[C]//Proceedings of the ACM SIGKDD International Workshop on Urban Computing. Beijing: ACM, 2012: 1-8.
|
| [7] |
JIANG Shan, ALVES A, RODRIGUES F, et al. Mining point-of-interest data from social networks for urban land use classification and disaggregation[J]. Computers, Environment and Urban Systems, 2015, 53: 36-46. DOI:10.1016/j.compenvurbsys.2014.12.001 |
| [8] |
LIU Xingjian, LONG Ying. Automated identification and characterization of parcels with OpenStreetMap and points of interest[J]. Environment and Planning B:Urban Analytics and City Science, 2016, 43(2): 341-360. |
| [9] |
RODRIGUES F, PEREIRA F C, ALVES A O, et al. Automatic classification of points-of-interest for land-use analysis[C]//GEO Processing 2012: the Fourth International Conference on Advanced Geographic Information Systems, Applications, and Services. Valencia: IARIA, 2012: 41-49.
|
| [10] |
TIAN Li, SHEN Tiyan. Evaluation of plan implementation in the transitional China:a case of Guangzhou city master plan[J]. Cities, 2011, 28(1): 11-27. DOI:10.1016/j.cities.2010.07.002 |
| [11] |
LONG Ying, SHEN Zhenjiang. Geospatial analysis to support urban planning in Beijing[M]. Berlin: Springer, 2015.
|
| [12] |
池娇, 焦利民, 董婷, 等. 基于POI数据的城市功能区定量识别及其可视化[J]. 测绘地理信息, 2016, 41(2): 68-73. CHI Jiao, JIAO Limin, DONG Ting, et al. Quantitative identification and visualization of urban functional area based on POI data[J]. Journal of Geomatics, 2016, 41(2): 68-73. |
| [13] |
邓悦.基于多源兴趣点数据的城市功能区划分方法研究[D].北京: 中国测绘科学研究院, 2018. DENG Yue. Research on urban function zone partition method based on multi-source interest point data[D]. Beijing: Chinese Academy of Surveying and Mapping, 2018. |
| [14] |
CHEN Zhanlong, GONG Xi, XIE Zhong. An analysis of movement patterns between zones using taxi GPS data[J]. Transactions in GIS, 2017, 21(6): 1341-1363. DOI:10.1111/tgis.12281 |
| [15] |
LIU Xi, GONG Li, GONG Yongxi, et al. Revealing travel patterns and city structure with taxi trip data[J]. Journal of Transport Geography, 2015, 43: 78-90. DOI:10.1016/j.jtrangeo.2015.01.016 |
| [16] |
LIU Xi, KANG Chaogui, GONG Li, et al. Incorporating spatial interaction patterns in classifying and understanding urban land use[J]. International Journal of Geographical Information Science, 2016, 30(2): 334-350. |
| [17] |
BANZHAF E, NETZBAND M. Monitoring urban land use changes with remote sensing techniques[M]//RICHTER M, WEILAND U. Applied Urban Ecology: A Global Framework. New York: John Wiley, 2011: 18-32.
|
| [18] |
HU Shougeng, WANG Le. Automated urban land-use classification with remote sensing[J]. International Journal of Remote Sensing, 2013, 34(3): 790-803. DOI:10.1080/01431161.2012.714510 |
| [19] |
LIU Jun, ZHOU Xiran, HUANG Junyi, et al. Semantic classification for hyperspectral image by integrating distance measurement and relevance vector machine[J]. Multimedia Systems, 2017, 23(1): 95-104. |
| [20] |
WEN Dawei, HUANG Xin, ZHANG Liangpei, et al. A novel automatic change detection method for urban high-resolution remotely sensed imagery based on multiindex scene representation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(1): 609-625. DOI:10.1109/TGRS.2015.2463075 |
| [21] |
WU Chen, ZHANG Lefei, ZHANG Liangpei. A scene change detection framework for multi-temporal very high resolution remote sensing images[J]. Signal Processing, 2016, 124: 184-197. DOI:10.1016/j.sigpro.2015.09.020 |
| [22] |
ZHANG Xiuyuan, DU Shihong. A linear Dirichlet mixture model for decomposing scenes:application to analyzing urban functional zonings[J]. Remote Sensing of Environment, 2015, 169: 37-49. DOI:10.1016/j.rse.2015.07.017 |
| [23] |
ZHANG Xiuyuan, DU Shihong, WANG Yichen. Semantic classification of heterogeneous urban scenes using intrascene feature similarity and interscene semantic dependency[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(5): 2005-2014. DOI:10.1109/JSTARS.2015.2414178 |
| [24] |
LIU Xiaoping, HE Jialv, YAO Yao, et al. Classifying urban land use by integrating remote sensing and social media data[J]. International Journal of Geographical Information Science, 2017, 31(8): 1675-1696. DOI:10.1080/13658816.2017.1324976 |
| [25] |
TU Wei, CAO Jinzhou, YUE Yang, et al. Coupling mobile phone and social media data:a new approach to understanding urban functions and diurnal patterns[J]. International Journal of Geographical Information Science, 2017, 31(12): 2331-2358. DOI:10.1080/13658816.2017.1356464 |
| [26] |
YUAN Jing, ZHENG Yu, XIE Xing. Discovering regions of different functions in a city using human mobility and POIs[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Beijing: ACM, 2012: 186-194.
|
| [27] |
SCHWENK H. Continuous space language models[J]. Computer Speech & Language, 2007, 21(3): 492-518. |
| [28] |
YAO Yao, LI Xia, LIU Xiaoping, et al. Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model[J]. International Journal of Geographical Information Science, 2017, 31(4): 825-848. DOI:10.1080/13658816.2016.1244608 |
| [29] |
张铮, 王艳平, 薛桂香. 数字图像处理与机器视觉:Visual C++与Matlab实现[M]. 北京: 人民邮电出版社, 2010. ZHANG Zheng, WANG Yanping, XUE Guixiang, et al. Digital image processing and machine vision:Visual C++ and Matlab implementation[M]. Beijing: Posts & Telecom Press, 2010. |
| [30] |
SHEKHAR S, HUANG Yan. Discovering spatial co-location patterns: a summary of results[C]//Proceedings of the 7th International Symposium on Advances in Spatial and Temporal Databases. Redondo Beach: Springer, 2001.
|
| [31] |
FLOUVAT F, VAN SOC J F N, DESMIER E, et al. Domain-driven co-location mining[J]. Geoinformatica, 2015, 19(1): 147-183. |
| [32] |
YAMADA I, THILL J C. Local indicators of network-constrained clusters in spatial point patterns[J]. Geographical Analysis, 2007, 39(3): 268-292. DOI:10.1111/j.1538-4632.2007.00704.x |
| [33] |
THURSTAIN-GOODWIN M, UNWIN D. Defining and delineating the central areas of towns for statistical monitoring using continuous surface representations[J]. Transactions in GIS, 2010, 4(4): 305-317. |
| [34] |
YU Wenhao. Spatial co-location pattern mining for location-based services in road networks[J]. Expert Systems with Applications, 2016, 46: 324-335. DOI:10.1016/j.eswa.2015.10.010 |
| [35] |
HUANG Y, SHEKHAR S, XIONG H. Discovering colocation patterns from spatial data sets:a general approach[J]. IEEE Transactions on Knowledge and Data Engineering, 2004, 16(12): 1472-1485. DOI:10.1109/TKDE.2004.90 |
| [36] |
谷岩岩, 焦利民, 董婷, 等. 基于多源数据的城市功能区识别及相互作用分析[J]. 武汉大学学报(信息科学版), 2018, 43(7): 1113-1121. GU Yanyan, JAO Limin, DONG Ting, et al. Spatial distribution and interaction analysis of urban functional areas based on multi-source data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(7): 1113-1121. |
| [37] |
李娅, 刘亚岚, 任玉环, 等. 城市功能区语义信息挖掘与遥感分类[J]. 中国科学院大学学报, 2019, 36(1): 56-63. LI Ya, LIU Yalan, REN Yuhuan, et al. Semantic information mining and remote sensing classification of urban functional areas[J]. Journal of University of Chinese Academy of Sciences, 2019, 36(1): 56-63. |
| [38] |
BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2012, 3(4-5): 993-1022. |
| [39] |
MIKOLOV T, SUTSKEVER I, CHEN Kai, et al. Distributed representations of words and phrases and their compositionality[C]//Proceedings of the 26th International Conference on Neural Information Processing Systems: vol 2. Nevada: ACM, 2013: 3111-3119.
|



