文章快速检索  
  高级检索
格式塔原则与图形凸分解结合的建筑物群直线模式识别方法
魏智威1,2, 丁愫3, 童莹4, 程璐4, 刘洋4     
1. 中国科学院网络信息体系技术重点实验室, 北京 100830;
2. 中国科学院空天信息创新研究院, 北京 100830;
3. 浙江农林大学环境与资源学院, 浙江 杭州 311300;
4. 武汉大学资源与环境科学学院, 湖北 武汉 430079
摘要:建筑物群空间分布模式是重要的城市结构特征。以往研究多基于格式塔原则将建筑物作为整体认知分布模式, 忽略了从建筑物局部到整体的视觉认知过程而导致模式的漏识别。本文提出结合格式塔原则和图形凸分解识别直线模式方法: 首先, 基于三元组和格式塔原则定义直线模式; 其次, 结合图形凸分解识别直线模式, 图形分解时顾及了建筑物图形的直角化特征。试验结果表明, 本文方法能有效识别建筑群中直线模式, 相比已有直线模式识别方法准确率和召回率分别提高了15.7%和30.5%。
关键词空间分布    建筑物    直线模式    凸分解    格式塔原则    
Linear building pattern recognition combining Gestalt principles and convex polygon decomposition
WEI Zhiwei1,2, DING Su3, TONG Ying4, CHENG Lu4, LIU Yang4     
1. Key Laboratory of Network Information System Technology, Institute of Electronic, Chinese Academy of Sciences, Beijing 100830, China;
2. The Aerospace Information Research Institute, Chinese Academic of Sciences, Beijing 100830, China;
3. College of Environmental and Resource Science, Hangzhou 311300, China;
4. School of Resources and Environment Science, Wuhan University, Wuhan 430079, China
Abstract: Building patterns are important local structures characterizing urban areas. Building patterns in previous studies are mostly recognized based on the Gestalt principles in which buildings are considered as a whole. However, human vision is also proved as a parts-based system, and some visually aware patterns may fail to be recognized with the existing methods. This paper first combines Gestalt principles and the convex polygon decomposition to recognize linear patterns. First, the linear patterns are defined based on the triples and Gestalt principles. Second, linear patterns are recognized combining the convex polygon decomposition, and the buildings' orthogonal features are considered in their decomposition. The experimental results show that proposed method is effective to recognize the linear patterns in study area. Compared with the existing methods, the accuracy and recall have increased by 15.7% and 30.5%, respectively.
Key words: spatial distribution    building    linear pattern    convex decomposition    Gestalt principles    

分布模式是重要的空间结构特征,它表达了地理要素在空间内呈现出的特定组织规律[1]。建筑物是地图表达的基础地理要素,建筑物群空间分布模式提取是城市空间理解[2-3]、城市三维模型可视化[4-5]、地图自动综合[6-9]等领域研究的重要问题。

建筑物群空间分布模式提取主要包括建筑物群聚类与模式识别。基于邻近图聚类,文献[10]利用建筑物间距离进行聚类;文献[5, 1113]在此基础上考虑了建筑物间大小、形状等的相似性;文献[14]则结合了城市形态学特征;文献[1]则考虑了建筑物的语义特征。另外,文献[1518]将能量最小化、神经网络等智能化方法用于建筑物群聚类。建筑物聚群中有时会存在特殊的空间排列,基于模板匹配方法,文献[19]识别了简单直线排列;文献[2021]分别基于建筑物间空间关系定义了H型、T型、E型、L型、Z型、阶梯形和格网型模板。文献[2223]基于邻近图分别提出了用于建筑物群典型化的格网型排列识别方法;文献[24]通过对最小生成树邻近图(minimum spanning tree,MST)剪枝,实现了直线型排列和曲线型排列的识别;文献[25]则基于邻近图和stroke约束探测线性模式;文献[2627]基于邻近图剪枝,识别了多连通直线型排列和格网型排列;文献[28]从空间推理出发,提出了建筑物空间排列的层次识别方法;文献[2930]则对比了不同邻近图识别线性模式的适用性。另外,文献[3132]将随机森林和图卷积神经网络等智能化方法用于识别建筑物群模式。

上述研究主要是基于格式塔原则,认为满足空间邻近、几何相似和分布连续的建筑物群组在视觉判断上更易被归为整体构造,即分布模式[12]。其中,格式塔原则要求的整体是指虚构形体的完整性,并非要求目标自身必须保持完整。但是,已有研究均将建筑物作为整体基于格式塔原则提取排列,导致提取的排列有时存在断裂、遗漏等问题。另外,建筑物形态日趋复杂,有时从整体上表达复杂图形相对困难。实验心理学研究表明,人眼视觉认知遵循格式塔原则的同时,也存在部分与整体的关系。凸多边形是视觉认知的几何基元,人类会将图形分解为凸或近似凸的多边形进行认知,如身体姿态估计和手势识别等[33-34]。同时,建筑物图形凸分解已成功应用于城市三维模型可视化[35]、建筑物复杂空间关系表示[36]和室内建筑物通风效果评估[37]等。因此,基于格式塔原则提取建筑物群分布模式有时需要分解图形,以保持视觉认知上虚构形体的完整性。直线模式是一种典型的空间分布模式,是其他建筑物群模式识别的基础。本文试图结合图形凸分解识别建筑物群直线模式,其中,组成直线模式的元素既可以是建筑物,也可以是建筑物局部。

1 建筑物群直线模式定义

建筑物群直线模式表现为一组满足格式塔原则(相似、邻近)的沿直线排列建筑物[14]。首先,定义建筑物间“邻近”“相似”和“沿直线排列”的空间关系;其次,定义直线模式。

1.1 建筑物邻近关系

相对邻近图(relative neighborhood graph,RNG)能用更少边较完整地体现建筑物群的直线排列关系[30],本文利用RNG表达建筑物间邻近关系。RNG构建过程如下:首先,基于约束性三角网建立骨架线模拟建筑物“势力范围”,依据共享同一段骨架线的建筑物相互邻近构建邻近图,约束性三角网和骨架线构建时考虑了外围街区块边界多边形的约束,如图 1(a)(b)所示;其次,基于邻近图生成RNG,如图 1(c)所示。RNG可表示为G=(E, V),V为顶点集合V={v1, v2, …, vm},vm对应建筑物BmE为边集合E={e(vi, vj), viV, vjV},e(vi, vj)表示建筑物BiBj邻近,记为P(Bi, Bj);e(vi, vj)长度(Le)为建筑物BiBj间最短距离。考虑到分解后邻接的两建筑物间最短距离可能为0,若LeTd,则Le=TdTd为阈值,可依据地图上图形之间可辨识的最小距离阈值确定(一般设为0.2 mm)[11]。另外,RNG需依据图形分解结果进行实时调整,过程如下:将分解后图形以距离ε向内做缓冲区,ε为极小值(如0.1 mm);依据缓冲区处理结果对区域内建筑物重新构建三角网和骨架线生成对应的邻近图和RNG,如图 1(d)所示。

图 1 建筑物邻近关系 Fig. 1 Proximity relations between buildings

1.2 建筑物相似关系

建筑物相似性可以用建筑物间大小、方向和形状的相似性表示,定义见表 1[13, 30]。建筑物BiBj相似记为S(Bi, Bj)

(1)
表 1 相似性约束参数 Tab. 1 The measures for building similarity
参数 描述 计算方法
Ar 建筑物(BiBj)的面积差异 Ar=max(Areai, Areaj)/min(Areai, Areaj),Areai和AreajBiBj面积
Or 建筑物(BiBj)的最小绑定矩形方向差异 ,Orii和OrijBiBj最小绑定矩形方向
Er 建筑物(BiBj)的边数差异 EAr=max(ECi, ECj)/min(ECi, ECj),ECi和ECjBiBj边数

式中,δ1δ2δ3为阈值。

1.3 建筑物沿直线排列关系

建筑物沿直线排列可以用RNG两邻接边的方向差异和距离差异表示,定义见表 2[30]。建筑物三元组{Bi, Bj, Bk}沿直线排列记为Str(Bi, Bj, Bk)

(2)
表 2 直线排列约束参数 Tab. 2 The measures for linear building arrangements
参数 描述 计算方法
Do RNG邻接边e(vi, vj)和e(vj, vk)的方向差异 e(vi, vj)和e(vj, vk)的夹角
DL RNG邻接边e(vi, vj)和e(vj, vk)的长度差异 DL=max(Leiij, Lejk)/min(Leij, Lejk),Leij和Lejke(vi, vj)和e(vj, vk)长度

式中,η1η2为阈值。

1.4 直线模式

直线模式是一组满足格式塔原则(相似、邻近)的沿直线排列建筑物,可看成是由一个或多个存在2个重复元素的直线模式基元组合而成,直线模式基元定义见式(3)[14, 28]

(3)

式中,建筑物BiBjBk既可以是独立建筑物,也可以是图形凸分解后获取的建筑物。考虑到人眼视觉认知负担,视觉认知直线模式基元不会同时分解多个多边形,规定:建筑物BiBjBk中最多只能有一个是凸分解后获取的建筑物。依据式(3)定义,直线模式基元即为一个最简单的直线模式,任意存在2个重复元素的直线模式基元则需合并为更长的直线模式。

2 结合图形凸分解的建筑物群直线模式识别原理

依据式(3)定义,直线模式基元是构成直线模式的基础。因此,直线模式识别需首先探测建筑物群中直线模式基元;其次,合并其中存在2个重复元素的直线模式基元。本文结合图形凸分解识别直线模式,考虑到建筑物图形可能存在多种凸分解结果,需结合建筑物的不同凸分解结果探测可能存在的所有直线模式基元。式(3)规定:构成直线模式基元的元素最多只有一个是凸分解后建筑物,故分解不同建筑物图形探测直线模式基元的过程相互独立。

依据上述分析,本文结合图形凸分解识别建筑物群中直线模式过程如下:①获取不同建筑物图形凸分解的候选分割线集合;②获取不同分割线组合条件下的建筑物图形分解结果,依据式(3)定义探测建筑物群中不同分解结果下可能存在的所有直线模式基元;③依据图形不同分解结果获取的直线模式基元确定图形的最佳分解,依据图形的最佳分解确定直线模式基元识别结果,合并其中存在2个重复元素的直线模式基元。

2.1 建筑物图形凸分解的分割线集合

图形凸分解是利用分割线消除图形中凹点,并将图形分解为若干个凸或近似凸的多边形[33]。建筑物是典型人造地物,具有多直角表达的形态特点,建筑物图形凸分解需尽量保持其直角结构。给定建筑物图形Bm,组成建筑物的多边形集合记为BPS={Pb, Ph1, Ph2, …, Phn},PbBm外轮廓,PhnBm的洞(或岛),PbPhn的节点集合记为PVS={v1, v2, …, vk},其中,Pb节点集合中节点逆时针排列,Phn节点集合中节点顺时针排列。若点vk+1在边vk-1vk的左(右)侧,称vk为凸(凹)点,如图 2(a)中点v3v6v9v14;节点vk处角度(Anglek)为边vk-1vk绕节点vk逆时针旋转至边vkvk+1角度,若|Anglek-90| < α ∨|Anglek-270| < α,则Anglek为直角,α=10。

图 2 建筑物图形凸分解的分割线 Fig. 2 The cutlines for building decomposition

约束性三角网实现了图形无重叠、无缝隙的三角单元覆盖,图形内任意一条三角网边均能分解图形为两部分,且该边具备“最邻近连接”特征[38]。因此,采用文献[39]中节点加密策略对建筑物图形节点进行加密后构建约束性三角网,图形内部连接凹点的三角网边作为候选分割线,如图 2(a)中连接凹点v3v6v9v14的三角网边。加密阈值为EL/6,EL为建筑物图形边的平均长度。考虑到建筑物图形特点和凸分解要求,上述分割线需进行如下调整:

(1) 考虑到建筑物图形可能存在的直角结构,若分割线分解图形后破坏原图形中直角,需删除该分割线。定义如下:存在分割线Cp,关联建筑物节点vkvk处角度Anglek为直角,利用Cp分解图形后获取的多边形中对应节点vk的节点角度分别为Angle′k和Angle″k,若Angle′k或Angle″k不是直角或不接近180°,则需删除Cp;Angle′k接近180°定义是|Angle′ k-180|≤ββ=3。如图 2(a)所示,边v3v6v3v14v6v9v6v14v9v13v9v14因会破坏原图形中直角而需删除。

(2) 分割线分解图形后需要能消除原图形中凹点,即若存在分割线Cp,利用Cp分解图形后凹点数量未减少,则Cp需删除。如图 2(a)所示,采用边v3v4v3v14v6v7v9v10分解图形后,分解后获取的图形凹点总数量未减少,故需删除。

(3) 考虑到图形凸分解的目的是利用分割线消除图形凹点。若连接两凹点的边分解图形后能消除其关联的两凹点,其是可行分割线,应补充至分割线集合中。如图 2(b)所示,采用边v3v9v6v14分解图形后,边关联的两个凹点均被消除,故边v3v9v6v14是可行分割线。

依据上述定义,可获取消除给定建筑物图形Bm中凹点的可行分割线集合CS={C1, C2, …, Cp}。如图 2(c)所示,虚线连接边即为图 2(c)所示建筑物的可行分割线集合;图形凸分解即从集合CS中选择满足约束条件的k条分割线将Bm分解为若干个多边形。需要说明的是:本文结合图形凸分解识别建筑物直线模式,选取分割线分解图形的目的是获取满足分解约束条件且能与邻近图形构成直线模式的多边形,并非要求将图形严格分解为若干个凸多边形。

2.2 结合图形凸分解的直线模式基元探测

给定建筑物图形Bm,其可行分割线集合为CS={C1, C2, …, Cp},从CS中选择满足约束条件的k条分割线SubCSx={C1, C2, …, Ck}分解图形Bm的结果为SubBSx={SubB1, SubB2, …, SubBk+1},若SubBy∈SubBSx与邻近建筑物构成直线模式基元,则SubBSx为一个有效分解。考虑到人眼视觉认知负担,视觉认知图形时通常不会将图形分解为较多零散多边形,即kTkTk为阈值[34]。另外,图形凸分解存在一些通用约束原则:如同一凹点不会被分解两次、分割线不能交叉等[33]。因此,结合SubBSx探测直线模式基元可表达为获取满足约束条件的排列组合问题,约束条件如下:

(1) kTkTk为阈值;

(2) SubCSx={C1, C2, …, Ck}中任意两条分割线不交叉;

(3) SubCSx={C1, C2, …, Ck}中任意两条分割线消除的凹点不完全相同;

(4) SubBy∈SubBSx,使得By与邻近建筑物构成直线模式基元。

图 3建筑物为例,其候选分割线集合为{v2v14, v3v5, v3v9, v6v8, v6v14, v9v11, v9v12},分割线间关系可以表达为弧长链接图,如图 3所示;从CS中选择k条分割线时,弧长链接图中存在连接关系的两条分割线不能被同时选取,如已选择分割线v3v9,分割线v6v14不能被选取。假设从CS中选择3条分割线分解图形,{v2v14, v3v9, v6v8}为满足约束条件(1)、(2)和(3)的分割线集合;其次,依据选择的分割线集合分解图形,判断分解结果中是否存在多边形与邻近建筑物构成直线模式基元。

图 3 可行分割线间关系表示 Fig. 3 The relations between cutlines

因此,给定建筑物集合BS={B1, B2, …, Bm},对应RNG为G=(E, V),V={v1, v2, …, vm},E={e(vi, vj), viV, vjV},建筑物BnBS的分割线组合记为SubCSx,分解结果为SubBSx,结合图形凸分解的直线模式基元识别过程见算法1。

算法1:直线模式基元识别算法

输入:BS={B1, B2, …, Bm},G=(E, V)

输出:直线模式基元集合LS

初始化:存储RNG边关联的二元建筑物集合S2a=Null,存储RNG中1阶邻近的二元建筑物集合S2-a=Null,RNG备份CacheG=G

Foreach e(vi, vj)∈E Do

    If S(Bi, Bj) Then添加(Bi, Bj)至S2a

Foreach e(vi, vn)∈Ee(vn, vj)∈E Do

    If S(Bi, Bj) Then添加(Bi, Bj)至S2-a

Foreach (Bi, Bj)∈S2a Do

    Foreach e(vn, vi)∈Ee(vj, vn)∈E Do

        If (Bi, Bj, Bn)构成直线模式基元Then添加(Bi, Bj, Bn)至LS

            Else Foreach SubCSx for Bn Do

                更新G=(E, V)

                If By∈SubBSx, 使得(Bi, Bj, By)构成直线模式基元Then

                    添加(Bi, Bj, By)至LS

                G=CacheG

Foreach (Bi, Bj)∈S2-a Do

    Foreach e(vi, vn)∈Ee(vn, vj)∈E Do

        Foreach SubCSx for Bn Do

            更新G=(E, V)

            If By∈SubBSx, 使得(Bi, By, Bj)构成直线模式基元Then

                添加(Bi, By, Bj)至LS

            G=CacheG

删除LS中重复的元素;

Return LS

2.3 直线模式识别

2.2节已结合图形凸分解获取了所有可能直线模式基元。但是,对于建筑物多边形Bm,可能存在多个满足2.2节定义约束条件的分解结果AS={SubBS1, SubBS2, …, SubBSn},需确定Bm的最佳分解以获取最终的直线模式基元识别结果;其次,组合存在2个重复元素的直线模式基元。对于SubBSxAS,存在以下两种情况:

(1) 存在多个SubBSxAS,使得By∈SubBSx与邻近建筑物构成直线模式基元,如图 4(a)所示,存在分割线集合{Cut1}、{Cut2}和{Cut1, Cut2}均满足分解结果与邻近建筑物B1B2构成直线模式基元。考虑到人眼视觉负担,若SubBSxAS对应的分割线集合{C1, C2, …, Ck}中分割线数量越小,则SubBSx越优,即{Cut1}和{Cut2}较{Cut1, Cut2}更优[34];若分割线数量相同,则分割线总长度越短,则SubBSx越优,即{Cut2}较{Cut1}更优。

图 4 存在多个满足约束条件分解结果的凹多边形示例 Fig. 4 The concave polygons which have different cutting results

(2) 存在多个SubBSxAS,使得By∈SubBSx与邻近建筑物构成多个直线模式基元,如图 4(b)所示, 基于{Cut3}获取的分解结果与邻近建筑物B3B4构成直线模式基元,基于{Cut4}获取的分解结果与邻近建筑物B5B6构成直线模式基元,基于{Cut3, Cut4}获取的分解结果与邻近建筑物B3B4B5B6均构成直线模式基元。若基于SubBSxAS能获取更多直线模式基元,则SubBSx越优,即{Cut3, Cut4}较{Cut3}、{Cut4}更优。

基于式(3)定义,不同建筑物多边形的分解相互独立,确定不同建筑物多边形的最佳分解不是全局优化问题,可以依次依据SubBSx属性确定对应多边形的最佳分解,SubBSx属性定义见表 3。基于情况(1)和(2)分析,分解结果SubBSx优劣(Accept_Value)与SubBSx的Pat_Count、Cut_Count和Cut_Length属性相关;其中,Pat_Count最重要,Cut_Count次之,Cut_Length最不重要,Accept_Value定义见式(4)

(4)
表 3 分解结果SubBSx的属性 Tab. 3 The properties for SubBSx
字段 描述
ID 唯一标识符
Cut_Set 获取分解结果SubBSx对应的分割线集合{C1, C2, …, Ck}
Cut_Count {C1, C2, …, Ck}中分割线数量
Cut_Length {C1, C2, …, Ck}中分割线总长度
Pat_Set 结合SubBSx获取的直线模式基元集合{LP1, LP2, …, LPl}
Pat_Count {LP1, LP2, …, LPl}中直线模式基元数量

式中,λ1λ2λ3为权重,满足α1α2α3

假设当前研究区域需分解的建筑物图形集合为BS={B1, B2, …, Bm},BmBS满足2.2节中约束条件的分解结果集合记为AS={SubBS1, SubBS2, …, SubBSn},依据式(4),Accept_Value最大的SubBSxASBm的最佳分解。基于最佳分解结果获取直线模式基元,依据前文中直线模式定义,合并存在2个重复元素的直线模式基元,合并结果即为最终识别的直线模式。

3 本文方法的有效性评价与参数敏感性分析 3.1 本文方法的可靠性评价

选择Ordnance Survey(OS)开源提供的街道层次地图局部为试验数据,建筑物1046个,道路171条,如图 5所示。试验参数设置:δ1=2, δ2=20, δ3=1.3, η1=160,η2=2,Tk=2,直线模式识别结果如图 5(a)所示;局部放大结果如图 5(b)(e)所示。共分解建筑物39个(其中,存在非直角建筑物11个),这表明本文方法能有效分解直角和非直角化建筑物;识别直线模式117个。为评价本文方法可靠性,将本文方法识别结果与人眼视觉认知结果对比。人眼视觉认知结果获取方法如下:在告知建筑物图形可分解前提下,由6名从事地图学研究的硕(博)士生依据视觉感知各自勾选出试验区域中的直线模式,合并6人视觉认知结果作为最终视觉认知结果(认知一致的直线模式直接合并,认知不一致的直线模式依据6人投票后确定)。若识别的直线模式与人视觉认知一致,记为tp;若识别的直线模式与人视觉认知不一致,记为fp;漏识别的直线模式记为fn[28]。另外,直线模式识别结果与视觉认知结果可能存在局部一致的情况,若视觉认知获取的直线模式为识别结果的一部分,记为tpp;若识别的直线模式为视觉认知结果的一部分,记为fpp;记入fpp和tpp的直线模式不重复记入tp、fp和fn。直线模式识别准确率(Accuracy)和召回率(Recall)定义见式(5)和式(6),结果见表 4

(5)
(6)
图 5 结合图形凸分解的直线模式识别结果 Fig. 5 The linear pattern recognition results by using polygon decomposition

表 4 直线模式识别结果统计分析 Tab. 4 The statistical results for linear building pattern recognition results
识别结果 tp tpp fp fpp fn Accuracy/(%) Recall/(%)
Pattern* 112 1 1 2 1 96.6 96.6
Pattern** 76 0 0 18 21 80.9 66.1
注:*表示结合图形凸分解的直线模式识别结果;* *表示未结合图形凸分解的直线模式识别结果。

表 4可知,结合图形凸分解能识别试验区域内大部分直线模式(Recall为96.6%),同时,能实现较高的准确率(96.6%),识别结果符合视觉认知。

其中,本文识别方法获取的结果与视觉认知可能存在部分不一致,如图 5(b)(e)中直线模式P1-P5。本文设置δ1=2,严格限制了直线模式中邻近建筑物间面积差异,故P1只能识别部分;若设置δ1=3,则P1能被识别。另外,P2无法被识别是由于本文规定消除相同凹点的分割线不能被同时选取;若不考虑该原则,则P2能被识别,但可能误识别直线模式P6P3P4误识别是由于B4中凹点凹度小,而识别直线模式P3P4对应分割线长度长,即凸分解结果不符合视觉认知。若图形凸分解时设置凹度阈值TC,即凹度大于TC的凹点才存在分割线,则不会误识别P3P4。另外,P5只能识别部分是因为其不符合本文直线模式定义。

3.2 本文方法的有效性评价

本文直线模式识别方法以文献[28]为基础,为验证结合图形凸分解识别直线模式的有效性,基于相同方法在不分解建筑物图形条件下识别试验区域中的直线模式,与本文方法的对比结果见表 4。由表 4可知,若不分解建筑物图形识别直线模式,有21个直线模式无法识别,18个直线模式只能识别部分,相比本文方法准确率低15.7%,召回率低30.5%。

同时,选择试验区域中3个典型区域对比分析本文方法有效性,如图 6所示。如图 6(a)所示,分解建筑物B1B4能获取直线模式P1P5,且这些模式在视觉上均具有明显的直线排列特点;若不分解建筑物B1B4,则P4P5无法被识别、P1P3只能识别部分。同理,若不分解对应建筑物,图 6(b)图 6(c)中直线模式P6P7P9P10P12无法被识别;P8P11只能识别部分;而结合图形凸分解以上模式均能被识别,且这些模式在视觉上均具有明显的直线排列特点。由图 6可知,上述区域均有建筑物图形局部异质的特点,这一定程度上说明相比已有方法,本文方法能更有效地识别建筑物局部异质区域中直线模式。

图 6 结合图形凸分解识别直线模式对比 Fig. 6 The comparisons by using polygon decomposition

另外,本文仅分解邻近范围内存在相似建筑物的多边形识别直线模式,如图 6(a)图 6(b)中建筑物B1B5被分解,而图 6(b)中建筑物B6等则未被分解。若同时分解建筑物B5B6,基于式(3)能识别直线模式P13,但是,该模式无法被视觉感知。这说明人眼认知直线模式时,为有效降低视觉认知负担,只会分解研究区域中的部分凹多边形。

3.3 参数的敏感性分析

本文方法涉及较多参数设置,不同参数设置对直线排列识别结果影响较大,3.1节中试验参数为经过试验对比设置的经验阈值。

(1) η1η2表达了建筑物沿直线排列的约束条件,若η1η2取值过大,可能导致识别的直线模式结构杂乱,如设置η1=150,则图 7(a)(e)中虚线连接的建筑物会被识别为直线模式的一部分,与视觉认知不符。若η1η2取值过小,则会漏识别直线模式,如设置η1=175,则图 7(b)(c)中虚线连接的建筑物会被认为不构成直线模式,与视觉认知不符。经过试验对比,实际应用中取η1=160,η2=2较为合适[24-29]

图 7 参数分析 Fig. 7 Parameters analysis

(2) δ1δ2δ3表达了建筑物图形间相似程度的约束条件,若δ1δ3取值较大,则面积或形状差异大的建筑物可能被识别为直线模式,如设置δ1=3,则图 7(f)中虚线连接的面积差异较大的建筑物会被识别为直线模式的一部分,与视觉认知不符。若δ2取值较大,则识别的直线排列可能较曲折,如设置δ2=30,则图 7(d)中虚线连接的方向差异较大的建筑物会被识别为直线模式的一部分,不符合视觉认知。需要说明的是,基于不同需要直线模式定义不一样,如参考文献[24],图 7(f)中排列会被认为是沿道路的线性模式,无须考虑δ1δ3取值;参考文献[25],若识别锯齿状线性排列时,δ2有时也可能取较大值,以上直线模式均不在本文讨论范围。实际应用中应依据需要和研究区域中建筑物图形特征确定参数阈值,若研究区域中建筑物图形较为规则且图形相对简单,则δ1δ2δ3应取值较小,如本文取值δ1=2、δ2=20和δ3=1.3;否则,参数阈值可适当扩大。

(3) Tk约束图形凸分解的分割线数量,若Tk取值较小,可能存在漏识别;如设置Tk=1,则图 7(g)中直线模式P1会被漏识别;若Tk取值较大,依据2.1节定义,待判断的分割线组合较多,会导致识别过程耗时。同时,考虑到人眼视觉认知负担,人视觉认知图形时通常不会将图形分解为较多零散多边形[34]。另外,建筑物图形通常较为规则,且建筑物一定邻近范围的直线模式个数有限:经过试验对比,实际应用中取Tk=2或Tk=3较为合适。

4 讨论 4.1 建筑物形态影响

不同地区建筑物形态各异,可能影响直线模式的识别。选择OS开源提供的街道层次地图中包含复杂建筑物的局部区域(建筑物404个,道路104条)为试验数据,试验参数不变,直线模式识别结果如图 8所示:共凸分解建筑物8个,识别直线模式18个;其中,11个为结合图形凸分解才能识别的直线模式。由图 8可知,以上直线模式均符合视觉认知,这表明本文方法针对复杂图形仍能有效识别直线模式。但是,需要说明的是:①复杂建筑物较多的区域,建筑物通常排列不规则,直线模式较少,如图 8中区域Area_1和Area_2;同时,分解复杂建筑物获取的与邻近图形构成直线模式的建筑物通常形状并不复杂;②本文利用边数差异度量图形相似性可能不适用于复杂图形,如图 8中建筑物B1B2边数相近,但B1B2形状不相似,针对包含复杂建筑物的区域需要利用转角函数等复杂指标度量建筑物间形状相似性;③复杂图形通常存在较多凹点,依据2.1节定义,其可行分割线较多,因此,识别直线模式时可能存在较多待判断的分割线组合,识别过程耗时。为有效提高直线模式识别效率,需针对复杂图形设计提高效率的策略,如只针对分解后可能存在直线模式的分割线进行判断。

图 8 结合图形凸分解的复杂图形区域直线模式识别结果 Fig. 8 The recognized linear patterns in area with complex buildings by using polygon decomposition

另外,统计OS开源提供的街道层次地图中765 961个建筑物图形形状特征,包括建筑物数量(BC)、平均面积(AveArea)、平均边数(AveEC)、边数小于等于8的建筑物占比(ER8)和直角占比(RR),结果见表 5。由表 5可知,AveEC为4.47,且ER8为98.03%,说明大部分建筑物图形相对简单;同时,RR为96.06%,这表明建筑物呈现出明显的多直角表达形态特征。因此,本文方法针对建筑物图形具有较好的适用性。

表 5 建筑物图形特征统计 Tab. 5 The statistical results for characteristics of buildings
BC AveArea/m2 AveEC ER8/(%) RR/(%)
765 961 216.94 4.47 98.03 96.06

4.2 其他类型建筑物群模式识别

已有建筑物模式识别方法通常将建筑物作为整体考虑,本文结合图形凸分解成功识别了直线模式。若将分解后建筑物也认为是独立建筑物,就能利用现有建筑物模式识别方法结合图形凸分解识别其他类型建筑物群模式,如C型、T型模式。参考文献[21]中方法,在分解后建筑物图形中识别C型和T型模式,结果如图 9(a)(b)所示;其中,C型模式P1P4和T型模式P5P6是结合图形凸分解才能获取的模式;同时,这些模式一定程度上符合视觉认知。

图 9 结合图形凸分解的字母型模式识别结果 Fig. 9 The letter-like pattern recognition results using polygon decomposition

5 结论

建筑物图形表达具有整体相似和局部差异化特点,为有效提取建筑物群中直线模式,本文既考虑了视觉认知结构整体性的格式塔原则,又结合图形凸分解顾及了图形从局部到整体的视觉认知过程。试验结果证明,本文方法能更有效地识别建筑物群中直线模式,识别结果符合视觉认知。同时,本文方法也可用于其他类型建筑群模式的识别,为结合图形凸分解从局部认知地理图形提供了重要支撑。但是,视觉认知模式具有较大的灵活性,本文基于参数和邻近图严格定义直线模式有时会导致部分模式的漏识别和误识别。另外,随着地理信息内容的逐渐丰富,融合语义信息和机器学习方法识别建筑物群模式是未来研究的重点。


参考文献
[1]
刘慧敏, 胡文柯, 唐建波, 等. 顾及功能语义特征的建筑物空间分布模式识别方法[J]. 测绘学报, 2020, 49(5): 622-631.
LIU Huimin, HU Wenke, TANG Jianbo, et al. A method for recognizing building clusters by considering functional features of buildings[J]. Acta Geodaetica et Cartographica Sinica, 2020, 49(5): 622-631. DOI:10.11947/j.AGCS.2020.20190222
[2]
ZHANG Xiuyuan, DU Shihong, WANG Yichen. Semantic classification of heterogeneous urban scenes using intrascene feature similarity and interscene semantic dependency[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(5): 2005-2014. DOI:10.1109/JSTARS.2015.2414178
[3]
DU Shihong, ZHANG Fangli, ZHANG Xiuyuan. Semantic classification of urban buildings combining VHR image and GIS data: an improved random forest approach[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 105: 107-119. DOI:10.1016/j.isprsjprs.2015.03.011
[4]
MAO Bo, HARRIE L, BAN Yifang. Detection and typification of linear structures for dynamic visualization of 3D city models[J]. Computers, Environment and Urban Systems, 2012, 36(3): 233-244. DOI:10.1016/j.compenvurbsys.2011.10.001
[5]
ZHANG Liqiang, DENG Hao, CHEN Dong, et al. A spatial cognition-based urban building clustering approach and its applications[J]. International Journal of Geographical Information Science, 2013, 27(4): 721-740. DOI:10.1080/13658816.2012.700518
[6]
RUAS A, HOLZAPFEL F. Automatic characterisation of building alignments by means of expert knowledge[C]//Proceedings of the 21st International Cartographic Conference (ICC). Miami, FL, USA: ICC, 2003: 1604-1616.
[7]
STEINIGER S. Enabling pattern-aware automated map generalization[D]. Zurich: University of Zurich, 2007.
[8]
ZHANG Xiang, STOTER J, AI Tinghua, et al. Automated evaluation of building alignments in generalized maps[J]. International Journal of Geographical Information Science, 2013, 27(8): 1550-1571. DOI:10.1080/13658816.2012.758264
[9]
RENARD J, DUCHÊNE C. Urban structure generalization in multi-agent process by use of reactional agents[J]. Transactions in GIS, 2014, 18(2): 201-218. DOI:10.1111/tgis.12018
[10]
ANDERS K H, SESTER M. A hierarchical graph-clustering approach to find groups of objects[C]//Proceedings of the 5th Workshop on Progress in Automated Map Generalization. Paris, France: [s. n. ], 2003.
[11]
REGNAULD N. Contextual building typification in automated map generalization[J]. Algorithmica, 2001, 30(2): 312-333. DOI:10.1007/s00453-001-0008-8
[12]
艾廷华, 郭仁忠. 基于格式塔识别原则挖掘空间分布模式[J]. 测绘学报, 2007, 36(3): 302-308.
AI Tinghua, GUO Renzhong. Polygon cluster pattern mining based on gestalt principles[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(3): 302-308. DOI:10.3321/j.issn:1001-1595.2007.03.011
[13]
YAN Haowen, WEIBEL R, YANG Bisheng. A multi-parameter approach to automated building grouping and generalization[J]. GeoInformatica, 2008, 12(1): 73-89. DOI:10.1007/s10707-007-0020-5
[14]
LI Z, YAN H, AI T, et al. Automated building generalization based on urban morphology and Gestalt theory[J]. International Journal of Geographical Information Science, 2004, 18(5): 513-534. DOI:10.1080/13658810410001702021
[15]
ALLOUCHE M K, MOULIN B. Amalgamation in cartographic generalization using Kohonen's feature nets[J]. International Journal of Geographical Information Science, 2005, 19(8-9): 899-914. DOI:10.1080/13658810500161211
[16]
WANG Yuebin, ZHANG Liqiang, MATHIOPOULOS P T, et al. A Gestalt rules and graph-cut-based simplification framework for urban building models[J]. International Journal of Applied Earth Observation and Geoinformation, 2015, 35: 247-258. DOI:10.1016/j.jag.2014.09.012
[17]
程博艳, 刘强, 李小文. 一种建筑物群智能聚类法[J]. 测绘学报, 2013, 42(2): 290-294, 303.
CHENG Boyan, LIU Qiang, LI Xiaowen. Intelligent building grouping using a self-organizing map[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(2): 290-294, 303.
[18]
YAN Xiongfeng, AI Tinghua, YANG Min, et al. A graph deep learning approach for urban building grouping[J]. Geocarto International, 2022, 37(10): 2944-2966. DOI:10.1080/10106049.2020.1856195
[19]
RAINSFORD D, MACKANESS W. Template matching in support of generalisation of rural buildings[M]//Advancesin Spatial Data Handling. Berlin, Heidelberg: Springer Berlin Heidelberg, 2002: 137-151.
[20]
YANG W. Identify building patterns[C]//Proceedings of 2011 International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. Göttingen, Germany: Copernicus GmbH, 2011, 391-398.
[21]
巩现勇, 武芳. 基于图匹配的城市建筑群典型字母型分布的识别[J]. 武汉大学学报(信息科学版), 2018, 43(1): 159-166.
GONG Xianyong, WU Fang. A graph match approach to typical letter-like pattern recognition in urban building groups[J]. Geomatics and Information Science of Wuhan University, 2018, 43(1): 159-166.
[22]
ANDERS K H. Grid typification[C]//Proceedings of the 12th International Symposium on Spatial Data Handling, Berlin: Springer, 2006: 633-642.
[23]
WANG Xiao, BURGHARDT D. A mesh-based typification method for building groups with grid patterns[J]. ISPRS International Journal of Geo-Information, 2019, 8(4): 168. DOI:10.3390/ijgi8040168
[24]
ZHANG Xiang, AI Tinghua, STOTER J, et al. Building pattern recognition in topographic data: examples on collinear and curvilinear alignments[J]. GeoInformatica, 2013, 17(1): 1-33. DOI:10.1007/s10707-011-0146-3
[25]
WANG Xiao, BURGHARDT D. A typification method for linear building groups based on stroke simplification[J]. Geocarto International, 2021, 36(15): 1732-1751. DOI:10.1080/10106049.2019.1669725
[26]
巩现勇, 武芳, 钱海忠, 等. 建筑群多连通直线模式的参数识别方法[J]. 武汉大学学报(信息科学版), 2014, 39(3): 335-339.
GONG Xianyong, WU Fang, QIAN Haizhong, et al. The parameter discrimination approach to multi-connected linear pattern recognition in building groups[J]. Geomatics and Information Science of Wuhan University, 2014, 39(3): 335-339.
[27]
巩现勇, 武芳. 城市建筑群网格模式的图论识别方法[J]. 测绘学报, 2014, 43(9): 960-968.
GONG Xianyong, WU Fang. The graph theory approach to grid pattern recognition in urban building groups[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(9): 960-968.
[28]
DU Shihong, SHU Mi, FENG C C. Representation and discovery of building patterns: a three-level relational approach[J]. International Journal of Geographical Information Science, 2016, 30(6): 1161-1186. DOI:10.1080/13658816.2015.1108421
[29]
郭庆胜, 魏智威, 王勇, 等. 特征分类与邻近图相结合的建筑物群空间分布特征提取方法[J]. 测绘学报, 2017, 46(5): 631-638.
GUO Qingsheng, WEI Zhiwei, WANG Yong, et al. The method of extracting spatial distribution characteristics of buildings combined with feature classification and proximity graph[J]. Acta Geodaetica et Cartographica Sinica, 2017, 46(5): 631-638. DOI:10.11947/j.AGCS.2017.20160374
[30]
WEI Zhiwei, GUO Qingsheng, WANG Lin, et al. On the spatial distribution of buildings for map generalization[J]. Cartography and Geographic Information Science, 2018, 45(6): 539-555. DOI:10.1080/15230406.2018.1433068
[31]
HE Xianjin, ZHANG Xinchang, XIN Qinchuan. Recognition of building group patterns in topographic maps based on graph partitioning and random forest[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 136: 26-40. DOI:10.1016/j.isprsjprs.2017.12.001
[32]
ZHAO Rong, AI Tinghua, YU Wenhao, et al. Recognition of building group patterns using graph convolutional network[J]. Cartography and Geographic Information Science, 2020, 47(5): 400-417. DOI:10.1080/15230406.2020.1757512
[33]
WANG Chun, LAI Zhongyuan. Shape decomposition and classification by searching optimal part pruning sequence[J]. Pattern Recognition, 2016, 54: 206-217. DOI:10.1016/j.patcog.2016.01.005
[34]
DASH K S, PUHAN N B, PANDA G. Unconstrained handwritten digit recognition using perceptual shape primitives[J]. Pattern Analysis and Applications, 2018, 21(2): 413-436.
[35]
HU Xuke, FAN Hongchao, NOSKOV A. Roof model recommendation for complex buildings based on combination rules and symmetry features in footprints[J]. International Journal of Digital Earth, 2018, 11(10): 1039-1063.
[36]
DU Shihong, SHU Mi, WANG Qiao. Modelling relational contexts in GEOBIA framework for improving urban land-cover mapping[J]. GIScience & Remote Sensing, 2019, 56(2): 184-209.
[37]
JIANG, JIANG, KW AN, et al. Study of indoor ventilation based on large-scale DNS by a domain decomposition method[J]. Symmetry, 2019, 11(11): 1416.
[38]
LIU Yuangang, GUO Qingsheng, SUN Yageng, et al. A combined approach to cartographic displacement for buildings based on skeleton and improved elastic beam algorithm[J]. PLoS One, 2014, 9(12): e113953.
[39]
艾廷华, 郭仁忠. 支持地图综合的面状目标约束Delaunay三角网剖分[J]. 武汉测绘科技大学学报, 2000, 25(1): 35-41.
AI Tinghua, GUO Renzhong. A constrained delaunay partitioning of areal objects to support map generalization[J]. Journal of Wuhan Technical University of Surveying and Mapping (Wtusm), 2000, 25(1): 35-41.
http://dx.doi.org/10.11947/j.AGCS.2023.20210286
中国科学技术协会主管、中国测绘地理信息学会主办。
0

文章信息

魏智威,丁愫,童莹,程璐,刘洋
WEI Zhiwei, DING Su, TONG Ying, CHENG Lu, LIU Yang
格式塔原则与图形凸分解结合的建筑物群直线模式识别方法
Linear building pattern recognition combining Gestalt principles and convex polygon decomposition
测绘学报,2023,52(1):117-128
Acta Geodaetica et Cartographica Sinica, 2023, 52(1): 117-128
http://dx.doi.org/10.11947/j.AGCS.2023.20210286

文章历史

收稿日期:2021-05-20
修回日期:2022-06-21

相关文章

工作空间