前言:
如今朋友们对“分布式滤波的概念”大概比较珍视,我们都需要分析一些“分布式滤波的概念”的相关内容。那么小编同时在网摘上搜集了一些有关“分布式滤波的概念””的相关资讯,希望你们能喜欢,你们一起来学习一下吧!本文内容来源于《测绘通报》2022年第1期,审图号:GS(2022)103号
图残差神经网络支持下的建筑物群组模式分类
张自强1,2,3,刘涛1,2,3,杜萍1,2,3, 锁旭宏4, 杨国林1,2,3
1. 兰州交通大学测绘与地理信息学院, 甘肃 兰州 730070;
2. 地理国情监测技术应用国家地方联合工程研究中心, 甘肃 兰州 730070;
3. 甘肃省地理国情监测工程实验室, 甘肃 兰州 730070;
4. 中交一航局第二工程有限公司, 山东 青岛 266071
基金项目:国家自然科学基金(41761088;42061060);轨道交通工程信息化国家重点实验室(中铁一院)开放课题(SKLKZ21-01);兰州交通大学天佑创新团队(TY202001);兰州交通大学优秀平台支持(201806)
关键词:建筑物群组,模式分类,GResNet模型,机器学习,深度学习
引文格式:张自强, 刘涛, 杜萍, 等. 图残差神经网络支持下的建筑物群组模式分类. 测绘通报,2022(1):1-7. DOI: 10.13474/j.cnki.11-2246.2022.0001.摘要
摘要 :建筑物作为城市中的重要地物,分析其群组模式对地图综合、导航定位、市政规划等具有重要作用。建筑物群组模式分析目前主要有基于规则的方法和基于机器学习的方法两种。基于规则的方法和基于传统机器学习分类器的方法均需要大量的人工处理过程。近年来兴起的深度学习特别是图卷积神经网络前期无需人工处理,因此提高了建筑物群组模式分析的自动化程度。传统的图卷积神经网络模型在训练深层网络时易出现退化问题,提取深层特征困难。为解决此问题,本文引入了图残差神经网络模型用于建筑物群组的模式分类。首先使用道路和河流等作为约束条件,利用K-means方法对建筑物进行聚类;然后根据Bertin视觉变量计算对应的建筑物特征指标,在每个建筑物群组中以建筑物质心为节点,连接节点的最小生成树作为边,构建建筑物群组图结构;最后将得到的图结构数据输入图残差神经网络进行训练,得到规则和不规则两种建筑物群组模式。试验结果表明,该模型较好地解决了传统图卷积神经网络模型的退化问题,并取得了更高的精度。
正文建筑物作为地理空间中的典型实体,分析其群组结构模式是地理信息科学领域的经典任务。分析建筑物群组模式对地理数据库的建设[1]、城市规划[2]及城市地理学的发展[3]等均有重要的意义。当前,在建筑物模式分析方面已有大量的研究,其分析方法大致可分为基于规则的方法和基于机器学习的方法两种。由于建筑物群组模式的复杂性,无法对其进行规范、统一的形式化表达[4],因而面对特定的研究任务,基于规则的方法需要定义不同的规则,这需要大量的人工处理,因此自动化程度低[5];基于随机森林、支持向量机等传统机器学习分类器的方法也需要大量的手工定义[6-7]。端对端的深度学习技术,如卷积神经网络(convolutional neural network, CNN)、图卷积神经网络(graph convolutional network, GCN)等无需手工定义规则,因此显著提高了模式分析过程的自动化程度[8-9]。文献[10—12]首次将GCN用于建筑物矢量数据的模式分析,取得了比传统方法更好的效果,为地理学中的模式分析提供了新思路。GCN作为一种特征提取器,一般随着网络层数的增加,模型的表现会越来越好。然而,一味增加网络深度会出现退化和衰减问题,即随着层数的增加,模型的准确率不断提高,在达到峰值后大幅下降[12],这给模型的深层训练带来困难,使其难以提取更为抽象的特征。为解决这一问题,本文结合文献[13]提出能解决CNN中退化和衰退问题的ResNet模型,并基于经典的GCN模型[14],提出一种新的图残差神经网络模型(graph residual network, GResNet)以实现建筑物群组的模式分类。将建筑物矢量数据建模为无向图,并根据不同的视觉变量选取指标,构成GResNet模型的输入值,将建筑物群组模式的规则和不规则模式作为标签,输入该模型进行训练,最终得到建筑物群组模式的分类结果。
1 基于GResNet的建筑物模式分类
根据建筑物群组的尺度范围和视觉形态,本文将其分为规则和不规则两种模式:规则建筑物群组中的建筑物在形态排列上较为同质,如线性、矩形和网格排列等; 不规则建筑物群组中的建筑物形态和排列错乱、形状多样,如T形、Z形等字母形[15]。本文通过GResNet进行建筑物群组模式分类,总体框架如图 1所示,主要包括数据预处理、GResNet模式分类和结果输出。
1.1 建筑物数据预处理
建筑物数据预处理主要包括建筑物聚类、建筑物群组图结构构建和标注。首先根据格式塔原则的邻近性,将获取的数据基于道路网和河流等物理约束,使用K-means方法进行聚类,得到一定数量的建筑物群组[16]。然后基于尺寸、方向、形状等Bertin视觉变量[17],计算出不同的指标以描述建筑物特征,并计算建筑物群组的密度指标。具体的指标选取及计算公式见表 1[18-19]。
本文使用最小生成树(minimum spanning tree, MST)构建建筑物群组的图结构。对于聚类得到的建筑物群组,将群组内的建筑物用其质心表示,质心的集合构成图的点集V,使用MST连接各质心构成图的边集E,以建筑物质心之间的欧氏距离为权值构成邻接矩阵W,将所选参量作为建筑物节点的特征维,构成无向图G={V, E, W}。使用N表示群组中的建筑物数量,F表示节点的特征维,则V为N×F的矩阵,E为N×N的矩阵。构图之后,使用0、1对建筑物进行标注:0表示不规则,1表示规则。标注完成后即可输入模型进行训练。建筑物图结构,如图 2所示。
1.2 GResNet建筑物模式分类1.2.1 图卷积神经网络图 2中顶点m的度定义为与该点有关的所有边的个数,即dN-1),表示图的度矩阵,得到实对称的图拉普拉斯矩阵L=D-W,对其进行特征分解得L=XΛXT。其中,Λ=diag(λ0, λ1, …, λn-1),λi为L的特征值。GCN源于图像处理领域中的CNN,其基本操作是图卷积运算,即借助图傅里叶变换和卷积定理,将图域的卷积转换为谱域的点乘运算,并做傅里叶逆变换以实现图卷积运算。图卷积运算的定义公式如下 (1)
式中,gλ(Λ)=diag(θ),为图卷积核,当其为多项式时可达快速卷积的目的。结合图卷积运算过程,可得到图卷积神经网络的传递过程,公式如下 (2)
式中,f()表示非线性激活函数;Hi[l]表示第l层的第i个输入图。本文使用切比雪夫多项式作为卷积核以加速运算,得到简化的图卷积运算公式为[15] (3)
式中,,为归一化的拉普拉斯矩阵,其中,λmax为其最大特征值,可由幂迭代法求出;Tk()为k阶的契比雪夫多项式;βk为对应的系数。
1.2.2 图残差神经网络
为解决GCN模型的退化问题,类比图像的ResNet(如图 3(a)所示)提出GResNet模型。首先定义经典的GNN块;然后将上一次的输入加至当前层的输出上,得到GResNet块;最后将两者的和传至下一个GResNet块训练,如图 3(b)所示。考虑图池化操作的复杂性和运算效率,模型中没有使用池化层。定义好GResNet块之后,可通过GResNet块的叠加改变模型的深度,以实现GResNet模型的训练。GResNet网络的激活过程公式如下 (4)
2 试验与分析
本文采用TensorFlow 1.15+CUDA 10.1实现GResNet模型以进行建筑物模式分类,试验在R7 4800H+GeForce GTX 2060硬件平台下完成。选择上海市部分建筑物作为研究区域,采用OpenStreetMap(OSM)公开数据。首先对获取的上海市OSM建筑物数据进行聚类;然后对每组建筑物进行标注,剔除聚类后得到的混淆群组和模糊群组;最后将其余的建筑物群组为规则(1)和不规则(0)两种。共得到860个不规则建筑物群组和861个规则建筑物群组。计算出不同的指标后,为消除不同指标之间的量纲影响,避免较大指标对较小指标的弱化,对选择的10个描述指标分别采用Z-Score方法标准化,最后利用MST构图,作为GResNet模型的输入数据。聚类及标注结果如图 4所示。
2.1 试验参数设置
在构建好模型后,通过一定的神经网络训练技巧和优化方法对其进行调参训练,将试验中模型的参数设置如下:学习率和指数衰减率分别为0.001和0.91,正则化参数、dropout概率值及批处理大小分别为5E-4、0.8和16。建筑物构图后导入模型中,其中模型由卷积、归一化、GResNet连接及非线性激活等结构组成。为使训练较快收敛,采用批处理归一化和LeakyRelu激活函数。模型中采用4阶切比雪夫多项式,并使用L2范数交叉熵计算损失函数,以减小可能的过拟合。将所有的样本随机按比例6∶2∶2分为训练集、测试集和验证集。传统的GCN模型在层数为12时会出现明显的退化现象[12],因此为验证本文GResNet模型在深层训练时的性能,试验采用19层的GResNet网络训练,采用两个全连接层以输出分类结果,然后对结果进行分析,如图 5所示。
2.2 试验结果及分析
经过上述设置,将数据输入模型中训练。经过150次训练后,训练和测试集的精度可达99.80%和95.63%,其混淆矩阵见表 2。
为进一步评估模型的性能,本文在训练过程中记录验证集精度和损失值随步长的变化情况,如图 6所示。可知,在训练过程中,模型的精度逐渐增加而损失逐渐减小,且在训练约3000步后趋于收敛,最终分类精度达96.80%。若以0.8作为阈值,精度可达93.90%,且随着训练步长的增加,大于阈值的精度逐渐逼近不设阈值的分类精度,训练损失值减小至0.19,这表明模型在验证集上表现良好。
以0.8作为概率阈值,得到建筑物群组的概率值,如图 7所示,其中的数字表示建筑物群组被分为规则模式的概率值。可知,右上方区域A是上海外滩的一部分,存在商业区、银行、酒店、住宅区等设施,每个建筑物群组中的建筑物结构复杂、形态各异且排列混乱,因此标注时将其群组模式标注为不规则,GResNet模型将其分类为规则模式的概率值较小,即A区域中的群组被分类为不规则模式,符合标注结果。同样,右下方区域B是一片住宅区,每个建筑物群组中的建筑物在结构上较为相似,形状上较为统一,而排列也比较规整,因此B中的群组标注为规则模式,使用GResNet模型将B中的群组分类为规则模式的概率较高,即B区域中的群组被分类为规则模式,符合标注结果。这表明GResNet模型分类的结果和视觉认知结果一致,在建筑物模式分类中可取得较好的效果。
为进一步验证模型的普适性,本文在北京城区选择部分区域,利用已训练好的GResNet模型进行补充分类试验。为验证GResNet在浅层模型的有效性,在北京市建筑物上采用6层模型。通过采用与上海建筑物相同的数据预处理方式,最后得到了规则群组675个,不规则群组675个,共1350个建筑物群组。为加速学习率衰减,将指数衰减率设置为0.95,其他参数不变。对其打乱操作后进行输入模型训练,经过150次训练后,训练和测试集的精度可稳定在99.56%和97.40%,其混淆矩阵见表 3。
同样,得到北京市建筑物的损失值和精度随步长的变化,如图 8所示。可知,模型在训练约3000步后趋于收敛,最终分类精度(97.03%),大于0.8阈值的精度(94.81%),训练损失值减小至0.12,这表明模型在北京市建筑物的验证集上依然可取得较好的效果。
北京市建筑物模式分类结果如图 9所示。可知,右上方区域A是一片住宅区,每个建筑物群组中的建筑物在结构上比较相似,形状和排列上较为同质,因此将其中的群组标注为规则模式,GResNet模型将其分类为规则模式的概率较高,即A区域中的群组被分类为规则模式,这与标注结果一致;类似的,在右下方区域B中,存在学校、政府单位、医院、住宅区等设施,每个建筑物群组中的建筑物结构复杂、形状多样且排列错乱,因此将B中群组标注为不规则群组模式,GResNet模型将其分类为规则模式的概率较低,即B区域中的群组被分类为不规则模式,这与标注结果一致。这表明GResNet模型在北京市建筑物群组模式分类的结果也符合直观认知,即某一建筑物群组在视觉上被识别为某种模式,则模型即可根据该标注信息正确地区分建筑物群组模式,而与地域的变化无关,这表明模型在建筑物群组模式分类上是普适的。2.3 方法比较
为更全面地讨论本文GResNet模型的优缺点,通过利用经典的GCN模型,采用相同的参数设置,在上海数据集上进行比较试验,且分别训练了20层模型。试验结果如图 10所示。
由图 10可知,无论是在精度还是在稳定性上,GResNet模型均表现出比传统GCN模型较好的性能,随着深度的增加,GResNet的训练精度和测试精度均较为稳定,而GCN模型在18层时出现了明显的退化现象。这说明GResNet模型能够较好地克服深层网络的退化问题,为较深层的分类训练提供了可能。
3 结语
建筑物的模式分析对城市科学、地图综合等领域均有重要意义,而GCN在模式分类上的良好性能使其能够应用于建筑物模式分析中。传统的GCN模型在训练深层网络时存在易退化的问题,本文据此提出了GResNet模型,探讨了该模型在建筑物群组模式分类上的性能,通过混淆矩阵、损失值、精度等多个维度评价了该模型在建筑物群组模式分类上的有效性,通过北京数据集做比较试验证明该模型在不同区域上的有效性,并与传统的GCN做比较,分析该模型的优点。试验结果发现,该模型能有效区分出不同的建筑物群组模式,且在不同区域的数据集上均能取得良好的效果,同时可以克服传统GCN模型的退化问题,能取得比传统GCN模型更好的精度,为更深层次的抽象特征提取提供了可能。
作者简介作者简介:张自强(1995-), 男, 硕士生, 主要从事制图综合研究。E-mail: renzailvtu702@163.com通信作者:刘涛。E-mail: ltaochina@foxmail.com
初审:纪银晓复审:宋启凡
终审:金 君
往期推荐
资讯
○ 中国大学MOOC 地理信息系统(GIS)实验第六期课程即将开课!
○ 测绘遥感国家重点实验室马盈盈副研究员利用遥感气象要素助力冬奥
○ 山东省水利勘测设计院有限公司2022年公开招聘!含测绘、地信、遥感相关专业
○ 自然资源部:这11家导航电子地图制作甲级测绘资质单位复审换证通过
会议
○ Geoinformatics 2022 暨CPGIS成立30周年年会(二号通知)○ 规划有形,智慧无境:国地云讲堂本周五正式开讲○ 关于召开大地测量与导航2022年综合学术年会的通知(第一轮)○ CHINTERGEO中国测绘地理信息技术装备展览会将于3月2日举
《测绘学报》
○测绘学报 | 刘万科:非完整约束的OD/SINS自适应组合导航方法
○ 测绘学报 | 李德仁:论万物互联时代的地球空间信息学
○ 高被引论文 | 蓝朝桢:异源遥感影像特征匹配的深度学习算法
○ 高被引论文 | 张永军:天空地多源遥感数据的广义摄影测量学
《测绘通报》
○《测绘通报》2021年第12期目录
○ 《测绘通报》2022年第1期目录
○ 地市级实景三维城市建设及应用
○ 基于Sentinel-2影像的雄安新区土地利用分析
《北京测绘》
○《北京测绘》2022年第1期摘要推荐
○《北京测绘》2021年第12期摘要推荐
○《北京测绘》2021年第11期摘要推荐
○《北京测绘》2021年第10期摘要推荐
《测绘科学技术学报》
○ 摘要 |《测绘科学技术学报》2021年第2期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第4期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第5期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第6期摘要推荐
《地球信息科学学报》
○ 《地球信息科学学报》2022年第1期佳文推介
○ 龚健雅院士:全球位置信息叠加协议与位置服务网技术研究进展与展望
○ 佳文推介 | 大数据城市通勤交通模型的构建与模拟应用
○ 专刊征稿:社会感知与地理大数据挖掘(征稿中)
《测绘工程》
○ 摘要 |《测绘工程》2021年第5期摘要推荐
○ 摘要 |《测绘工程》2021年第4期摘要推荐
○ 摘要 |《测绘工程》2021年第6期摘要推荐
○ 佳文推介 | 单目视觉技术在室内定位中的应用研究
《中国空间科学技术》
○ 火卫二地形地貌探测综述
○《中国空间科学技术》2022年第1期摘要
○《中国空间科学技术》2021年第6期摘要
○《中国空间科学技术》2021年第5期摘要推荐
《卫星应用》
○《卫星应用》2021年第12期摘要○《卫星应用》2021年第11期摘要
○《卫星应用》2021年第10期摘要
○ 摘要 |《卫星应用》2021年第9期摘要推荐
《Journal of Geodesy and Geoinformation Science》
○《测绘学报(英文版)》专刊征稿 | 地图学与地球空间信息教育:理论与实践
○ 《测绘学报(英文版)》专刊征稿 | 用于三维地理信息的摄影测量和计算机视觉
○ Kexian WANG et al. | 《测绘学报(英文版)》(JGGS)精选论文
○ Huan XU et al. | 《测绘学报(英文版)》(JGGS)精选论文
《Satellite Navigation》
○ 徐元博士:面向有色测量噪声下UWB/INS组合行人导航的分布式卡尔曼滤波| SANA佳文速递
○ 杨飞博士:GNSS天顶对流层精化模型的构建与分析| SANA佳文速递
○ 姚铮教授:北斗PPP服务信号调制复用方案设计与质量评估| SANA佳文速递
○ 2022征文| SatNav“普适定位、室内导航与基于位置服务”专题
《自然资源遥感》
○ 《自然资源遥感》入驻“智绘科服”融媒体平台!
○ 《自然资源遥感》征稿:“海岸带空间资源及生态健康遥感监测”专栏
○ 摘要 |《自然资源遥感》2021年第3期摘要推荐
○ 摘要 |《自然资源遥感》2021年第4期摘要推荐
《Journal of Geovisualization and Spatial Analysis》
○《Journal of Geovisualization and Spatial Analysis》入驻“智绘科服”融媒体平台!
○ JGSA国际期刊2021年第5卷第2期论文摘要
○ 高被引论文推荐 | Journal of Geovisualization and Spatial Analysis
标签: #分布式滤波的概念