龙空技术网

基于NCL-ELM的混凝土坝变形监控模型

水利水电技术 175

前言:

此刻我们对“elm算法模型训练”大体比较重视,姐妹们都需要剖析一些“elm算法模型训练”的相关资讯。那么小编同时在网上收集了一些关于“elm算法模型训练””的相关文章,希望兄弟们能喜欢,看官们快快来学习一下吧!

《水利水电技术(中英文)》官网网址

摘 要:

针对传统混凝土坝变形监控模型在非线性处理、外延预测精度等方面的不足,充分利用集成学习的优势,提出一种负相关学习集成极限学习机(NCL-ELM)的混凝土坝变形监控模型。此模型选用不同激活函数的ELM作为基学习器,并基于负相关学习算法进行集成,增加ELM基学习器间的差异度,实现了集成模型预测性能的提升。以澜沧江中游河段某混凝土拱坝变形数据为例进行变形预测,结果表明:NCL-ELM模型可深入挖掘混凝土坝变形与环境量影响因子间的作用关系,对于选取的3个测点数据,模型预测性能指标均方根误差分别为0.506 mm、0.490 mm、0.430 mm,均方差分别为0.385 mm、0.445 mm、0.343 mm,预测命中率分别为90%、100%、100%;在预测精度和命中率方面均优于统计模型、ELM和M-ELM模型,同时可为变形性态的判别提供参考依据,具有良好的工程应用价值。

关键词:

混凝土坝变形预测;变形性态判别;极限学习机;集成学习;负相关学习;

作者简介:

王霄(1989—),女,工程师,学士,主要从事水利规划设计工作。

*胡雅婷(1994—),女,博士研究生,主要从事大坝安全监测研究。

基金:

国家自然科学基金项目(51739003,52079046);

引用:

王霄, 胡雅婷, 谷静, 等. 基于 NCL-ELM 的混凝土坝变形监控模型[J]. 水利水电技术(中英文), 2022, 53(12): 38- 46.

WANG Xiao, HU Yating, GU Jing, et al. NCL-ELM-based concrete dam deformation monitoring model [J]. Water Resources and Hydropower Engineering, 2022, 53(12): 38- 46.

0 引 言

水利工程的运行关系国家经济、民生发展,开展大坝运行监测是保障国家水利工程安全的重要手段。大坝安全运行监测以构建监测效应量监控模型为核心,对于混凝土坝而言,变形能综合反映其结构状态,变形监控模型构建是混凝土坝安全监测的重要研究内容,旨在定量解读各影响因素与坝体变形间的作用机制,实现混凝土坝变形性态及未来发展趋势的分析预报。实际工程应用中,统计模型、确定性模型和混合模型是混凝土坝变形分析预报常用的方法。但混凝土坝变形受库水位、环境温度、时间等因素影响,各因素作用机制复杂,变形与影响因素间的非线性问题十分突出,上述常规模型的预测效果难以保证,尤其在混凝土坝中长期变形预报时,预测精度不足的问题尤为突出。

极限学习机(Extreme Learning Machine, ELM)最先由南洋理工大学学者提出,是一种前馈神经网络,其网络结构中隐含层节点权重不需更新,具有较好的学习速率和泛化能力。ELM在处理高维度、非线性问题上具有显著优势,且已广泛应用于大坝安全监测领域,但仍存在着一些问题,其中最为重要问题之一是ELM的预测结果具有初始权值敏感性,预测效果受初始权值赋值影响大,这将限制模型的泛化能力。为此,有关学者针对ELM在大坝变形预测的具体应用场景进行了各种优化改进:张海龙等、李明军等通过智能优化算法,最小化初始隐含层参数对ELM模型产生的影响,提出了改进粒子群算法优化ELM的混凝土坝变形预测模型;胡德秀等引入了稳健估计理论,所构建的稳健估计极限学习机变形监控模型兼具强鲁棒性和泛化性。本文拟基于集成学习思想,把多个单一ELM模型有机结合起来,构建一个统一的集成模型,以期克服单一ELM模型预测时连接权值敏感和过拟合的问题。

负相关学习(Negative Correlation Learning, NCL)是由LIU等提出的一种全新的集成学习范式,其核心思想是通过控制个体模型输出的差异度以产生具有强泛化能力的集成模型。根据上述讨论,本文集合ELM模型非线性建模能力和NCL算法提升泛化能力的优势,提出一种负相关学习集成极限学习机(NCL-ELM)的混凝土坝变形监控模型。首先,选用不同激活函数的ELM作为基学习器,利用网格法搜索确定集成中的各项参数;其次,基于最小二乘法分析计算基学习器的输出权值,确定集成模型输出的解析表达,据此建立NCL-ELM模型;最后,将NCL-ELM模型应用于某混凝土坝变形预测的工程实例中,验证所提模型的有效性。

1 算法原理

1.1 极限学习机

极限学习机是一种基于参数随机化和最小二乘解思想的单隐含层前馈神经网络学习算法,拓扑结构如图1所示。

图1 ELM拓扑结构

对于图1中具有L个隐含层结点且激活函数为g(·)的ELM模型,其输出函数为

式中,x为输入样本,有x=[x1,x2,…,xd]∈Rd;β为输出权重,有β=[β1,β2,…,βL]T∈RL;h(x)为对于输入样本x的隐含层输出;wj和bj分别为第j个隐含层节点的输入权重和偏置,有wj=[wj1,wj2,…,wjd]∈Rd和bj∈R。

以往研究表明,ELM可以零误差逼近N个训练样本{(xn,yn)}n=1Ν,于是有

1.2 负相关学习集成算法

负相关学习算法的理论来源于偏差-方差-协方差分解。NCL通过在损失函数中添加一个相关性惩罚项,使得每个基学习器在训练过程中同时最小化经验误差和相关性惩罚项,从而产生一系列精度高且差异度大的基学习器,提高集成模型的泛化能力。

加入相关性惩罚项pm后,集成中第m个基学习器的损失函数em(x)修正为

式中,λ为惩罚项系数,且0<λ<1;fm(x)为第m个基学习器的输出;fens(x)为集成系统的输出。

2 负相关学习集成极限学习机

ELM的随机初始化导致了学习过程中的不确定性,单独一个ELM模型难以保证预测结果的准确性和稳定性。本文从集成学习思想出发,借鉴文献[19]和[20]负相关学习集成RVFL神经网络的思路,推导了一种融合多重ELM的负相关学习集成极限学习机模型(NCL-ELM),以期获得良好的泛化性能。

集成中,基学习器为ELM模型,各ELM基学习器具有相同的隐含层结点数L,集成规模为M。其中,第m个基学习器的输出fm为

式中,βm是第m个ELM基学习器的隐含层输出权重,有βm=[βm1,βm2,…,βmL]T∈RL;hm(x)为第m个ELM基学习器的隐含层输出;gm(·)为第m个ELM基学习器的隐含层激活函数。

负相关学习背景下,基学习器的损失函数构造为

则化项,推导基学习器在训练集Dt={(xn,yn)}n=1Ν上的代价函数如下

其中,Hm的矩阵形式如下

式中,Y为期望输出,有Y=[y1,y2,…,yN]T;λ为惩罚项系数;am为正则化参数;Hm为第m个ELM基学习器的隐含层输出矩阵。

为使集成模型获得良好的泛化性能,令

化简整理后

改写为矩阵形式如下

式中,βens为全局输出权值;Hcorr为隐含层相关矩阵;Th为输出目标矩阵。

求解全局输出权值为

简单平均法融合上述各个基学习器,NCL-ELM模型的输出如下

3 基于NCL-ELM的混凝土坝变形监控模型

综合上述理论,本节构建基于NCL-ELM的混凝土坝变形监控模型。混凝土坝运行过程中,坝体受水压、温度等环境量因素的影响产生可逆变形,受混凝土徐变、塑性变形等时效因素的影响产生不可逆位移以及自生体积变形。按其成因,混凝土坝变形可归结为

式中,δH、δT、δθ分别为混凝土坝变形的水压、温度和时效分量。

各分量计算公式为

式中,H为坝前水深;k为水压分量的项数,坝型为混凝土重力坝时k取3,坝型为混凝土拱坝时k取4或5;Ti为坝体、坝基布设温度计的测值;t为始测日至监测日的累计天数。

根据混凝土变形分量形式,选取适当的影响因子作为NCL-ELM的混凝土坝变形监控模型的输入变量,模型流程框图如图2所示,具体步骤如下:

图2 基于NCL-ELM的混凝土坝变形监控模型流程

步骤1,建模变量。结合工程实际情况合理选择式(19)—式(22)中水压、温度和时效等环境量影响因子的表征形式作为变形监控模型的建模变量。

步骤2,数据准备。以环境量影响因子作为输入,目标测点的变形监测数据序列作为输出构建模型数据集,将模型数据集划分为训练集和测试集,并对输入变量进行归一化处理。

步骤3,建立NCL-ELM模型。具体为:(1)初始化基学习器,确定集成规模M;(2)通过网格搜索法遍历NCL-ELM模型中待确定参数(隐含层结点数L、惩罚项系数λ和正则化参数α)的取值,在所有迭代步中,当模型在训练集内的测试误差达到最小时,此迭代步的参数设置结果为最优参数;(3)按照式(11)—式(15)计算C1、C2、Hm、Hcorr、Th,通过最小二乘法求解βˆβ^ens,由此确立变形量与环境量影响因子间的映射关系,完成最优参数模型的训练。

步骤4,变形预报。用训练好的最优参数模型对测试集进行预测,并结合评价指标全面评估基于NCL-ELM的混凝土坝变形预测模型的预测性能。评价指标包括均方根误差(RMSE)、平均绝对误差(MAE)和预测命中率(HR),计算公式为

式中,y^n、yn分别为预测值和实测值;NT为正确预测值的数目;N为预测样本长度。

4 工程实例

某混凝土拱坝位于澜沧江中游河段,最大坝高294.5 m, 分为43个坝段。为监测坝体及基础的水平位移,分别在4号、9号、15号、19号、22号、25号、29号、35号和41号坝段布置正倒垂线组,共计52个垂线测点(见图3)。

图3 垂线测点监测布置

52个垂线测点中,PL19-3、PL22-3、PL25-3测点位于拱冠梁及其相邻坝段,位移变化范围较大,最能反映外荷载作用下整个拱坝的变形情况。故选取以上测点的径向位移监测数据为研究对象,对2016年11月5日—2020年2月15日的共400组监测数据进行建模分析。其中,前360组数据作为训练集,后40组数据为测试集,测点的径向位移过程线如图4所示。

图4 测点径向位移过程线

4.1 NCL-ELM变形监控模型的建立

4.1.1 建模变量

依据大坝安全监控理论,考虑到该工程已运行多年已达到准稳定温度场状态且坝体未产生大范围裂缝等具体情况,选择NCL-ELM变形监控模型的输入参变量为:水压因子4项H、H2、H3、H4;温度因子4项sin2πt365、cos2πt365、sin4πt365、cos4πt365;时效因子2项θ、lnθ。NCL-ELM变形监控模型的输出为测点的径向位移监测序列。

4.1.2 基学习器构建与模型参数设置

使用不同激活函数(Sigmoid、Radbas、Multiquadric函数)的ELM模型作为基学习器,集成规模M=3。

NCL-ELM模型涉及的参数包括隐含层结点数L、惩罚系数λ和正则化参数α,本文使用网格搜索结合交叉验证的方法确定模型的最优参数组合,具体步骤为:(1)设定模型各待调参数的候选集合;(2)针对每一种参数组合,进行5折交叉验证训练5个模型,记录每一组参数所对应5个模型的平均测试均方误差;(3)平均测试均方误差最小的那组参数即为模型的最优参数。

各参数的搜索范围设定:L∈[5,40],步距取1;λ∈[0,1],步距0.05;α∈{2-2,2-1,…,212}。调优结果如表1所列。

4.1.3 负相关学习集成方案的有效性验证

为考察相关性惩罚项在基学习器训练过程中发挥的作用,此处以PL22-3数据集为例,设计实验研究当相关性惩罚项系数λ改变时,NCL-ELM训练得到的ELM基学习器间的相关性的变化情况。

基学习器间的相关性通过其预测输出值之间的Pearson相关系数进行度量。定义NCL-ELM中第i个基学习器Ei与第j个基学习器Ej之间的相关性程度为

式中,Corij为基学习器Ei与基学习器Ej间的相关系数,Corij越小表示相关度越低,反之越高;fi(xn)为基学习器Ei在第n个测试样本上的输出值;f¯i为基学习器Ei在所有的测试样本上输出值的平均;N为测试集中样本的数目。

实验结果如图5所示。从图5中可以看出,NCL-ELM中引入的相关性惩罚项可以达到降低基学习器间相关性的目的,基学习器间的相关性随着λ的增大呈下降的趋势,直至λ>0.6时基学习器间呈现负相关关系。同时说明,负相关学习集成方案训练的基学习器趋向于负相关,这增强了基学习器的多样性,有助于提高集成模型的泛化能力。

图5 ELM基学习器的输出结果间平均相关性曲线

5 结果分析

采用上述建立的NCL-ELM模型进行混凝土坝变形预测,另构建统计模型、ELM模型、M-ELM模型(均值集成极限学习机)作为对照。各模型的预测结果及残差过程线如图6所示,预测性能指标如图7所示。为考察各模型预测表现稳定性,计算不同预测时长(25%、50%、75%和100%测试集数据)下各模型的命中率,根据《混凝土坝安全监测技术规范》(DL/T 5178—2016)的要求,坝顶径向位移的处理精度误差限制为±2 mm, 坝基径向位移的处理精度误差限制为±0.3 mm, 本例中的测点处于坝体中下部,故在此将正确预测值界定近似取为预测残差在±1 mm范围以内,四种模型不同预测时长下的命中率对比如图8所示。

图6 2019年各模型的预测结果与残差

图7 四种模型预测性能对比

图8 四种模型不同预测时长下的命中率对比

结合图6、图7和图8的预测结果可以得出:

(1)统计模型从变形的趋势上对其数据特征加以分析,在外延预测时表现波动大;ELM、M-ELM模型的预测性能不稳定,存在前期预测效果较好,后期预测值出现较大误差的现象;NCL-ELM模型的预测值与实测值几乎重合,且残差过程线稳定,残差大多控制在0~1 mm范围内。这是由于NCL集成算法倾向于将ELM训练成为差异性较大的基学习器,使基学习器产生了一定的分工,对训练数据集的不同方面进行学习,故NCL-ELM模型在一些较难预测的样本上依然能保证稳定的预测精度。

(2)结合3个测点的评价指标定量分析,NCL-ELM模型相较其他3种对比模型的预测精度和泛化能力均有一定程度的提高:均方根误差分别降低了1.121 mm、0.959 mm、0.463 mm, 平均绝对误差分别降低了1.045 mm、0.842 mm、0.445 mm, 命中率分别提高了70%、50.83%、27.5%。

(3)NCL-ELM模型可为变形性态的判别提供参考,可采用NCL-ELM模型计算测点在各种荷载作用下变形的计算结果,并结合置信区间法拟定安全预警指标。以PL22-3测点为例,根据该工程的实际情况,取5%显著性水平的β=1.96,NCL-ELM模型在拟合时段的剩余标准差S=0.575 mm, 置信区间的半带宽Δ=βS=1.127 mm, 据此拟定变形安全预警指标为:δm=δ^±1.127(δ^为NCL-ELM模型的变形计算结果)。预测时段,实测变形值均落在区间[δˆ−1.127,δˆ+1.127]内,表明该时段内PL22-3测点变形性态正常,后续继续观测。

6 结 论

(1)针对传统混凝土坝变形监控模型在非线性处理、外延预测精度等方面的不足,本文提出了基于NCL-ELM的混凝土坝变形监控模型,其具体优势为:NCL集成算法增强了ELM基学习器的多样性,使ELM基学习器产生了一定的分工,对监测数据中所蕴含的各方面信息进行充分挖掘,从而实现混凝土坝变形的高精准预测。

(2)结合工程实例分析,得出:NCL-ELM模型可有效挖掘混凝土坝变形与环境量影响因子间的作用关系,在混凝土坝变形预测中呈现出良好的泛化性能和高预测命中率,随着预测时长的增加,预测性能有所下降,但预测结果明显优于统计模型、ELM和M-ELM模型,预测残差大多在可接受范围(1 mm)内,满足工程应用要求;此外,基于NCL-ELM模型预测结果,根据置信区间法拟定变形安全预警指标,合理判定了预测时段内的大坝变形安全性态。

(3)NCL-ELM模型较好解决了混凝土坝变形预报与变形性态判别的问题,为混凝土坝变形安全监控预警模型的构建提供了新思路,可推广至水利工程渗流、应力等效应量安全监测中。

(4)NCL-ELM模型的良好性能需建立在有准确、长时段训练数据集的条件下,对于短时段监测数据样本的监控模型构建,NCL-ELM模型同样无法得到良好的预测结果,还需后续深入研究。

[19] MONTHER A,WANG D H.Fast decorrelated neural network ensembles with random weights[J].Information Sciences,2014,264(6):104-117.

[20] 赵立杰,李彬,汪滢等.磨机负荷参数快速去相关神经网络集成模型[J].控制工程,2017,24(9):1952-1957.ZHAO Lijie,LI Bin,WANG Yin,et al.Mill load parameter model using fast decorrelated neural network ensemble[J].Control engineering of China,2017,24(9):1952-1957.

水利水电技术(中英文)

水利部《水利水电技术(中英文)》杂志是中国水利水电行业的综合性技术期刊(月刊),为全国中文核心期刊,面向国内外公开发行。本刊以介绍我国水资源的开发、利用、治理、配置、节约和保护,以及水利水电工程的勘测、设计、施工、运行管理和科学研究等方面的技术经验为主,同时也报道国外的先进技术。期刊主要栏目有:水文水资源、水工建筑、工程施工、工程基础、水力学、机电技术、泥沙研究、水环境与水生态、运行管理、试验研究、工程地质、金属结构、水利经济、水利规划、防汛抗旱、建设管理、新能源、城市水利、农村水利、水土保持、水库移民、水利现代化、国际水利等。

标签: #elm算法模型训练