基于数据驱动和ELM的水电机组振动区划分

席慧, 郑阳, 安宇晨, 游仕豪, 陈盛, 陈启卷

PDF(2080 KB)
中国农村水利水电 ›› 2021 ›› (10) : 140-144.
水电建设

基于数据驱动和ELM的水电机组振动区划分

作者信息 +

Data-driven and ELM-based Vibration Region Partition for the Hydroelectric Generating Sets

Author information +
稿件信息 +

摘要

传统的水电机组振动区划分方法是通过变负荷试验,采用国标规定的限值划分振动区,没有考虑机组型号和运行环境导致的阈值差异。将水电机组状态监测系统的稳定运行数据应用到振动区划分,提出了基于数据驱动和极限学习机(ELM)的水电机组振动区划分模型,筛选能够表征机组稳定性状态的测点,根据全工况稳定性状态样本数据对振动区划分模型进行分类训练,进而实现机组振动区高效、精确划分。实际应用表明,基于数据驱动和ELM的水电机组振动区划分模型,具有快速、高效获取在线状态监测系统有效数据的优点,其振动区划分结果与传统方法相比,覆盖工况区间广,可靠性高。

Abstract

The traditional method of vibration division for hydropower units adopts the limit value stipulated by national standard through variable load test, without considering the difference of threshold value caused by unit type and operation environment. Based on the data-driven and limit learning machine (ELM), a model for the vibration division of hydroelectric generating units is proposed, in which the stable operation data of hydroelectric generating units are applied to the vibration division, based on the data of steady state under all working conditions, the model of vibration region division is trained, and then the efficient and accurate division of vibration region is realized. The practical application shows that the vibration zoning model based on data-driven and ELM has the advantages of fast and efficient acquisition of effective data of on-line condition monitoring system, the wide coverage range and high reliability are of great significance to guide the actual operation of power plants.

关键词

数据驱动 / 极限学习机 / 在线监测 / 振动区划分

Key words

data driven / extreme learning machine / vibration region partition / on-line monitoring

基金

国家自然科学基金项目(52009096)

引用本文

导出引用
席慧 , 郑阳 , 安宇晨 , 游仕豪 , 陈盛 , 陈启卷. 基于数据驱动和ELM的水电机组振动区划分[J].中国农村水利水电, 2021(10): 140-144
Hui XI , Yang ZHENG , Yu-cheng AN , Shi-hao YOU , Sheng CHEN , Qi-juan CHEN. Data-driven and ELM-based Vibration Region Partition for the Hydroelectric Generating Sets[J].China Rural Water and Hydropower, 2021(10): 140-144
水电机组在电网中负责调峰调频任务,机组出力范围朝着0~100%方向发展,由于水轮机自身水力特性的影响,不同型号水轮机普遍存在部分负荷区间运行时振动强烈的现象12,机组长期处于振动强烈区域运行,会导致结构部件损坏,因此,研究机组运行振动区的需求十分迫切34
传统的振动区划分方法是通过若干个特征水头工况下的稳定性试验,采用国家或行业标准中的限值作为振动区划分的绝对阈值。翟晓阳等5通过乐滩水电站4号机组稳定性试验,分析试验结果,实现机组运行振动区划分。夏琳等6通过某水电厂机组的变负荷试验,分析机组在不同水头下不同部位的振动、摆度、压力脉动,将机组的运行区划分为低负荷区、强涡带工况区、稳定运行区等3个区域。
近年来随着信号分析方法的发展,国内外许多学者将时频分析方法应用到振动区划分,陈国青等7提出将振动信号灰度矩值作为表征振动信号强弱的特征值,并以实际数据对云南某电厂水电机组振动区划分。樊玉林等8通过短时傅里叶变换对水轮机升负荷过程的水导摆度信号进行分析,根据涡带频率随负荷的变化规律划分运行工况区。随着工业大数据时代来临,机组在线状态监测系统数据被应用到振动区划分,娄强等9提出一种基于机组在线监测数据、辅以稳定性试验分析的运行区精细划分方法,较传统的划分方法在涡带区边界、识别涡带区范围等方面有优势。严耀亮等10对水布垭电厂4台机组状态监测系统采集的海量数据进行挖掘、整理和分析,对机组运行区提出规划建议。在线状态监测系统数据具有种类丰富、数据量大的特点,而绝大多数稳定性参数测点峰峰值没有超过国标限值,数据处理过程会浪费大量时间精力,如何快速有效获取机组状态数据信息显得尤为重要。
本文针对在线状态监测系统海量数据信息的快速有效挖掘问题,通过稳定性参数超标次数统计的方法筛选能够反映机组稳定性状态的关键测点,将在线状态监测系统中各工况区间稳定运行数据作为样本,构建基于极限学习机分类器的机组振动区划分模型,研究基于数据挖掘和ELM的水电机组振动区划分方法。

1 数据来源与理论方法

基于数据驱动和ELM的水电机组振动区划分模型,首先通过数据库获取在线状态监测系统的海量数据中全工况区间数据,广泛统计各稳定性参数测点峰峰值超出国家或行业标准限值的次数,并根据各测点越限频次选取能够真实反映机组运行状态的稳定性参数测点。进一步,以筛选的稳定性参数测点峰峰值和工况量为特征向量集,构建基于ELM分类器的机组运行状态判别模型,最终实现机组全工况区间振动区划分。

1.1 数据来源

水电机组是结构复杂、部件繁多的非线性系统,在线状态监测系统实时对机组运行过程中各方面数据和信息进行采集和存储,其数据种类丰富。传统的水电机组振动区划分以机组几个特征水头下的变负荷试验数据为数据来源,本文考虑将在线状态监测系统数据作为数据来源,不仅包括了变负荷试验数据,而且还包括机组日常发电运行数据。但是在线状态监测系统中稳定性参数测点较多,需要根据机组实际运行情况,筛选能够明显反映机组运行状态的测点。
本文以浙江省某电厂混流式机组为研究对象,机组单机容量为55 MW,额定转速200 r/min,设计水头69.0 m,最大水头85 m,最小水头60.5 m。该水电厂搭建了振动区划分数据库,对在线状态监测系统中稳定性参数测点峰峰值和工况量以数据表的形式进行存储。数据库自2018年12月投入运行以来,已经累计存储机组稳定负荷运行数据1 821 730条,剔除其中由于数据库安装调试、传感器损坏和通信中断等原因导致的错误数据,最终可以用来振动区划分的数据为1 568 902条。本文对各稳定性参数测点峰峰值超过国家或行业中规定限值的次数进行统计,各测点超标次数进行排序如表1所示。从表1可知,稳定性参数测点超标次数超过10 000次的测点有水导X向摆度、定子机架垂直振动、顶盖X向水平振动、顶盖Y向水平振动等四个测点,其他测点超标次数与以上4个测点超标次数相比数量明显较少,可以忽略不计,因此,本文将以上4个测点峰峰值作为表征机组运行稳定性状态的特征和振动区划分数据来源。
表1 测点超标次数排序表

Tab.1 Ranking table of the number of outliers of test points

排序 测点名称 次数
1 定子机架垂直振动 329 040
2 水导X向摆度 258 751
3 顶盖X向水平振动 144 156
4 顶盖Y向水平振动 19 260
5 下导X向振动 240
6 下导Y向振动 240
7 顶盖垂直振动 145
8 蜗壳进口压力脉动 98
9 水导Y向摆度 32

1.2 极限学习机原理

极限学习机(Extreme Learning Machine-ELM)是一种学习速率快且泛化性能强的高效预测智能算法11。ELM是由输入层、隐含层和输出层组成的经典单隐层前馈神经网络模型1213,极限学习机的网络结构如图1所示,随机选取输入层权重和隐藏层偏置,输出层权重通过最小化由训练误差项和输出层权重范数的正则项构成的损失函数,依据Moore-Penrose(MP)广义逆矩阵理论计算解析求出14
图1 极限学习机网络结构图

Fig.1 Extreme learning machine network structure diagram

Full size|PPT slide

极限学习机算法具体原理如下:对于有N个训练样本(xi,yi ),xi =[xi1xi2,…,xinTϵRnyi =[yi1yi2,…,yinTϵRm 分别为样本输入数据和输出数据。对于一个有L个隐层神经节点数,激励函数为g(x)的极限学习机表达式为15
i=1Lβigwixj+bi=οj,j=1,,N
式中:βi 为输出权重;wi =[wi1wi2,…,winT为输入权重;bi 为第i层隐含节点阈值。
极限学习机的目的是使输出误差最小,即通过最小化近似平方差的方法对连接隐藏层和输出层的权重(β)进行求解,目标函数如下:
minHβ-T2,βRL×m
式中: H 是隐藏层的输出矩阵; T 是训练数据的目标矩阵。
H=hx1,,hxNT=h1x1hLx1             h1xNhLxN,T=t1TtNT
通过线代和矩阵论的知识可推导得公式(3)的最优解为:
β*=H+T
式中:H+ 为矩阵 H 的Moore–Penrose广义逆矩阵。
这时问题就转化为求计算矩阵 H 的Moore–Penrose广义逆矩阵,该问题主要的几种方法有正交投影法、正交化法、迭代法和奇异值分解法(SVD)。当H T H为非奇异(可逆)时可使用正交投影法,这时可得计算结果是:
H+=HTH-1HT

1.3 极限学习机性能实验验证

采用美国西储大学轴承数据中心的数据验证ELM分类器的可靠性,实验平台中驱动端轴承型号为6205-2RSJEMSKF深沟球轴承,采样频率为12 kHz,通过电火花加工技术设置轴承不同的单点故障,振动信号由放置在轴承座上方的加速度传感器采集,驱动端轴承数据类型包括正常数据、内圈故障数据、外圈故障数据和滚动体故障数据16
本文选取负荷为1 470 W、电机转速为1 730 r/min、采样频率为12 kHz、故障直径为0533 4 mm、故障深度为0.279 4 mm时,以上四种运行状态驱动端轴承振动波形数据,将其振动峰峰值数据作为ELM算法输入数据,4种运行状态标签作为ELM算法输出数据。对ELM算法中隐层神经元节点数设置为20个,4种状态分别随机抽取100组峰峰值数据作为样本数据,将400组样本数据,按照训练集数目:测试集数目=6∶4比例随机分配,模型训练30次。以第15次训练结果为例,本次ELM算法训练集准确率和测试集准确率分别为0.987 5和0.981 2,表2为每种状态40个不同样本的故障识别结果,从表中可知轴承正常状态和内圈故障状态的识别率达到了100%,外圈故障状态有一个样本没有被正确识别,识别率为97.5%,滚动体故障状态有两个样本没有被正确识别,识别率为95%,整体平均识别率为98.12%。
表2 ELM算法故障识别结果

Tab.2 ELM Algorithm fault identification results

故障类型 分类结果 分类准确率/%
正常 内圈故障 外圈故障 滚动体故障
正常 40 0 0 0 100
内圈故障 0 40 0 0 100
外圈故障 0 1 39 0 97.5
滚动体故障 0 0 2 38 95
ELM分类器进行30次独立实验,经数据统计后,测试集最大准确率为0.993 8,最小准确率为0.975 0,平均准确率为 0.985 0。因此,将ELM分类器应用到测点峰峰值故障数据分类识别中可信度较高。

2 基于数据驱动和ELM的水电机组振动区划分模型

2.1 模型建立

水电机组是一个水机电耦合的系统,在不同水头和不同负荷区间内运行时,机组稳定性表现不同,因此,极限学习机的特征向量集除了能够反映机组稳定性的测点峰峰值数据以外,还应包括机组运行水头和负荷。本文对23个稳定性参数测点峰峰值数据清理、筛选和统计后,将水导X向摆度、定子机架Z向振动、顶盖X向水平振动、顶盖Y向水平振动峰峰值用来反映机组振动稳定性,将以上六种特征量作为ELM分类器的输入特征向量集,输出标签为机组稳定性状态,模型示意图如图2所示。
图2 基于数据驱动和ELM的水电机组振动区划分模型示意图

Fig.2 Schematic diagram of data-driven and ELM-based vibration zoning model for hydropower units

Full size|PPT slide

机组稳定性状态通过4个稳定性参数超标测点数目反映,当没有测点超标时,机组运行工况区间为“建议运行区”;当有一个测点超标时,机组运行工况区间为“限制运行区”;当有两个及以上测点超标时,机组运行工况区间为“规避运行区”。样本数据包括训练集样本数据和测试集样本数据,其中训练集样本特征量为机组各个工况区间稳定运行时随机选取相同数量数据,训练集样本标签为训练集样本中稳定性参数测点超标数目,即机组稳定性状态;测试集样本特征量为数据库中机组各个工况区间最近运行数据,测试集样本期望输出为测试集中稳定性参数测点超标数目。
采用ELM分类器对训练集样本特征量和标签进行分类训练,当训练集准确率达到90%以上时训练完成,然后将测试集样本特征量作为ELM分类器输入,对测试集样本进行分类,输出结果为各工况区间机组稳定性状态,根据输出结果划出机组振动区基于数据挖掘和ELM的水电机组振动区划分模型流程图,如图3所示。
图3 基于数据驱动和ELM的水电机组振动区划分建模流程图

Fig.3 Flow chart of data-driven and ELM-based model for vibration zoning of hydropower units

Full size|PPT slide

2.2 应用实例

2.2.1 样本数据选取

通过数据库随机选取机组在不同工况区间内相同数量数据,ELM分类器特征向量集包括水头、负荷、水导X向摆度峰峰值、定子机架Z向振动峰峰值、顶盖X向水平振动峰峰值和顶盖Y向水平振动峰峰值共6个向量,样本覆盖不同水头和负荷的454个工况区间,覆盖工况区间如图4所示。训练集样本为每个工况区间随机选取5条数据,其中部分工况区间数据小于两条则不考虑该工况区间,训练集样本数据共有2 022条,训练集标签为机组稳定运行状态。测试集样本为每个工况区间内一条最近运行数据,所有测试集样本数据共有454条数据。
图4 样本覆盖工况区间

Fig.4 Sample covering operating range

Full size|PPT slide

2.2.2 模型训练

基于数据驱动和ELM的水电机组振动区划分模型,对训练集样本进行分类训练时,需要设定ELM分类器的隐含层神经元个数,构建了隐层神经元节点个数为1~100的ELM分类器,然后对每个分类器对训练集样本训练50次,分别计算不同神经元数目的训练模型准确率的平均值,训练集和测试集平均准确率如图5所示。从图5中可知训练集准确度随隐层神经元节点数目的增加先增大后基本保持不变,当隐层神经元节点数目大于20个时,训练集准确率大于90%,符合模型搭建的需要,因此,本文将ELM算法的隐层神经元节点个数设置为20。
图5 不同数目隐层神经元节点准确度

Fig.5 Accuracy of hidden layer neurons with different number of nodes

Full size|PPT slide

对隐层神经元节点数目为20个的ELM分类器进行100次独立实验,准确率如表3所示。从图表中可知,经过100次独立实验后,训练集平均准确度为93.71%,测试集平均准确度为90.63%。
表3 100次独立实验准确率 (%)

Tab.3 100 independent experiments

最大值 平均值 最小值
训练集 94.71 93.71 91.64
测试集 93.17 90.63 88.55

2.2.3 振动区划分

传统的振动区划分方法通过变负荷试验,采用国家或行业标准规定的限制值划分振动区,该电站机组在2017年完成增容改造后,在低、中、高3个水头区间分别选取一个特征水头进行变负荷试验,振动区划分结果如图6所示。图中绿色区域为“建议运行区”,表示机组在该工况区间内运行稳定性状态良好;黄色区域为“限制运行区”,表示机组在该工况区间内运行稳定性状态一般;红色区域为“规避运行区”,表示机组在该工况区间内运行稳定性状态较差。从图中可知传统的振动区划分结果较为粗糙,覆盖工况区间有限,不能对机组全工况运行区进行划分。
图6 基于变负荷试验的振动区划分结果

Fig.6 Results of vibration zoning based on variable load test

Full size|PPT slide

将在线状态监测系统中机组所有稳定运行数据,按照国家或行业标准规定的限值划分振动区结果,如图7所示,对比图6可知,将在线监测系统数据应用到振动区划分中,覆盖工况区间更广,划分结果较为细致。
图7 基于在线监测系统的振动区划分结果

Fig.7 Results of vibration zoning based on on-line monitoring system

Full size|PPT slide

将测试集样本通过ELM模型反复进行100次实验,选取测试集准确率最高的输出作为机组各个工况区间稳定性状态分类结果,如图8所示。对比图6图7可知,该方法较传统变负荷试验的振动区划分结果覆盖工况区间更广,与基于在线监测系统数据的振动区划分结果基本一致。该方法对在线监测系统数据进行初步筛选后,最终应用于振动区划分模型实现的数据量仅为在线监测系统数据量的0.2%,因此该方法具有较高的运算效率。
图8 基于数据驱动和ELM的振动区划分结果

Fig.8 Results of vibration zoning based on data-driven and ELM

Full size|PPT slide

3 结 论

本文构建了基于数据驱动和ELM的水电机组振动区划分模型,对机组在线状态监测系统数据,通过数据库随机筛选全工况区间数据,获取用于表征机组稳定性状态的测点有效数据,通过训练集样本对振动区划分模型进行分类训练,根据测试集样本判别机组目前在各工况区间的稳定性状态,实现机组振动区的精确划分。实际应用表明,基于数据驱动和ELM的水电机组振动区划分方法可以高效快速利用海量在线监测系统数据,划分结果可靠性高,对指导电厂安全稳定运行具有重要意义。

参考文献

1
高菘,杨虎,付恩狄,等.基于生物地理学算法的水电机组PID参数优化[J].中国农村水利水电2020(10):242-247..
2
RODRIGO B MARCELO A C. Extended Isolation Forests for Fault Detection in Small Hydroelectric Plants[J]. Sustainability202012(16).
3
张长伟,徐成劢,王卫玉,等.水电机组振动信号的自适应VMD分析[J].中国农村水利水电2019(6):159-162.
4
刘东,王昕,黄建荧,等.基于小波变换与SVD的水电机组振动信号特征提取研究[J].中国农村水利水电2018(12):169-172.
5
翟晓阳,韦家庆,韦刚,等.广西乐滩水电站机组稳定性试验分析[J].水电站机电技术201942(7):18-20,36.
6
夏琳,陈启卷.某电厂混流式机组振动区试验及机组运行分区[J].水电能源科学201533(2):172-175.
7
陈国青,杜景琦,梁仕斌,等.基于小波分析及振动信号灰度矩的水电机组振动区建立方法研究[J].科学技术与工程201616(35):215-219.
8
樊玉林,张飞,付婧,等.基于短时傅里叶变换的水轮机涡带工况识别[J].人民长江201647(8):85-87.
9
娄强,王卫玉,陈启卷,等.基于在线监测数据的水轮机运行区精细划分[J].水力发电学报201837(10):96-102.
10
严耀亮,孙伟.大数据时代基于全工况的机组稳定性分析[J].水电与抽水蓄能20173(3):55-61.
11
胡庆国,田学泽,何忠明.基于遗传算法优化极限学习机的绿色建筑投资估算方法[J].建筑经济202041(10):125-130.
12
徐肖遥,张鹏飞,蒋剑.基于EMD-PSO-ELM算法的大坝变形预测研究[J].软件导刊202019(9):1-5.
13
CHEN S Y GU C S LIN C N,et al. Prediction, monitoring, and interpretation of dam leakage flow via adaptative kernel extreme learning machine[J].Measurement2020166(166):
14
于海洋.在线预测的极限学习机方法研究[D].长春:吉林大学,2019.
15
徐肖遥,张鹏飞,蒋剑.基于EMD-PSO-ELM算法的大坝变形预测研究[J].软件导刊202019(9):1-5.
16
陈鹏,赵小强,朱奇先.基于VMD-MPE-KPCA特征提取与MRVM相混合的滚动轴承故障诊断方法[J].兰州理工大学学报202046(5):92-99.
PDF(2080 KB)

访问

引用

详细情况

段落导航
相关文章

/