基于CEEMDAN-WD-PSO-LSSVM模型的月径流预测研究

徐冬梅, 庄文涛, 王文川

PDF(2342 KB)
中国农村水利水电 ›› 2021 ›› (8) : 54-58,66.
水文水资源

基于CEEMDAN-WD-PSO-LSSVM模型的月径流预测研究

作者信息 +

Monthly Runoff Prediction Based on CEEMDAN-WD-PSO-LSSVM Model

Author information +
稿件信息 +

摘要

针对径流序列的非线性、非稳态化的特点导致直接预测精度低的问题,提出了一种二次分解径流时间序列,再经过最小二乘支持向量机(LSSVM)模型进行月径流预测的新途径。该方法首先利用自适应噪声的完整集成经验模态分解(CEEMDAN)算法来分解原始径流时间序列,得到一系列本征模态分量(IMF)。再利用小波分解(WD)对高频分量进行二次分解,更有效地提取原始数据中的隐含信息。把各分量作为基于粒子群算法(PSO)优化的LSSVM预测模型的输入,最后将每个分量预测结果进行叠加重构,得到最终结果。以洛河流域长水水文站月径流为例,验证结果表明:提出的CEEMDAN-WD-PSO-LSSVM组合模型的预测精度较单一模型有效提高了径流预报精度,CEEMDAN-WD二次分解可更有效地提取复杂径流序列的信息,为非线性、非稳态化的月径流时间序列预测提供了新方法。

Abstract

Aiming at the problem of low accuracy of direct prediction due to the non-linear and unstable characteristics of runoff series, a new method based on double decomposition of runoff time series and least squares support vector machine (LSSVM) model is proposed for monthly runoff prediction. Firstly, the complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN) is used to decompose the original runoff time series into a series of intrinsic mode function (IMF). Then the technique of wavelet decomposition (WD) is utilized to decompose the high-frequency components to extract the implicit information from the original data more effectively. Each component is taken as the input of the LSSVM prediction model optimized by particle swarm optimization (PSO). Finally, the prediction results of each component are superimposed and reconstructed to obtain the final result. Taking the monthly runoff at Changshui Hydrological Station in Luohe River Basin as an example, the verification results show that the proposed CEEMDAN-WD-PSO-LSSVM combination model improves the accuracy of runoff prediction better than that of the single model. The double decomposition conducted by CEEMDAN-WD is more powerful to detect the information of complex runoff series, and provide a new approach for forecasting the nonlinear and unstable monthly runoff time series.

关键词

径流预测 / CEEMDAN / 小波分解 / PSO-LSSVM模型 / 二次分解

Key words

runoff prediction / CEEMDAN / wavelet decomposition / PSO-LSSVM model / the secondary decomposition

基金

河南省科技攻关项目(202102310259)
国家自然科学基金项目(51509088)
河南省高校科技创新团队项目(18IRTSTHN009)

引用本文

导出引用
徐冬梅 , 庄文涛 , 王文川. 基于CEEMDAN-WD-PSO-LSSVM模型的月径流预测研究[J].中国农村水利水电, 2021(8): 54-58,66
Dong-mei XU , Wen-tao ZHUANG , Wen-chuan WANG. Monthly Runoff Prediction Based on CEEMDAN-WD-PSO-LSSVM Model[J].China Rural Water and Hydropower, 2021(8): 54-58,66

0 引 言

径流量是河川的重要水文变量之一,其准确预测可以为水资源系统特性分析和高效利用提供可靠依据1。由于水文系统复杂,河川径流受气候变化、下垫面和人类活动等众多外界因素的影响,其序列常常表现出多时间尺度变化特征和非平稳特征,这给月径流的精确预测带来很大困难2
根据国内外研究现状,传统的中长期径流预测方法主要是应用数理统计理论和方法。近年来,随着人工智能和计算机技术的不断发展,基于数据驱动的现代智能算法正在逐步代替传统的数理统计方法3,为径流预报提供新的研究途径,如回归分析模型4、人工神经网络模型5、灰色系统分析模型6、支持向量机模型7等被用来进行水文时间序列预测。其中支持向量机实现了结构风险最小化原理,理论上可以得到回归或者分类问题的全局最优解,是水文预报领域研究的重点。如李文莉等8将粒子群算法优化的LSSVM模型成功应用于月径流预测,在一定程度上改善了径流预测效果。
当前径流预测的研究大多注重引入新的预测模型方法。然而,在实际预测过程中,由于径流时间序列具有复杂性,单一预测模型很难反映径流的形成过程和变化规律,难以对整个径流过程进行有效的拟合9。近年来,预测模型耦合越来越受到水文研究者的关注,混合模型在实际中是采用各种分解方法与不同预测模型进行组合,以分解算法为基础,对数据进行预处理降低序列非平稳性来达到提高模型预测精度的目的。张敬平等10提出了经验模态分解与径向基函数神经网络混合径流预测模型,利用经验模态分解处理原始径流序列,充分发挥了径向基函数神经网络的优势,在减小径流预测误差方面有明显改善。周婷等11将WD方法和支持向量机组合应用于径流预测,WD分解算法的引入可以显著提高预测可靠性和预测精度。张金萍等12建立CEEMDAN-ARMA组合模型预测年径流量,改善了EMD分解存在的模态混叠问题,能更好地提取径流序列中的信息,同时也验证了分解-预测较单一ARMA模型能有效减少预测误差,得到更准确的预测结果。这表明采用分解技术对数据进行预处理,对径流预测精度的提高是有效的。但是,一次分解技术不能很好地处理强非平稳性和非线性序列,如CEEMDAN分解产生的高频分量仍具有很强的波动性,会增加建模难度,从而对预测精度产生影响。
针对上述存在的问题,为进一步提高月径流预测精度,本文提出利用WD技术进一步处理CEEMDAN分解的高频序列,使得分解后的序列更加平稳,减少混合建模的预测误差,提高PSO-LSSVM模型对中长期月径流的预测能力。

1 研究方法

1.1 自适应噪声完整集成经验模态分解

CEEMDAN是Torres M E等132011年提出的一种新型噪声辅助数据分析方法。它弥补了EMD14和EEMD15两种方法存在的模态混淆以及重构序列中噪声残留缺点,还提高了计算效率。其具体算法如下:
(1)对原始序列xt)中添加有限数量的自适应白噪声 φ0ωiti=1,2…I),I为试验次数。得到:
xit=xt+φ0 ωit
(2)使用EMD对每一个 xit=xt+φ0 ωi(t)i=1,2…I进行分解,得到第一个模态分量IMF 1和余量 r1(t)
IMF1=1Ii=1IIMF1it
r1t=xt-IMF1t
(3)在余量 r1(t)中添加白噪声 φ1E1ωit,其中E为EMD分解运算符,再进行EMD分解得到第二个模态分量IMF 2及余量 r2t
IMF2=1Ii=1IE1r1(t)+φ1E1[ωit]
式中: Ek为EMD分解产生的第k阶模态分量。
(4)计算第 k个余量:
rkt=xt-IMFkt
(5)对每一个添加白噪声余量分解,得到CEEMDAN的第k+1阶模态分量:
IMFk+1=1Ii=1IE1rkt+φkEkωit
重复(4)、(5),直到找出所有IMF分量。

1.2 小波分解

WD分解是近年来被应用广泛的分解方法,通过小波基的伸缩和平移分解非平稳信号,根据局部变换时间和频率,有效地从研究序列中提取信息,得到低频分量和高频分量。小波分解将每层低频分量通过低通滤波器和高通滤波器得到下一层的低频部分和高频部分,实现了低频趋势序列和高频细节序列的有效分离。原时间序列与各子序列关系可以表示成:
xt=akt+i=1kdit
式中:ak 为低频分量;di 为高频分量;k为分解层数。
小波分解过程最重要的是小波基函数和小波的层数选择16,本文采用db4小波基函数和3层小波分解。如图1所示。
图1 小波3层分解

Fig.1 Wavelet three level decomposition

Full size|PPT slide

1.3 LSSVM模型

由Suykens等17提出的LSSVM是SVM的一种改进模型,采用最小二乘线性系统,将不等式约束转化为等式约束。把求解二次规划问题转变为求解线性方程组,简化计算复杂度,收敛速度更快,预测精度更高。其具体步骤如下:
(1)设N个数据点的训练集 xi,yii=1N,其中 xiRn为输入向量, yiRn为输出值。则样本线性回归函数为:
fx=ωTψx+b
式中:ω为权向量;ψx)为非线性映射函数;b为偏置量。
(2)依据结构风险最小化原则,构造LSSVM优化问题:
minJω,ξ=12ωTω+βi=1Nξ2
约束条件为:
yi=ωTψx+b+ξi
式中:β为惩罚因子;ξ为误差。
(3)采用拉格朗日法求解目标函数得到:
Lω,b,ξ,α=JωTξ-i=1NαiωTψxi+b+ξ-yi
式中: α为拉格朗日乘子。
(4)根据KKT优化条件,分别对 ω bξα求偏导,得到
LSSVM模型函数为:
fx=i=1NαiKx,xi+b
式中:Kxxi )为核函数。
本文核函数采用径向基RBF函数:
Kxi,xj=e-xi-xj22σ2
式中:σ 2为核函数参数。

1.4 PSO算法

粒子群算法是基于模拟鸟群的觅食行为全局优化算法,通过个体间信息传递与合作来寻找最优解18。粒子迭代搜索,收敛速度快,设置参数少,具有很强的全局寻优能力。
核函数参数σ和惩罚因子β会直接影响LSSVM模型预测精度,本文通过PSO算法迭代寻找LSSVM模型一组最优参数σβ。算法原理如下:
首先随机初始化生成一群粒子,迭代时,每个粒子根据适应度值跟踪自己的个体历史最优解和群体历史最优解。根据式(14)和(15)来更新自己的速度和位置。
vik+1=ω vik+c1randpbestik-xik+c2randgbestik-xik
xik+1=xik+vik+1
式中:xivi 分别为粒子的速度和位置;c 1c 2为学习因子;ω为惯性因子;rand()为(0,1)之间随机数。

1.5 CEEMDAN-WD-PSO-LSSVM模型构建

CEEMDAN可以将非平稳复杂序列分解为若干个复杂度低的子序列,对各个分量建立预测模型可有效提高预测精度。但是,以往对CEEMDAN分解建模时,没有考虑高频子序列复杂性较高,会降低预测精度。由于小波分解可以对CEEMDAN得到高频子序列进一步分解,降低高频子序列复杂性。因此,本文提出二次分解技术,即采用CEEMDAN分解原始径流序列,小波分解算法对其复杂度高的子序列进行二次分解,结合PSO优化的LSSVM预测模型,提高月径流预测精度。组合模型建模流程如图2所示。
图2 CEEMDAN-WD-PSO-LSSVM组合模型流程图

Fig.2 Hybrid CEEMDAN-WD-PSO-LSSVM model flow chart

Full size|PPT slide

2 实例应用

洛河是洛宁县境内最大最主要的河流,同时也是黄河右岸的重要支流,黄河的主要洪水来源之一。河道全长447 km,河南境内长366 km。流域面积达18 881 km2。长水水文站建于1951年,位于河南洛宁县长水镇,有着搜集洛河流域水文基本信息和及时向防汛应急部门提供实时水情信息的重要任务。受季风气候影响,降水量随季节变化有很大差异,径流变化剧烈。该站1956-2016年实测月径流序列如图3所示。其序列足够长,资料精度高,该资料的代表性能够得到保证。
图3 长水站月径流序列

Fig.3 Monthly runoff series in Changshui station

Full size|PPT slide

2.1 CEEMDAN分解月径流时序数据

通过CEEMDAN方法对长水站1956-2016年月径流样本数据进行分解,降低原始径流时间序列的波动性。设定CEEMDAN算法参数Nstd为0.2,NR为100,Maxlter为5 000,原始径流序列最终分解为9个IMF分量和1个余量r,共10个分量。r分量反映出长水站径流总体呈下降趋势,分解结果如图4所示。其子序列表现出该径流序列的频率变化和振幅变化。频率由高到低、振幅从大到小进行排列,从图4中可以看出IMF1、IMF2和IMF3波动最大,复杂度较高,依然具有很强的非线性和非平稳性特征,不利于预测的准确性。
图4 CEEMDAN分解月径流序列结果

Fig.4 Decomposition results of monthly runoff series using CEEMDAN

Full size|PPT slide

2.2 WD二次分解

针对利用高频分量建模预测效果不理想的问题,在建模时利用WD对其进行二次分解,以进一步降低高频子序列的复杂性。本文采用db4小波基函数通过Matlab2018b软件的小波工具箱对IMF1、IMF2以及IMF3进行3层小波分解获取其趋势序列和细节序列。WD分解IMF1的结果如图5所示。对IMF2、IMF3等高频序列分别进行WD分解,原始径流序列经过CEEMDAN-WD二次分解之后共有19个子序列。
图5 小波分解IMF1结果

Fig.5 Results of wavelet decomposition of IMF1

Full size|PPT slide

2.3 模型构建及预测

利用PSO优化算法,对LSSVM的两个参数 β σ进行寻优,建立PSO-LSSVM模型。初始化粒子群的种群大小、学习因子、位置、速度、搜索范围和迭代次数。PSO算法基本参数为:学习因子c 1c 2都设为2,最大迭代次数K设为100,种群数量m设为20, ω0.4,0.99。将经CEEMDAN分解的复杂性较低分量和IMF1、IMF2和IMF3经WD方法二次分解的各分量作为PSO-LSSVM模型的输入,分别预测各分量的结果,最后将每个子序列预测结果叠加得到最终月径流量预测值。本文基于Matlab2018b软件和LSSVM工具箱预测研究,利用长水站1956-2016年共61年月径流观测数据,共计732个月径流数据,利用前672个径流数据为训练样本,训练模型,后60个数据为测试样本用于验证模型。
选取单一PSO-LSSVM预测模型、组合模型CEEMDAN-PSO-LSSVM模型、WD-PSO-LSSVM模型以及CEEMDAN-WD-PSO-LSSVM四种方法分别进行预测,用来比较模型预测效果。各模型预测结果如图6所示。
图6 不同模型预测结果

Fig.6 Prediction results of different models

Full size|PPT slide

2.4 预测结果评价准则

为评价CEEMDAN-WD-PSO-LSSVM混合模型的预测精度,选取均方根误差RMSE、纳什效率系数NSEC、平均绝对百分比误差MAPE、相关系数R四种评价指标来评价模型的预测结果的优劣,4种评价准则计算公式为:
RMSE=1ni=1n(yi-ŷi)2
NSEC=1-i=1n(yi-ŷi)2i=1n(yi-yavg)2
MAPE=100ni=1nyi-ŷiyi
R=i=1nyi-yavgŷi-ŷavgi=1nyi-yavg2ŷi-ŷavg2
式中: yi为第 i个样本的真实值; ŷi为第 i个样本的预测值; yavg为所有实测值的平均值; ŷavg为所有预测值的平均值。
利用组合模型拟合训练期的数据,并对训练期和验证期的数据进行模拟及预测,不同模型的预测结果评价统计如表1所列。表1的结果分别比较了4类模型训练期月径流量和验证期月径流量的RNSECRMSEMAPE
表1 各种模型预测误差对比

Tab.1 Comparison of prediction errors of various models

模 型 训练期 验证期
R NSEC RMSE MAPE/% R NSEC RMSE MAPE/%
PSO-LSSVM 0.49 0.24 10 640.31 204.87 0.32 -0.24 4 426.27 554.29
CEEMDAN-PSO-LSSVM 0.94 0.89 4 137.93 111.57 0.83 0.66 2 331.12 164.06
WD-PSO-LSSVM 0.98 0.95 2 627.13 67.75 0.94 0.87 1 419.97 117.70
CEEMDAN-WD-PSO-LSSVM 0.98 0.96 2 389.06 57.19 0.96 0.91 1 165.00 83.90

2.5 预测结果分析

图6中可以看出单一PSO-LSSVM模型预测值与实测值误差较大,拟合效果最差,采用CEEMDAN-PSO-LSSVM单一分解方法得到的预测结果与实测径流之间也存在较大偏差,对实测径流序列峰值,偏差更为明显。利用CEEMDAN-WD二次分解和PSO-LSSVM组合模型拟合效果最好,预测结果更接近实际径流,验证了本文所提模型的准确性和优越性。
表1中评价准则统计结果可以看出,组合模型CEEMDAN-PSO-LSSVM、WD-PSO-LSSVM和CEEMDAN-WD-PSO-LSSVM的预测效果远优于单一的PSO-LSSVM预测模型,在验证期RNSECRMSEMAPE四项准确性评价指标上都有较大的提高。
(1)CEEMDAN-WD-PSO-LSSVM组合模型与PSO-LSSVM模型相比,相关系数R和纳什效率系数NSEC分别提高了200.00%、479.17%;均方根误差RMSE和平均绝对百分比误差MAPE分别减少73.68%、84.86%。
(2)CEEMDAN-WD-PSO-LSSVM组合模型与CEEMDAN-PSO-LSSVM模型相比,相关系数R和纳什效率系数NSEC分别提高了15.66%、37.88%;均方根误差RMSE和平均绝对百分比误差MAPE分别减少了50.02%、48.86%。
(3)CEEMDAN-WD-PSO-LSSVM组合模型与WD-PSO-LSSVM模型相比,相关系数R和纳什效率系数NSEC分别提高了2.13%、4.60%;均方根误差RMSE、平均绝对百分比误差MAPE分别减少了17.96%、28.72%。

3 结 论

为提高中长期径流预报的精度,本文研究了CEEMDAN-WD二次分解在径流时间序列中的实用性和可行性,构建了PSO-LSSVM、CEEMDAN-PSO-LSSVM、WD-PSO-LSSVM和CEEMDAN-WD-PSO-LSSVM 4种预测模型,并以洛河长水水文站月径流资料来验证对比了不同模型的预测效果。主要结论如下:
(1)相比于单一的PSO-LSSVM预测模型,CEEMDAN分解能有效地降低原始数据的复杂性,使得径流序列平稳,能够与预测模型进行更好的耦合,得到更准确的预测结果。
(2)WD分解技术可以将序列分解成高频部分和低频部分,得到较为稳定的序列,对CEEMDAN无法解决高频序列的非平稳性特征有显著的处理能力。
(3)CEEMDAN-WD二次分解能最大限度对数据进行再处理,其组合模型优势明显,预测能力优于单一分解预测,能较大提高模型预测精度和可靠性。为中长期月径流预报研究提供一种新途径,其他流域的月径流预测及相关预测研究提供参考。

参考文献

1
王鑫,徐淑琴,李洪涛. 河川径流预测方法比较研究[J]. 中国农村水利水电2014(4):98-100.
2
雷晓辉,王浩,廖卫红,等. 变化环境下气象水文预报研究进展[J]. 水利学报201849(1):9-18.
3
王佳,王旭,王浩,等. 基于EEMD与ANN混合方法的水库月径流预测[J]. 人民黄河201941(5):43-46.
4
TOOTLE G A SINGH A K PIECHOTA T C, et al. Long Lead-Time Forecasting of U.S. Streamflow Using Partial Least Squares Regression[J]. Journal of Hydrologic Engineering200712(5):442-451.
5
赵益平,王文圣,刘浅奎. R/S-BP网络耦合模型及其在年径流预测中的应用[J]. 华北水利水电大学学报(自然科学版)201940(4):40-45.
6
张辉. 灰色理论在中长期水文预报中的应用研究[J]. 地下水201436(6):164-165.
7
李继伟,纪昌明,张新明,等. 基于支持向量机的水电站中长期径流组合预报[J]. 水电能源科学201331(11):13-16.
8
李文莉,李郁侠. 基于粒子群最小二乘支持向量机的水文预测[J]. 计算机应用201232(4):1 188-1 190.
9
张洪波,余荧皓,孙文博,等. 面向EMD分解的径流分量重构方法对比研究[J]. 南水北调与水利科技201715(1):60-66.
10
张敬平,黄强,赵雪花. 经验模态分解和RBF网络在径流预测中的应用[J]. 干旱区资源与环境201428(6):118-123.
11
周婷,金菊良,李荣波,等. 基于小波支持向量机的径流预测性能优化分析[J]. 水力发电学报201736(10):45-55.
12
姜锋,丁志宏,赵焱. 基于CEEMDAN的黑河莺落峡年径流量多时间尺度变化特征研究[J]. 中国农村水利水电2018(2):64-67.
13
TORRES M E COLOMINAS M A SCHLOTTHAUER G. A complete ensemble empirical mode decomposition with adaptive noise[C]// 2011 IEEE International Conference on Acoustics, Speech and Signal Processing, Prague, Czech Republic: IEEE, 2011: 4 144-4 147.
14
HUANG N E SHEN Z LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non- stationary time series analysis[J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences, 1998(454):903-995.
15
WU Z HUANG N. Ensemble Empirical Mode Decomposition: a Noise-Assisted Data Analysis Method[J]. Advances in Adaptive Data Analysis2009(1):1-41.
16
桑燕芳,王中根,刘昌明. 水文序列小波分析中分解层数选择方法[J]. 水文201232(4):1-7.
17
SUYKENS J A K VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters19999(3):293-300.
18
龙文,梁昔明,肖金红,等. 一种动态分级的混合粒子群优化算法[J]. 控制与决策200924(10):1 513-1 516.
PDF(2342 KB)

2712

访问

0

引用

详细情况

段落导航
相关文章

/