基于ForecastNet的径流模拟及多步预测

刘昱, 闫宝伟, 刘金华, 穆冉, 王浩

PDF(2670 KB)
中国农村水利水电 ›› 2022 ›› (5) : 152-156.
水文水资源

基于ForecastNet的径流模拟及多步预测

作者信息 +

Runoff Simulation and Multi-step Prediction Based on ForecastNet

Author information +
稿件信息 +

摘要

径流过程呈现出的强非线性,使得现有水文模型的预测性能受到制约,深度学习等人工智能方法具有较强的非线性拟合能力,一定程度上可以突破现有瓶颈。为有效提取径流序列的非线性时变特征信息,提高径流模拟精度和多步预测性能,以雅砻江上游雅江流域为研究对象,建立了基于具有时变结构的ForecastNet径流预测模型,并与传统水文模型SWAT(Soil and Water Assessnent Teol)和神经网络模型RNN(Recurrent Neural Network)、LSTM(Long Short-Term Memory)及其组合进行对比分析。结果表明,ForcastNet模型在长预见期径流预测中有较强的适用性,能有效提高径流模拟及多步预测精度,为高精度实时径流预测提供了一种技术支撑。

Abstract

The strong nonlinearity presented by the runoff process constrains the prediction performance of the existing hydrological models. The artificial intelligence methods such as deep learning with strong nonlinear fitting ability can break through the current bottleneck to a certain extent. To effectively extract the nonlinear time-varying feature information of runoff sequences and improve the accuracy of runoff simulation and the multi-step-head forecasting performance, the ForecastNet based runoff prediction model with time-varying structure has been established. The Yajiang River Basin in the upper reaches of the Yalong River is taken as a case study, and comparative analyses among the ForecastNet, traditional hydrological model of SWAT(Soil and Water Assessnent Teol), and neural network models of RNN(Recurrent Neural Network), LSTM(Long Short-Term Memory) and RNN-LSTM are carried out. The results show that the ForcastNet model has strong applicability in long term prediction, and can effectively improve the accuracy of runoff simulation and multi-step-ahead forecasting, thus providing technical support for high-precision real-time runoff prediction.

关键词

径流模拟 / 多步预测 / 时变结构 / ForecastNet / SWAT

Key words

runoff simulation / multi-step-ahead forecasting / time-varying structure / ForecastNet / SWAT

基金

国家重点研发计划项目(2021YFC3200301)
国家自然科学基金项目(52079054)
湖北省自然科学基金(2021CFB325)
中国电建水电工程水文气象重大关键技术应用研究(DJ-ZDZX-2016-02)

引用本文

导出引用
刘昱 , 闫宝伟 , 刘金华 , 穆冉 , 王浩. 基于ForecastNet的径流模拟及多步预测[J].中国农村水利水电, 2022(5): 152-156
Yu LIU , Bao-wei YAN , Jin-hua LIU , Ran MU , Hao WANG. Runoff Simulation and Multi-step Prediction Based on ForecastNet[J].China Rural Water and Hydropower, 2022(5): 152-156

0 引 言

高精度径流预报对防洪减灾、水库群梯级联合调度、水资源优化配置等具有重要指导意义1。一直以来,水文预报领域的学者们都在尝试使用参数化方法描述流域降雨径流过程的边界条件、时空分布和物理过程,即传统意义上的水文模型2。受气象、自然地理条件、流域特性等众多因素的综合影响,径流过程呈现出强非线性、非平稳性和随机性等多种特性,使得传统水文模型的预报精度受到制约34
人工智能和机器学习的兴起,逐渐改变着人类生产生活方式和思维方式,对经济发展、社会进步等方面产生重大而深远的影响。现有水文预报方法众多,基于机器学习的数据驱动径流预报模型因不需要深入了解水文过程的物理机理而备受关注5。其中,循环神经网络RNN及其变体时间长短记忆模型LSTM应用较为广泛67。这类神经网络模型都会生成一组具有固定体系的结构单元,这些单元随着时间的推移而被不断复制,为时不变模型。在多步预测中时间不变性会降低模型学习跨多个时间步长的能力,使得多步预测的精度逐渐降低。为此,引入时变的ForecastNet神经网络模型8,分析其在径流模拟和预报中的适用性,研究其多步预测效果,以期为径流的实时预报提供依据。

1 ForecastNet模型结构

RNN是深度学习中常见的神经网络结构,主要用于处理和预测时间序列数据。与传统前馈神经网络不同的是,RNN是有记忆功能的,如图1所示,其网络结构每层之间的节点是有连接的,其中隐藏层的输入不仅包含输入层的输出,还包含上一时刻隐藏层的输出。RNN的一般结构可表示为:
yt=fo(ht)ht=gs(xt,ht-1)
式中: xt yt分别为 t时刻的输入层和输出层; ht ht-1分别为 t时刻和 t-1时刻的隐藏层; gs fo分别为隐藏层和输出层的激活函数。
图1 RNN一般结构示意图

Fig.1 General structure of RNN

Full size|PPT slide

RNN具有一组随时间保持不变的链式结构单元,这种结构单元具有参数共享的优点8,但同时一方面会削弱其学习复杂时间依赖关系的能力,另一方面会存在梯度消失的难题。为了解决RNN中梯度消失的问题,LSTM通过引入门控结构,一定程度缓解了RNN梯度消失的问题,但其结构单元仍是随时间保持不变的。RNN和LSTM结构单元的时不变性会减弱模型在多步学习中的能力,降低多步预测的精度9。为更好学习时间序列的多步动态变化过程,如图2所示,在RNN基础上发展而来的ForecastNet通过建立交错输出的深度前馈架构,使其结构单元随时间变化,从而有效降低梯度消失的问题。ForecastNet的一般结构可表示为:
yt=ft(ht)ht=gt(xt,ht-1,yt-1)
式中: gt ft分别为隐藏层和输出层在 t时刻的激活函数。
图2 ForecastNet一般结构示意图

Fig.2 General structure of ForecastNet

Full size|PPT slide

ForecastNet是一种循环神经网络,其隐藏单元可以是某种形式的前馈神经网络,如多层感知器(Multi Pleperceptron,MLP)、卷积神经网络(Conudutional Neural Netuerk,CNN)或自注意力机制。作为一个前馈网络,即使每个隐藏单元的结构都是相同的,每个单元都有自己独特的参数,因此,它是一个时变结构。ForecastNet通过引入快捷链接结构10和输出层结果,使得隐藏层之间交错输出,其网络结构和参数随时间而变,梯度反向传播中的连乘形式也变为加法形式,而这种加法形式相比连乘形式更加稳定,从而可以减轻梯度消失问题,适用于模拟时间序列的长期动态过程。

2 应用研究

2.1 流域概况

雅砻江流域水量丰沛、落差大,干支流蕴藏了丰富的水力资源。根据雅砻江流域水能开发规划,到2025年以前,全流域水电项目开发将全面完成。因此高精度的径流模拟和预报可以为雅砻江流域梯级水库开发和运行提供科学依据。本研究以雅砻江雅江站以上流域作为研究区域(简称雅江流域),流域总面积6.5万km2,气象、水文站点和水系分布如图3所示。
图3 雅江流域水系图

Fig.3 The drainage system of Yajiang river basin

Full size|PPT slide

2.2 数据及模型准备

2.2.1 数据准备

选取雅江站1984-1997年的历史日径流数据作为模型的数据集,其中,1984-1994年共11年的数据用于模型率定,1995-1997年共3年的数据用于模型验证,数据分布如图4所示。
图4 雅江站径流数据集

Fig.4 The runoff dataset of Yajiang station

Full size|PPT slide

2.2.2 模型准备

为了验证ForecastNet模型在雅江流域的日径流模拟效果,建立传统分布式水文模型SWAT与其进行比较。SWAT模型是基于GIS的分布式水文模型,可模拟流域中多种不同的水文物理化学过程,常用来模拟和预测下垫面及气候变化下流域水文循环的响应。本研究以Cao等11建立的雅砻江SWAT模型为基础,得出了雅江站率定期和验证期的模拟径流。其中,SWAT模型所需的气象数据包括日降水量、最高、最低气温、太阳辐射、风速和相对湿度。为了保证两类模型输入的一致性,从上述气象数据中选取与雅江站径流相关性较高的预报因子作为ForecastNet模型输入,选取的预报因子包括图5中6个雨量站(清水河、石渠、色达、甘孜、新龙、道孚)的降雨数据、面平均最高气温、面平均最低气温和月份,共9项,输出即为雅江站的模拟径流。
图5 验证期径流模拟结果

Fig.5 Runoff simulation results in the validation period

Full size|PPT slide

为确保数据保持相同规模,ForecastNet的输入数据需要进行标准化处理。因此,采用最大最小归一化将上述气象和水文数据及其所对应的月份进行标准化,计算公式如下:
z=x-xminxmax-xmin
式中: z为标准化之后的数据; x为原始数据; xmin xmax分别为原始数据系列的最小值和最大值。
神经网络通常包含许多超参数,其值在ForecastNet模型建立开始之前需设定,无需从模型训练过程中获得。超参数优化或调整是找到超参数元组的过程,使得给定数据的损失函数最小12。ForecastNet模型的超参数及参数范围如表1所示,使用网格搜索方法1213寻求最优参数,结果如表1所示。
表1 ForecastNet模型最优参数表

Tab.1 Optimal parameters of ForecastNet

参数名称 参数含义 取值 取值范围
input_size 输入层节点数 9 2~32
output_size 输出层节点数 1 1~12
epochs 最大训练迭代次数 500 500~2 000
dropout_rate 学习率 0.001 0.000 1~0.01
n 隐藏层内神经元个数 256 2~512
batch_size 批大小 16 2~128
timesteps 输入时间步长 12 2~24
为了检验ForecastNet模型在多步实时预测中的预测性能,本研究进一步考虑当前径流,将其加入模型的输入,分别建立雅江流域不同预见期(3、5、7 d)的ForecastNet模型,并与RNN神经网络,LSTM神经网络和RNN-LSTM组合神经网络143种时不变循环神经网络模型进行对比分析。选取Nash-Suthcliffe系数(NSE)、均方根误差(RMSE)和百分比偏差(PBIAS)3个指标进行模型优劣的评价。

2.3 结果与分析

2.3.1 ForecastNet与SWAT模拟结果对比分析

表2给出了SWAT和ForecastNet在率定期和验证期的模拟精度评价结果。可以看出, SWAT在率定期和验证期的NSE均低于0.8,而ForecastNet的模拟精度明显高于SWAT,NSE分别达到0.88和0.82。图5图6分别给出了雅江站在验证期的径流模拟过程和实测-模拟径流相关图,可以看出,SWAT对于9月份汛期的洪水模拟明显偏大,而ForecastNet则能够较好地模拟该部分洪水过程。图6也显示出SWAT的模拟结果更加发散,而ForecastNet的模拟结果更加集中,与实测值更加接近。雅江流域位于雅砻江流域的上游,区域内降水站点稀少,且大部分分布于流域边界处,模型输入的雨量信息不能全面反映雅江流域降水空间分布的异质性,使得SWAT水文模型径流模拟结果偏差,而ForecastNet神经网络模型能够较好地提取预报因子相关信息,进一步挖掘时间序列的组成特性,有效提高径流模拟的精度。
表 2 径流模拟评价指标统计表

Tab.2 The statistical table of runoff simulation evaluation index

模型 率定期 验证期
NSE RMSE/(m³·s-1 PBIAS/% NSE RMSE/(m³·s-1 PBIAS/%
SWAT 0.77 285.62 -8.0 0.76 282.06 -3.2
ForecastNet 0.88 207.70 9.1 0.82 202.64 0.9
图6 实测-模拟径流相关图

Fig.6 Correlation between observed and simulated runoff

Full size|PPT slide

2.3.2 ForecastNet多步预测结果分析

进一步将当前实测径流作为输入加入模型,分别建立RNN、LSTM、RNN-LSTM和ForecastNet在不同预见期下(3、5、7 d)的实时预测模型,预见期的预测结果如表3所示。在预见期为3 d时,RNN、LSTM、RNN-LSTM的NSE还可以达到0.8以上,随着预见期的增加,这些模型的NSE下降较快,预见期为5 d时,NSE下降到0.75以下,预见期为7 d时,NSE下降到0.7以下。而ForecastNet表现更优,在3 d和5 d预见期的NSE分别高达0.88和0.82,预见期为7 d时,NSE仍能保持在0.75以上。图7给出了4种模型在不同预见期的预测值和实测值的相关图,同样,与RNN、LSTM和RNN-LSTM等时不变模型相比,ForecastNet的时变结构,使得其预测结果与实测值更为接近,且随着预见期的增长,ForecastNet预测精度降低地也较慢。
表3 4种模型预测结果对比

Tab.3 Comparison of forecasting results of four models

模型 3 d预见期 5 d预见期 7 d预见期
NSE RMSE/(m3·s-1 PBIAS/% NSE RMSE/(m3·s-1 PBIAS/% NSE RMSE/(m3·s-1 PBIAS/%
RNN 0.80 208.91 2.3 0.72 282.06 -3.2 0.65 323.16 5.6
LSTM 0.81 186.97 3.7 0.74 223.74 1.8 0.68 314.65 -2.7
RNN-LSTM 0.83 182.96 2.5 0.75 216.06 4.1 0.69 304.34 4.8
ForecastNet 0.88 170.16 -1.6 0.83 194.89 2.7 0.78 215.18 3.1
图7 预见期为3、5和7 d时的预测径流与实测值相关图

Fig.7 Correlation between observed and predicted runoff for 3, 5 and 7 d-ahead forecasts

Full size|PPT slide

3 结 论

针对传统水文模型及神经网络模型多步预测精度降低的问题,基于具有时变结构的ForecastNet模型,建立了雅江流域不同预见期的日尺度预测模型。与传统的水文模型SWAT相比,ForecastNet模型能够较好地提取预报因子相关信息,进一步挖掘时间序列的组成特性,有效提高径流模拟的精度;与RNN、LSTM及其组合神经网络模型相比,ForecastNet模型能够利用其时变特性提高长预见期的预测精度和稳定性。ForecastNet模型的这些优异表现,使得其更适合于径流的长预见期实时预测,为水库的实时运行和流域水资源管理提供决策依据。

参考文献

1
ZHU S ZHOU J YE L, et al. Streamflow estimation by support vector machine coupled with different methods of time series decomposition in the upper reaches of Yangtze River, China [J]. Environmental Earth Sciences201675(6):531.
2
芮孝芳.论流域水文模型[J].水利水电科技进展201737(4):1-7,58.
3
WOOD E F ROUNDY J K TROY T J, et al. Hyperresolution global land surface modeling: Meeting a grand challenge for monitoring Earth’s terrestrial water[J]. Water Resources Research201147, W05301. DOI:10.1029/2010WR010090 .
4
YIN Z LIAO W LEI X, et al. Comparing the Hydrological Responses of Conceptual and Process-Based Models with Varying Rain Gauge Density and Distribution[J]. Sustainability2018,10.DOI: 10.3390/Su10093209 .
5
XING B GAN R LIU G, et al. Monthly mean streamflow prediction based on bat algorithm-support vector machine [J]. Journal of Hydrologic Engineering201621(2):04 015 057.
6
KRATZERT F KLOTZ D HERRNEGGER M, et al. Toward Improved Predictions in Ungauged Basins: Exploiting the Power of Machine Learning[J]. Water Resources Research2019,55.
7
殷兆凯,廖卫红,王若佳,等.基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报[J].南水北调与水利科技201917(6):1-9,27.
8
李洁,林永峰.基于多时间尺度RNN的时序数据预测[J].计算机应用与软件201835(7):33-37,62.
9
DABROWSKI J ZHANG Y, RAHMAN,et al. ForecastNet: A Time-Variant Deep Feed-Forward Neural Network Architecture for Multi-Step-Ahead Time-Series Forecasting[J]. arXiv preprintarXiv2002.04155, 2020a
10
HE K ZHANG X REN S, alat. Deep residual learning for image recognition[J]. arXiv preprintarXiv: 512.03385, 2015a.
11
CHEN C BAOWEI Y JING G, et al. A framework for projecting future streamflow of the Yalong River basin to climate change [J]. Stochastic Environmental Research and Risk Assessment202135:1 549-1 562.
12
GOODFELLOW I BENGIO Y COURVILLE A, et al. Deep Learning [M]. MIT Press: Cambridge, MA, USA, 2016.
13
CHOLLET F ALLAIRE J. Deep Learning with R [M]. Manning Publications Company: Shelter Island, NY, USA, 2018.
14
曲星宇, 曾鹏, 李俊鹏. 基于RNN-LSTM的磨矿系统故障诊断技术[J]. 信息与控制201948(2):179-186.
PDF(2670 KB)

786

访问

0

引用

详细情况

段落导航
相关文章

/