Application of the EEMD-ARIMA Combined Model in Drought Prediction： A Case Study in Xinjiang Uygur Autonomous Region

De-he XU; Yan DING; Qi ZHANG; Hui-ping HUANG

China Rural Water and Hydropower ›› 2021 ›› (7) : 1-11.

Author information +

History +

Abstract

In the context of global warming， drought becomes more and more frequent， causing negative impacts on agricultural and social activities. Based on the daily precipitation data of meteorological stations from 1960 to 2019 in Xinjiang Uygur Autonomous Region， this paper calculates the Standard Precipitation Index （SPI） in a timeframe of 1， 3， 6， 9， 12， 24 months， then time series SPI at different temporal scales are predicted by ARIMA model and EEMD-ARIMA combined model. And the effectiveness of model is judged by the evaluation standard of RMSE， MAE， and R² . The main conclusions are as follows： the forecast results of the EEMD-ARIMA combined model in Xinjiang are consistent with Xinjiang yearbook. Therefore， the combined model can be used in the prediction of drought. Compared with ARIMA model， EEMD-ARIMA combined model can effectively reduce the non-stationary of series and match the SPI series better. The prediction accuracy of EEMD-ARIMA combined model is higher than that of ARIMA model at each time scale. The combined model has significant advantages in drought prediction.

Key words

drought prediction / ARIMA model / EEMD-ARIMA combined model / SPI

Cite this article

EndNote

Ris (Procite)

Bibtex

Download Citations

De-he XU , Yan DING , Qi ZHANG , Hui-ping HUANG. Application of the EEMD-ARIMA Combined Model in Drought Prediction： A Case Study in Xinjiang Uygur Autonomous Region. China Rural Water and Hydropower. 2021, 0(7): 1-11

干旱灾害是常见的自然灾害之一，其发生的主要原因是一段时期内降水量的减少，若遇到高温、大风和低温等异常气候，则会进一步加重干旱程度^［1］。通常情况下，长时间的干旱将导致地区水资源供应不足，影响正常的农业生产和经济发展，造成不可估量的经济损失^［2］。因此，如何对干旱的发生情况进行准确评估、监测和分析，成为了国内外学者研究的热门议题^［3，4］。在对干旱进行研究的过程中，常使用易于进行对比分析和计算的干旱指标来评估干旱程度、持续时间和影响范围^［5-7］。常用的干旱评价指标有标准化降水指数（Standard Precipitation Index，SPI）、标准化降水蒸散指数（Standard Precipitation Evaporation Index，SPEI）、帕默尔干旱指数（Plamer Drought Severity Index，PDSI）等^［8-13］，其中SPI的运用最为广泛。SPI是用来描述一段时间内降水量出现频率多少的指标，可应用于不同时间尺度下的计算，干旱分级精度相对较高^［14-16］。不同时间尺度的SPI能够反映不同类型的干旱，1个月时间尺度的SPI适用于季节干旱的分析，6个月时间尺度的SPI可用于分析农业干旱，长时间尺度的SPI适于分析水文干旱。

近几年，国内干旱灾害时常发生，其中以西北地区最为严重^［17］。对新疆维吾尔自治区不同地区的干湿变化进行研究，探索不同时期的降水量对区域产生的影响，明确干旱的成因机制，可为相关部门在制定有效干旱应对措施时提供帮助，减少干旱灾害所带来的经济损失^［1］。目前，常用的干旱预测模型有差分自回归移动平均模型（Autoregressive Integrated Moving Average Model，ARIMA）、支持向量机（Support Vector Machine，SVM）等。其中ARIMA模型是最常用的数据驱动模型，常用于时间序列数据的预测。韩萍等利用ARIMA模型对多个时间尺度的SPI进行预测，并对模型预测结果进行对比分析，得出 ARIMA模型较适合SPI ₃、SPI ₆、SPI ₉序列的短期预测，适合SPI ₁₂、SPI ₂₄序列长期预测的结论^［18］；李佳佳等为识别长江流域月降水周期振荡和长期趋势的显著影响因子，应用集合经验模态分解（Ensemble Empirical Mode Decomposition，EEMD）方法，分别对各站点的月降水序列进行分解^［19］；王佳等基于EEMD-ANN （Artificial Neural Network，ANN）预报模型预测入库径流量，结果表明使用EEMD-ANN可以较为精准地进行径流量预测^［20］；李辉等为提取机组故障特征，将EEMD与SOM神经网络结合进行故障自动识别，结果表明该方法可以准确提取机组故障特征且计算速度快^［21］；李勃旭等为确定地铁门传动系统的退化状态，采用EMD-ARIMA模型对夹紧力峰值的均值和标准差进行预测，结果表明EMD-ARIMA模型能够较好的预测夹紧力的峰值^［22］。利用气象站点监测到的降雨量值计算得到的SPI序列属于典型的非平稳时间序列，而ARIMA模型能够更多的提取原始序列的信息，常用于处理非平稳的时间序列，因此可以利用ARIMA模型预测SPI序列^［23］。EEMD能够提取出原始信号在不同尺度的局部特征信号，精准地反映出原时间序列信号的物理特性，从而为模型预测提供稳定的前提。EEMD-ARIMA模型集合了EEMD和ARIMA模型的优点，通过EEMD分解得到时间序列平稳的局部特征，有利于ARIMA模型的预测，可以提高模型的预测精度。因此，本文利用EEMD-ARIMA组合模型对多尺度SPI序列进行预测，分析模型在干旱预测中的应用及优势，以期为干旱防控工作提供帮助。

本文通过对新疆维吾尔自治区32个气象站点于1960-2019年间收集到的降水量数据进行计算，得到不同时间尺度的SPI，通过ARIMA模型和EEMD-ARIMA组合模型，分别对1、3、6、9、12、24，6个时间尺度的SPI进行预测，并采用平均绝对误差（Mean Absolute Error，MAE）、均方根误差（Root Mean Square Error，RMSE）、决定系数（R-Square，R² ）对两种模型的预测精度进行评价。由于计算处理的数据量大，受论文篇幅限制无法展示所有数据的处理结果，加之本文侧重于讲述组合模型在干旱预测中的优势，故在文中仅以分布在整个新疆地区3个不同方位上的福海站、巴音布鲁克站、莎车站为例，分析组合模型的预测结果，并进行两种模型预测结果的对比和分析。两种模型对32个站点多尺度SPI的预测结果，结合ArcGIS的经验贝叶斯克里金插值法在文末进行可视化展示和分析。

1 研究区概况

新疆维吾尔自治区地理坐标介于34°25′N~48°10′N、 73°40′E~96°18′E之间。省域内平均海拔约1 000 m，区域北部有阿尔泰山，南部有昆仑山系，省域中部的天山以北为准噶尔盆地，南部为塔里木盆地。新疆维吾尔自治区远离海洋，区域地形复杂，四周高山环绕，海洋气流不易到达，致使区域内气候干燥，是典型的干旱、半干旱地区。区域年平均降水量在150 mm左右，区域北部的降水量高于南部，各地降水量相差很大。受气候和地理环境的影响，新疆维吾尔自治区生态环境脆弱，各种自然灾害频繁发生，在全球气候变暖的形势下，干旱灾害产生的影响呈现出扩大化的趋势^{［24，25］}。

Fig.1 Distribution of meteorological stations in study area

图1 研究区域及气象站点分布

Full size|PPT slide

2 数据来源与方法

2.1 数据来源

本文所用逐日降水量数据来源于国家气象科学数据中心（http：//data.cma.cn/）中新疆维吾尔自治区气象站观测数据。所用新疆维吾尔自治区地理高程数据来源于地理空间数据云（http：//www.gscloud.cn/search）。表1为所选3个示例站点的信息。

Tab.1 Information of sample meteorological stations

表1 示例气象站点信息

区站号	站名	经度/（°E）	纬度/（°N）	海拔/m
51068	福海	87.28	47.07	500.9
51542	巴音布鲁克	84.09	43.02	2458
51811	莎车	77.16	38.26	1 231.2

2.2 研究方法

**2.2.1 标准化降水指数（SPI）**

近年来，国内外学者常使用SPI指数进行气象干旱研究。SPI指数是通过计算出某时段内降水量的Γ分布概率，经正态标准化处理后，根据处理结果划分干旱等级。它可以用来反映一段时间内降水量出现频率的多少，易于计算且能直观反映气象干旱的程度^［26］。SPI的具体计算过程参见气象干旱等级（GB/T20481-2017）。依据国家标准气象干旱等级（GB/T20481-2017）规定的干旱分级标准（表2），根据计算得到的SPI，确定区域的干旱类型。

Tab.2 Drought classification based on SPI

表2 标准化降水指数干旱分级

等级	类型	SPI范围
1	无旱	SPI>-0.5
2	轻旱	-1.0<SPI≤-0.5
3	中旱	-1.5<SPI≤-1.0
4	重旱	-2.0<SPI≤-1.5
5	特旱	SPI≤-2.0

SPI ₁、SPI ₃、SPI ₆、SPI ₉、SPI ₁₂、SPI ₂₄分别对应1、3、6、9、12、24个月时间尺度的SPI。短时间尺度的SPI常用来反映短期内的降雨量变化。SPI ₁适用于气象干旱，可用于反映短期降水变化情况。3个月时间尺度下的SPI用来描述降雨量的季节变化，计算出的SPI ₃中5、8、11、2月数据可分别用于描述春、夏、秋、冬的干旱情况。6个月时间尺度下的SPI适用于农业干旱。长时间尺度的SPI常用来分析长期的干旱趋势。SPI ₉可用于表征较长时间内的地下水位变化。SPI ₁₂的时间周期较长，能较清楚的描述年际降雨量变化情况，24个月时间尺度的SPI序列则用于分析长期的降水变化所引起的干旱^［27-29］。

2.2.2 ARIMA模型

自回归移动平均模型（Auto-Regressive and Moving Average Model，ARMA）的建模思想是将预测值假定为一组随机序列，确定能够近似描述这组序列的模型，之后根据该序列的过去值和现在值，对未来值进行预测^［30］。ARMA模型分为自回归模型（Auto-Regressive，AR）、滑动平均模型（Moving-Average，MA）以及ARMA。只要是平稳且非白噪声的时间序列皆可通过建立ARMA模型进行预测，但大多数时间序列都是非平稳时间序列。因此，在时间序列具有某种趋势时，需要对时间序列进行d次差分，使其成为平稳序列。进行d次差分后的ARMA模型即为ARIMA模型。ARIMA（p，d，q）模型的一般式为：

\begin{array}{l} H_{t} = ϕ_{1} H_{t - 1} + ϕ_{2} H_{t - 2} + \dots + ϕ_{p} H_{t - p} \\ + u_{t} - θ_{1} u_{t - 1} - θ_{2} u_{t - 2} - \dots - θ_{q} u_{t - q} \end{array}

（1）

式中：H_t 为时间序列值；

ϕ_{i} (i = 1,2, \dots, p)

和

θ_{j} (j = 1,2, \dots, q)

分别为自回归系数和滑动平均系数；u_t 为白噪声序列，且

u_{t} ~ N (0, σ^{2})

。

ARIMA模型建模流程为：

（1）平稳性检验。本文使用单位根检验（Augmented Dickey-Fuller Test，ADF）法进行判断。在ADF检验中，原假设为非平稳时间序列且存在单位根，给定显著水平α=0.05，若检验统计量对应的概率值（P）小于0.05，则拒绝原假设^{［31，32］}。对于非平稳的时间序列需要进行差分，得到平稳序列。

（2）p、q取值范围确定。根据数据的自相关函数和偏自相关函数来确定模型阶数p、q的取值范围。

（3）模型定阶。采用赤池信息准则（Akaike Information Criterion，AIC）、贝叶斯信息准则（Bayesian Information Criterion，BIC）进行模型定阶，AIC、BIC公式如下：

A I C (p, q) = N l n σ^{2} (p, q) + 2 (p + q + 1)

（2）

B I C (p, q) = N l n σ^{2} (p, q) + (p + q + 1) l n N

（3）

式中：N为参数个数。

在不同p和q组合的模型中，选择AIC、BIC的最小值所对应的参数，从而得到最优ARIMA模型。

2.2.3 EEMD分解

1998年N E Huang等人提出了经验模态分解（Empirical Mode Decomposition，EMD），EMD能够完美地适应于全部的非线性、非平稳信号的处理，并且经过该方法处理后的结果具有相当高的信噪比^［33］。原始序列输入EMD后得到有限个固有模态函数（Intrinsic Mode Function，IMF）和余量，各IMF分量包含了原始序列不同时间尺度的局部特征，尽可能地保留原始数据的特性^［22］。EEMD是EMD的一种改进方法，与EMD相比，EEMD在信号中加入了高斯白噪声，高斯白噪声以其均匀分布的特性补偿了IMF分量的损失，其步骤算法如下^［34］：

（1）在原始数据 $Y (t)$ 中添加正态分布的白噪声序列 $ω_{i} (t)$ ，试验次数为i；

Y_{i} (t) = Y (t) + ω_{i} (t)

（4）

**（2）进行EMD分解，将含有白噪声的原始数据分解为IMF的组合；**

Y_{i} (t) = \sum_{j = 1}^{m} C_{i j} + R_{i m}

（5）

**（3）每次都加入服从同一分布的不同白噪声序列，重复步骤1和2，得到一组不同的IMF成分和残差；**

（4）以所有IMF的均值作为最终的IMF组。

\bar{C_{j}} (t) = \frac{1}{N} \sum_{n = 1}^{N} C_{j n} (t)

（6）

式中：

\bar{C_{j}} (t)

为通过EEMD分解得到的第

j

个IMF分量；

C_{j n} (t)

为第n次试验中经EMD分解成的第

j

个IMF分量；

N

为重复步骤3的次数。

最终的分解结果为：

Y (t) = \sum_{j = 1}^{m} C_{j} + r_{m}

（7）

2.2.4 EEMD-ARIMA模型

通过Python编程语言，将EEMD与ARIMA模型结合为新的预测方法EEMD-ARIMA模型。组合模型先利用EEMD将有非平稳特征的时间序列SPI分解为N项含有原序列局部特征的序列，再利用ARIMA模型对这些序列分别进行预测，最后把各项预测结果求和得到该序列的最终预测结果，这样的预测结果比直接用ARIMA模型预测的非平稳时间序列SPI的结果具有更高的精度。使用EEMD-ARIMA模型进行预测的步骤如下：

（1）EEMD处理。将降水量数据导入EEMD进行分解，原始序列分解为从高频到低频的IMF1、IMF2、…、IMFn以及残差量。残差量即趋势，将其记为IMFn+1。

（2）ARIMA模型处理。将IMF1、IMF2、…、IMFn+1，分别导入ARIMA模型进行预测，对各个分量进行平稳性检验和模型定阶，并将预测结果输出。预测结果记为P1、P2、…、Pn+1。

（3）对P1、P2、…、Pn+1进行相加求和。

P = \sum_{i = 1}^{n + 1} P i

（8）

EEMD-ARIMA模型建立流程见图2。

Fig.2 EEMD-ARIMA combined model forecast flow chart

图2 EEMD-ARIMA模型建立流程

Full size|PPT slide

2.3 评价指标

常见的回归预测评估指标有MAE、均方误差（Mean Square Error，MSE）、RMSE，其中MAE和MSE是基础的评估指标，RMSE是MSE指标的扩展，相较MSE指标更加准确。为了比较各模型预测精度的高低，本文选定了RMSE、MAE和R ² 3种评价指标对ARIMA模型和EEMD-ARIMA组合模型的预测结果进行评价。RMSE是用来衡量观测值与真实值之间的偏差，MAE是绝对误差的平均值，能够更好地反映预测值误差的实际情况，RMSE和MAE的值越小，模型效果越好。R² 是将预测值与均值进行对比，R² 越大，表示拟合效果越好，最大值为1。

R M S E = \sqrt[]{\frac{1}{N} \sum_{i = 1}^{N} {(x_{i} - y_{i})}^{2}}

（9）

M A E = \frac{1}{N} \sum_{i = 1}^{N} |y_{i} - \hat{y_{i}}|

（10）

R^{2} = \frac{\sum_{i = 1}^{N} {(y_{i} - \bar{y})}^{2} - \sum_{i = 1}^{N} {(y_{i} - \hat{y_{i}})}^{2}}{\sum_{i = 1}^{N} {(y_{i} - \bar{y})}^{2}}

（11）

式中：

x_{i}

是观测值；

y_{i}

是真实值；

\bar{y}

是

y_{i}

的平均值；

\hat{y_{i}}

为预测值；

N

为样本数。

3 结果与分析

3.1 ARIMA模型建模和预测

依据国家气象信息中心提供的中国地面气候资料月值数据集，选择1960-2019年新疆维吾尔自治区境内32个气象站点持续测定的逐月降水量数据，进行多尺度SPI的计算。由于SPI在不同时间尺度适用于不同种类的干旱，因此选取了1、3、6、9、12、24共6个时间尺度^［18］。将计算得到的SPI序列，分别记为SPI ₁、SPI ₃、SPI ₆、SPI ₉、SPI ₁₂、SPI ₂₄。

通过Python3.6对ARIMA建模。经过ADF检验，SPI ₁、SPI ₃、SPI ₆、SPI ₉、SPI ₁₂、SPI ₂₄的P值均小于0.05，故为平稳时间序列。通过ACF、PACF进行模型定阶，选择当AIC、BIC值最小时对应的p、q值^［35］，各序列的模型定阶结果见表3，即为各时间尺度的最优模型。选取1960-2007年数据作为训练集，2008-2019年数据作为测试集。应用32个气象站点各时间尺度的ARIMA最优模型对SPI序列进行预测。示例站点的预测结果分别见图4、图5和图6。

**Tab.3 Order the ARIMA model based on six scales SPI values**

表3 六尺度SPI序列的ARIMA模型定阶

站点	SPI序列	p	q	AIC	BIC
福海	SPI ₁	1	1	2 015.450	2 033.761
	SPI ₃	1	3	1 395.748	1 423.198
	SPI ₆	5	2	950.322	991.460
	SPI ₉	8	3	615.929	675.296
	SPI ₁₂	6	3	314.084	364.271
	SPI ₂₄	1	1	-162.364	-144.182
巴音布鲁克	SPI ₁	1	0	2 024.907	2 038.641
	SPI ₃	0	2	1 570.411	1 588.711
	SPI ₆	3	2	1 382.345	1 414.341
	SPI ₉	1	0	1 127.860	1 141.560
	SPI ₁₂	1	0	697.394	711.081
	SPI ₂₄	1	0	132.625	146.261
莎车	SPI ₁	2	1	1 646.146	1 669.036
	SPI ₃	4	1	1 470.492	1 502.518
	SPI ₆	5	0	1 226.602	1 258.599
	SPI ₉	2	1	936.908	959.741
	SPI ₁₂	8	1	442.679	492.866
	SPI ₂₄	2	1	-78.242	-55.515

Fig.3 EEMD decomposition results

图3 EEMD分解结果

Full size|PPT slide

**Fig.4 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Fuhai Station（2008-2019）**

图4 基于ARIMA模型与EEMD-ARIMA组合模型对福海站多时间尺度SPI值的预测结果与观测值计算结果对比（2008-2019）

Full size|PPT slide

**Fig.5 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Bayinbuluke Station（2008-2019）**

图5 基于ARIMA模型与EEMD-ARIMA组合模型对巴音布鲁克站多时间尺度SPI值的预测结果与观测值计算结果对比（2008-2019）

Full size|PPT slide

**Fig.6 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Shache Station（2008-2019）**

图6 基于ARIMA模型与EEMD-ARIMA组合模型对莎车站多时间尺度SPI值的预测结果与观测值计算结果对比（2008-2019）

Full size|PPT slide

3.2 EEMD-ARIMA模型建立和预测

EEMD能够将原始信号逐级分解并提取出其在不同尺度的局部特征信号，从而准确反映出原时间序列信号的物理特性。在分解过程中，需要对Nstd和NE进行设置。Nstd用于设置添加高斯白噪声的标准差，取值范围一般为0.01~0.4，具体设置数值根据原信号中的噪声干扰大小，视具体情况确定。NE是添加噪声的次数，通常取值为50或100。利用EEMD对多尺度SPI进行分解，经过多次参数修改及其分解结果的对比，最终将Nstd设置为0.2，NE设置为100。将加入白噪声序列的原始序列进行分解，得到8个IMF分量和1个残差数据，如图3所示为对福海站SPI₃ 序列进行EEMD分解得到的结果。从图3中可以看出，分解出的时间序列均围绕0值上下波动，趋于平稳，说明通过EEMD进行分解能够降低原始序列的非平稳性。

选取1960-2007年数据作为训练集，2008-2019年数据作为测试集。将EEMD分解得到的1960-2007年数据输入 ARIMA模型进行预测，并以ARIMA模型预测结果之和作为预测的最终结果。将6个时间尺度的SPI实际计算值、ARIMA模型预测值、EEMD-ARIMA模型预测值进行对比展示。3个示例站点的预测对比图分别为图4、图5和图6。

由图4（a）可知，2010年、2012年、2018年，福海站旱情最为严重，EEMD-ARIMA组合模型的计算结果与实际情况最为接近，较为精确的预测到了严重干旱的发生，在这些时间段中组合模型的预测值比ARIMA模型的预测值更接近SPI实际计算值。在图5（a）中2018年，组合模型的预测结果更符合实际情况，这表明组合模型对极端天气预测结果的准确度要高于单一模型。根据组合模型的预测结果可知，3个站点在2008年和2014年有严重干旱发生，这与新疆年鉴中对大范围干旱的记录一致。图4（b）2010-2011年，图5（a）2016-2017年SPI值异常，在快速增长后快速下降，对于这种异常变化，通过组合模型预测得到的干旱情况更接近实际的变化情况。根据图4、图5和图6的（c）、（d）、（e）、（f）图可以看到，两种模型的预测值均与实际计算得到的SPI值接近，但随着时间尺度的增大，单一模型预测结果延迟越发明显，在24个月时间尺度，与实际计算结果相比有近一个月的延迟。而组合模型随着时间尺度的增大，预测结果与实际计算结果更为接近。从3个站点的多尺度SPI对比中可以明显看到，两种模型在1个月时间尺度下的预测值与实际值有明显差异。在各时间尺度下，组合模型的预测值与SPI实际值之间的差值均小于单一模型预测值与SPI实际值的差值，表明组合模型在6个时间尺度下均能更好的预测SPI序列。

为验证EEMD-ARIMA组合模型和ARIMA模型在6个时间尺度下的预测精度，通过MAE、RMSE、R ²对两种模型在6个时间尺度下的预测结果进行了评价，结果见表4。RMSE和MAE的取值范围为［0，+

\infty

］，取值越小，模型效果越好，当值为0时，说明模型完美。R² 取值越大，表示拟合效果越好，最大值为1，当值为1时表明模型预测效果最佳。对比3个站点在不同时间尺度下的组合模型和单一模型的MAE、RMSE、R² 值发现，组合模型在任一时间尺度下的MAE、RMSE值均小于单一模型的值，且在任一时间尺度下的R² 值均大于单一模型的值，说明EEMD-ARIMA组合模型在各个时间尺度下的预测精度均高于单一模型，表明组合模型更适用于多时间尺度下的时间序列预测。组合模型在1个月时间尺度时，预测精度远高于单一模型，随着时间尺度的增加，两种模型预测精度之间的差距逐渐缩小，在24个月时间尺度时达到最小，表明组合模型在1、3个月时间尺度下的预测结果远优于单一模型，在6、9个月时间尺度时，优于单一模型，在12、24个月时间尺度下略优于单一模型。随着时间尺度的增加，SPI序列特征趋于平稳，ARIMA模型对序列的拟合效果逐渐提升。

**Tab.4 MAE、RMSE and R ² values for ARIMA and EEMD-ARIMA models**

表4 ARIMA模型和 EEMD-ARIMA组合模型的MAE、RMSE、R ²值

站点	时间尺度	模型	MAE	RMSE	R²
福海站	1	ARIMA	0.808 0	1.030 7	-0.054 4
	1	EEMD-ARIMA	0.513 4	0.606 7	0.634 7
	3	ARIMA	0.478 8	0.601 5	0.540 8
	3	EEMD-ARIMA	0.262 4	0.320 0	0.870 0
	6	ARIMA	0.373 1	0.465 4	0.662 7
	6	EEMD-ARIMA	0.139 6	0.170 8	0.954 6
	9	ARIMA	0.268 3	0.359 2	0.742 0
	9	EEMD-ARIMA	0.099 2	0.125 7	0.968 4
	12	ARIMA	0.212 6	0.285 6	0.816 3
	12	EEMD-ARIMA	0.079 0	0.094 3	0.980 0
	24	ARIMA	0.150 6	0.200 6	0.848 4
	24	EEMD-ARIMA	0.048 7	0.060 7	0.986 1
巴音布鲁克站	1	ARIMA	0.847 0	1.074 5	-0.086 6
	1	EEMD-ARIMA	0.538 9	0.636 8	0.618 3
	3	ARIMA	0.600 3	0.775 0	0.375 1
	3	EEMD-ARIMA	0.323 2	0.392 4	0.839 8
	6	ARIMA	0.504 5	0.653 6	0.514 1
	6	EEMD-ARIMA	0.213 5	0.266 4	0.919 3
	9	ARIMA	0.387 6	0.552 1	0.621 4
	9	EEMD-ARIMA	0.160 3	0.223 3	0.938 1
	12	ARIMA	0.272 5	0.413 4	0.766 7
	12	EEMD-ARIMA	0.117 5	0.165 3	0.962 7
	24	ARIMA	0.165 1	0.241 4	0.918 4
	24	EEMD-ARIMA	0.062 2	0.078 6	0.991 3
莎车站	1	ARIMA	0.550 5	0.742 7	0.000 4
	1	EEMD-ARIMA	0.372 0	0.460 0	0.616 5
	3	ARIMA	0.522 7	0.699 5	0.445 3
	3	EEMD-ARIMA	0.254 4	0.341 0	0.868 1
	6	ARIMA	0.392 4	0.584 0	0.655 8
	6	EEMD-ARIMA	0.253 0	0.295 1	0.912 1
	9	ARIMA	0.315 3	0.497 0	0.706 1
	9	EEMD-ARIMA	0.139 1	0.192 1	0.956 1
	12	ARIMA	0.201 0	0.326 0	0.845 2
	12	EEMD-ARIMA	0.089 0	0.130 1	0.975 3
	24	ARIMA	0.136 4	0.214 3	0.935 4
	24	EEMD-ARIMA	0.049 9	0.064 1	0.994 2

结合ArcGIS的空间分析功能，利用经验贝叶斯克里金插值法对2019年32个站点的SPI实际观测计算值和预测值进行可视化（如图7）。由于不同时间尺度的SPI适用情况不同，且新疆的春旱威胁最大，其次为夏旱和秋旱^［36］，故此处选择能够进行降雨量季节变化分析的SPI₃，对新疆维吾尔自治区春、夏、秋、冬的干旱情况进行插值可视化。从图7中可以看到EEMD-ARIMA组合模型在四季的预测结果与实际情况接近，较ARIMA模型的预测结果更符合实际。

Fig.7 Spatial distributions of seasonal drought levels based on the actual values and the predicted results of models

图7 基于SPI实际值、ARIMA模型预测值和EEMD-ARIMA模型预测值的季尺度干旱空间分布

Full size|PPT slide

4 讨论

ARIMA模型和EEMD-ARIMA组合模型对SPI的预测精度随时间尺度的增加而提高，并在24个月时间尺度时达到最高。从SPI的计算公式来看，随着时间尺度的增加，SPI序列中集合了原始数据中更多的信息，因此，预测值对实际计算值的拟合更为充分。从结果来看，EEMD-ARIMA组合模型的预测结果比单一模型的预测结果更接近实际情况，这是因为通过ARIMA模型对多尺度SPI进行预测存在特征不平稳的情况，而EEMD可以通过提取出原始时序在不同尺度的局部特征，从而将SPI数据序列平稳化，为ARIMA预测提供稳定的前提。因此，EEMD-ARIMA组合模型优于单一模型，能够用于新疆地区的干旱预测。

新疆四季降水不均，四季的干旱情况不同，以春旱最为严重，秋旱和夏旱次之。因此，文中主要考虑了降水量对区域的影响，选取了3个月尺度的SPI进行可视化展示。在对预测结果进行分析时，也侧重于对3个月尺度的计算结果的分析。但河流、植物覆盖等都会对干旱情况产生影响，1978-2008年新疆耕地面积总体呈增加的趋势，农作物的增加对地区的水利设施造成负担，减弱了地区的抗旱能力，造成干旱程度的进一步加剧。在之后的干旱研究中，将通过对长时间尺度的SPI值的分析，进一步研究地下水位的变化，植被的覆盖等对干旱产生的影响。从不同尺度的SPI值进行研究得到更加准确详细的结果。

对极端干旱的预测是目前研究的热点和干旱预测问题的研究重点。本文利用SPI对新疆地区的干旱时空变化情况进行分析，基于计算出的数据，对EEMD-ARIMA模型在新疆地区的干旱预测中的适用性进行研究发现，组合模型可以较好的捕获2008-2019年的干旱事件，适用于新疆地区的干旱预测。北疆和南疆的干旱情况有所不同，南疆大部分地区以农业为主，水利设施投入不足；而北疆的抗旱浇灌面积持续增长、农业和水利设施投入程度增加，因此南疆的受旱面积增长趋势大于北疆^［37］。在后续的研究中，针对不同地区的实际情况，进一步细化干旱评价指标的选取，找出不同地区最为适合的干旱指数，提高模型在新疆的适用性。

5 结论

本文基于新疆维吾尔自治区32个气象站点的降水量数据，计算出不同时间尺度下的SPI值，通过对SPI序列的分析、建模及预测，得到如下结论。

（1）单一的ARIMA模型，在1个月尺度下的预测精度最低，在24个月尺度的预测精度最高。主要是由两个原因造成的，其一，ARIMA模型是一个整体线性自回归模型，随着预测数据的增多，精度会下降。在1个月尺度下，通过ARIMA模型得到的预测数据多于其他时间尺度，故精度相较其他时间尺度而言较低。其二，长时间尺度的SPI序列集合了更多原始数据的信息，有利于模型的预测。在不同时间尺度下，组合模型的预测精度均高于单一模型。

（2）EEMD-ARIMA组合模型预测出的干旱发生年份与实际情况近似一致，能够用于对新疆地区干旱的预测。通过EEMD对数据进行分解，精简了模型对原始数据的读取过程，提高了预测精度。利用EEMD对各尺度的SPI进行分解，得到一组比原始序列特征更加平稳的分量，将各分量导入ARIMA进行预测，并将各分量的预测结果累加得到每一时间尺度下的预测数据，得到的预测数据的精度均高于单一模型。从预测结果来看，EEMD-ARIMA组合模型优于ARIMA模型，即EEMD- ARIMA组合模型能够更好的拟合不同时间尺度下的SPI。

气象干旱能够为区域的干旱情况提供预警，气象站点监测到的气温、降水数据只能近似的反映区域的情况，粗略的估计区域的干旱变化情况，需要研究更加优化的干旱评价指标使其更精确的描述区域的变化情况。

References

Publishing order | Descend order by publishing year | Descend order by cited within

1	莫兴国，胡实，卢洪健，等. GCM预测情景下中国21世纪干旱演变趋势分析［J］. 自然资源学报，2018，33（7）：1 244-1 256. 本文引用 [2]

2	黄荣辉，杜振彩. 全球变暖背景下中国旱涝气候灾害的演变特征及趋势［J］. 自然杂志，2010，32（4）：187-195，184. 本文引用 [1]

3	郭嘉豪，王会肖，赵茹欣，等. 基于多维Copula函数的松嫩平原干旱特征分析［J］. 节水灌溉，2020（12）：57-63. 本文引用 [1]

4	高珊，陈杰，许朗. 黄淮海地区干旱分区研究［J］. 节水灌溉，2020（10）：101-106. 本文引用 [1]

5	VASILIADES L， LOUKAS A， LIBERIS N. A water balance derived drought index for Pinios River Basin， Greece［J］. Water Resources Management， 2011，25（4）：1 087-1 101. 本文引用 [1]

6	袁梦，畅建霞，黎云云. 基于综合干旱指数的渭河流域干旱时空分析［J］. 武汉大学学报（工学版），2018，51（5）：401-408.

7	杜瑞麒，张智韬，巨娟丽，等. 基于波文比和降水的综合干旱指数的构建及应用［J］. 节水灌溉，2020（8）：63-71. 本文引用 [1]

8	MCKEE T B， DOESKEN N J， KLEIST J. The relation of drought frequency and duration to time scales［J］. Proceedings of the Eighth Conference on Applied Climatology American Meteorological Society Boston， 1993：179-184. 本文引用 [1]

9	VICENTE-SERRANO SM， BEGUERIA S， Lopez-Moreno JI. A multiscalar drought index sensitive to global warming： The standardized precipitation evapotranspiration index［J］. Journal of Climate， 2010，23（7）：1 696-1 718.

10	PALMER W C. Meteorological drought ［M］ . Washington， DC： US Department of Commerce， Weather Bureau， 1965.

11	岳元，申双和，王琪. 基于标准化降水指数的近45年吉林省干旱特征分析［J］. 中国农村水利水电，2017（7）：166-172

12	刘卫林，朱圣男，刘丽娜，等. 基于SPEI的1958-2018年鄱阳湖流域干旱时空特征及其与ENSO的关系［J］. 中国农村水利水电，2020（4）：116-123，128.

13	王盈盈，王志良，张泽中，等. 基于SPEI的贵州省分区干旱时空演变特征［J］. 灌溉排水学报，2019，38（6）：119-128. 本文引用 [1]

14	于家瑞，艾萍，袁定波，等. 基于SPI的黑龙江省干旱时空特征分析［J］ . 干旱区地理，2019，42（5）：1 059-1 068. 本文引用 [1]

15	郭伟，李莹，杜莉丽. 基于SPI的山西省1972-2012年春夏干旱特征及对玉米产量的影响分析［J］. 干旱地区农业研究，2018，36（1）：230-236，265.

16	王理萍，王树仿，王新华，等. 五种干旱指数在云南省的适用性分析［J］ . 灌溉排水学报，2017，36（7）：117-124. 本文引用 [1]

17	HOU L， HUANG J， WANG J. Early warning information， farmers’ perceptions of， and adaptations to drought in China［J］. Climatic Change， 2017，141（2）：197-212. 本文引用 [1]

18	韩萍，王鹏新，王彦集，等. 多尺度标准化降水指数的ARIMA模型干旱预测研究［J］.干旱地区农业研究，2008，26（2）：212-218. 本文引用 [2]

19	李佳佳，贺新光，卢希安. 长江流域月降水的EEMD多时间尺度遥相关分析［J］. 长江流域资源与环境，2019，28（8）：1 898-1 908. 本文引用 [1]

20	王佳，王旭，王浩，等. 基于EEMD与ANN混合方法的水库月径流预测［J］. 人民黄河，2019，41（5）：43-46. 本文引用 [1]

21	李辉，焦毛，杨晓萍，等. 基于EEMD和SOM神经网络的水电机组故障诊断［J］. 水力发电学报，2017，36（7）：83-91. 本文引用 [1]

22	李勃旭，南西康，郑向东，等. 基于EMD-ARIMA模型的地铁门传动系统早期故障预测［J］. 计算机系统应用，2019，28（9）：110-117. 本文引用 [2]

23	白致威，张雷，王杰，等. 基于ARIMA模型的云南气象干旱预测研究［J］. 人民长江，2015，46（15）：6-9. 本文引用 [1]

24	吾米提·居马太，瓦力江·瓦黑提，黄娟. 新疆气象灾害对主要作物产量影响的灰色关联分析［J］. 沙漠与绿洲气象，2020，14（1）：132-137. 本文引用 [1]

25	轩俊伟，郑江华，刘志辉.基于SPEI的新疆干旱时空变化特征［J］. 干旱区研究，2016，33（2）：338-344. 本文引用 [1]

26	冯冬蕾，程志刚，赵雷，等. 4种干旱判别指数在东北地区适用性分析［J］. 干旱区地理，2020，43（2）：371-379. 本文引用 [1]

27	郭嘉豪，王会肖，赵茹欣，等. 基于最优拟合函数的SPI指数的松嫩平原干旱特征分析［J］ . 北京师范大学学报（自然科学版），2020，56（2）：240-249. 本文引用 [1]

28	BUSSAY A， SZINELL C， SZENTIMERY T. Investigation and measurements of droughts in Hungary ［C］// Hungarian Meteorological Service. Budapest， 1999.

29	杨蕊，王龙，高瑞，等. 基于标准化降水指数的云南冬春干旱特征分析［J］. 中国农村水利水电，2017（4）：36-40，44. 本文引用 [1]

30	杨慧荣，张玉虎，崔恒建，等. ARIMA和ANN模型的干旱预测适用性研究［J］. 干旱区地理，2018，41（5）：945-953. 本文引用 [1]

31	左秀霞. 带高次趋势项的ADF单位根检验［J］ . 数量经济技术经济研究，2019，36（1）：152-169. 本文引用 [1]

32	汉密尔顿. 时间序列分析［M］. 北京：中国社会科学出版社，1999：531-542. 本文引用 [1]

33	张莹，谭艳春，彭发定，等. 基于EEMD和ARIMA的海温预测模型研究［J］. 海洋学研究，2019，37（1）：9-14. 本文引用 [1]

34	李宁，刘瑜，王大刚. 基于ARIMA和EEMD的东江流域季节降水预报研究［J］. 人民珠江，2019，40（3）：52-58，70. 本文引用 [1]

35	张建海，张棋，许德合，等. ARIMA-LSTM组合模型在基于SPI干旱预测中的应用：以青海省为例［J］. 干旱区地理，2020，43（4）：1 004-1 013. 本文引用 [1]

36	温克刚，史玉光. 中国气象灾害大典（新疆卷）［M］. 北京：气象出版社，2006. 本文引用 [1]

37	孙鹏，张强，刘剑宇，等. 新疆近半个世纪以来季节性干旱变化特征及其影响研究［J］. 地理科学，2014，34（11）：1 377-1 384. 本文引用 [1]

PDF(6294 KB)

909

Accesses

Citation

Detail

Sections

Recommended

Abstract
Key words
Cite this article
1 研究区概况
Fig.1 Distribution of meteorological stations in study area
2 数据来源与方法
2.1 数据来源
Tab.1 Information of sample meteorological stations
2.2 研究方法
2.2.1 标准化降水指数（SPI）
Tab.2 Drought classification based on SPI
2.2.2 ARIMA模型
2.2.3 EEMD分解
（1）在原始数据 Y ( t )中添加正态分布的白噪声序列 ω i t，试验次数为i；
（2）进行EMD分解，将含有白噪声的原始数据分解为IMF的组合；
（3）每次都加入服从同一分布的不同白噪声序列，重复步骤1和2，得到一组不同的IMF成分和残差；
2.2.4 EEMD-ARIMA模型
Fig.2 EEMD-ARIMA combined model forecast flow chart
2.3 评价指标
3 结果与分析
3.1 ARIMA模型建模和预测
Tab.3 Order the ARIMA model based on six scales SPI values
Fig.3 EEMD decomposition results
Fig.4 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Fuhai Station（2008-2019）
Fig.5 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Bayinbuluke Station（2008-2019）
Fig.6 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Shache Station（2008-2019）
3.2 EEMD-ARIMA模型建立和预测
Tab.4 MAE、RMSE and R 2 values for ARIMA and EEMD-ARIMA models
Fig.7 Spatial distributions of seasonal drought levels based on the actual values and the predicted results of models
4 讨论
5 结论
References

Received	Published
2020-07-10	2021-07-15
Issue Date
2021-08-22

Please choose a citation manager

Content to export

Abstract

Key words

Cite this article

1 研究区概况

Fig.1 Distribution of meteorological stations in study area

2 数据来源与方法

2.1 数据来源

Tab.1 Information of sample meteorological stations

2.2 研究方法

**2.2.1 标准化降水指数（SPI）**

Tab.2 Drought classification based on SPI

2.2.2 ARIMA模型

2.2.3 EEMD分解

（1）在原始数据 $Y (t)$ 中添加正态分布的白噪声序列 $ω_{i} (t)$ ，试验次数为i；

**（2）进行EMD分解，将含有白噪声的原始数据分解为IMF的组合；**

**（3）每次都加入服从同一分布的不同白噪声序列，重复步骤1和2，得到一组不同的IMF成分和残差；**

2.2.4 EEMD-ARIMA模型

Fig.2 EEMD-ARIMA combined model forecast flow chart

2.3 评价指标

3 结果与分析

3.1 ARIMA模型建模和预测

**Tab.3 Order the ARIMA model based on six scales SPI values**

Fig.3 EEMD decomposition results

**Fig.4 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Fuhai Station（2008-2019）**

**Fig.5 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Bayinbuluke Station（2008-2019）**

**Fig.6 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Shache Station（2008-2019）**

3.2 EEMD-ARIMA模型建立和预测

**Tab.4 MAE、RMSE and R ² values for ARIMA and EEMD-ARIMA models**

Fig.7 Spatial distributions of seasonal drought levels based on the actual values and the predicted results of models

4 讨论

5 结论

{{custom_sec.title}}

{{custom_sec.title}}

References

Please choose a citation manager

Content to export

Abstract

Key words

Cite this article

1 研究区概况

Fig.1 Distribution of meteorological stations in study area

2 数据来源与方法

2.1 数据来源

Tab.1 Information of sample meteorological stations

2.2 研究方法

2.2.1 标准化降水指数（SPI）

Tab.2 Drought classification based on SPI

2.2.2 ARIMA模型

2.2.3 EEMD分解

（1） 在原始数据 Y(t)中添加正态分布的白噪声序列 ωit，试验次数为i；

（2） 进行EMD分解，将含有白噪声的原始数据分解为IMF的组合；

（3） 每次都加入服从同一分布的不同白噪声序列，重复步骤1和2，得到一组不同的IMF成分和残差；

2.2.4 EEMD-ARIMA模型

Fig.2 EEMD-ARIMA combined model forecast flow chart

2.3 评价指标

3 结果与分析

3.1 ARIMA模型建模和预测

Tab.3 Order the ARIMA model based on six scales SPI values

Fig.3 EEMD decomposition results

Fig.4 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Fuhai Station（2008-2019）

Fig.5 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Bayinbuluke Station（2008-2019）

Fig.6 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Shache Station（2008-2019）

3.2 EEMD-ARIMA模型建立和预测

Tab.4 MAE、RMSE and R 2 values for ARIMA and EEMD-ARIMA models

Fig.7 Spatial distributions of seasonal drought levels based on the actual values and the predicted results of models

4 讨 论

5 结 论

{{custom_sec.title}}

{{custom_sec.title}}

References

**2.2.1 标准化降水指数（SPI）**

（1）在原始数据 $Y (t)$ 中添加正态分布的白噪声序列 $ω_{i} (t)$ ，试验次数为i；

**（2）进行EMD分解，将含有白噪声的原始数据分解为IMF的组合；**

**（3）每次都加入服从同一分布的不同白噪声序列，重复步骤1和2，得到一组不同的IMF成分和残差；**

**Tab.3 Order the ARIMA model based on six scales SPI values**

**Fig.4 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Fuhai Station（2008-2019）**

**Fig.5 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Bayinbuluke Station（2008-2019）**

**Fig.6 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Shache Station（2008-2019）**

**Tab.4 MAE、RMSE and R ² values for ARIMA and EEMD-ARIMA models**

4 讨论

5 结论