Multi-Step-Ahead Crude Oil Price Forecasting Based on Hybrid Model

Zhenpeng TANG, Tingting ZHANG, Junchuan WU, Xiaoxu DU, Kaijie CHEN

China Journal of Econometrics ›› 2021, Vol. 1 ›› Issue (2) : 346-361.

PDF(796 KB)
PDF(796 KB)
China Journal of Econometrics ›› 2021, Vol. 1 ›› Issue (2) : 346-361. DOI: 10.12012/CJoE2020-0010

Multi-Step-Ahead Crude Oil Price Forecasting Based on Hybrid Model

Author information +
History +

Abstract

Accurately predicting the crude oil prices is vital for governors to make policies and essential for market participants to make investment decisions. We propose a hybrid multi-step-ahead forecasting model that integrates the secondary decomposition algorithm which combines variational modal decomposition (VMD) and integrated empirical modal decomposition (EEMD), differential evolution (DE) and extreme learning machine (ELM), namely, VMD-RES.-EEMD-DE-ELM, for more accurate crude oil price forecasting in this paper. To illustrate the superiority of the proposed model, the sample data of Brent and West Texas Intermediate (WTI) are used to validate the performance of the proposed model. The empirical results confirm that the proposed model achieves better performance compared to several other benchmark models in terms of forecasting accuracy and stability.

Key words

crude oil price / secondary decomposition / extreme learning machine

Cite this article

Download Citations
Zhenpeng TANG , Tingting ZHANG , Junchuan WU , Xiaoxu DU , Kaijie CHEN. Multi-Step-Ahead Crude Oil Price Forecasting Based on Hybrid Model. China Journal of Econometrics, 2021, 1(2): 346-361 https://doi.org/10.12012/CJoE2020-0010

1 引言

原油市场是全球能源市场的重要组成部分之一, 在世界经济的发展中发挥着不可或缺的作用. 原油价格受原油供求、美元汇率、各类投机活动和极端事件的影响(参见Alvarez-Ramirez et al. (2003), Kaufmann et al. (2008), Kaufmann (2011), Lizardo and Mollick (2010), Kilian and Murphy (2014), Ramsay (2011), 田利辉和谭德凯(2015)). 原油价格的波动对全球各国的通胀水平和经济发展、航空和汽车等相关行业的投资决策, 以及居民个人的财务状况都产生影响(任泽平(2012), 李洪海(2000)). 因此, 如何准确预测国际原油价格已成为许多学者关注的问题(Ding (2018), Chai et al. (2018), 范秋枫等(2017), 王珏(2017)).
现有的原油价格预测方法可主要分为三大类: 传统的计量经济学模型、人工智能预测方法和组合模型预测方法. 传统的计量经济模型包括经典的自回归移动平均(autoregressive moving average, ARMA) 模型、自回归综合移动平均(autoregressive integrated moving average, ARIMA) 模型、广义自回归条件异方差(generalized autoregressive conditional heteroscedasticity, GARCH) 模型和向量自回归(vector autoregressive regression, VAR) 模型(Burlando et al. (1993), Contreras et al. (2003), Bollersev (1986)). 人工智能方法使用机器学习技术来训练历史数据. 典型的人工智能模型包括人工神经网络(artificial neural network, ANN)模型(Yu et al. (2008), Ding (2018))、支持向量回归(support vector regression, SVR)模型(Fan et al. (2016), Yu et al. (2017))、最小二乘支持向量回归(least squares SVR, LSSVR)模型(Zhang et al. (2018))、稀疏贝叶斯学习(sparse bayesian learning, SBL)模型(Wu, Chen and Zhou et al. (2019))和长短期记忆(long short-term memory, LSTM) 模型(Wu, Wu and Zhu (2019)).
原油价格本质上是复杂和高度波动的非线性时间序列(Panas and Ninni (2000), Yang et al. (2002)). 传统的计量经济学模型通常只能捕捉数据在时间序列中的线性变化过程, 不足以获得原油价格的非线性特征(Lin et al. (2011), Taylan (2017)). 而人工智能模型虽然不需要满足严格的统计假设条件, 但对历史数据的准确性和平滑性要求较高, 忽略了原油价格时间序列中不同特征的信息, 对于具有时变特性的非平稳数据预测存在缺陷. 单一模型无法识别复杂时间序列数据中所有的状态和相关性(Khashei and Bijari (2011)). 因此, 第三类混合模型被广泛使用.
混合模型中典型的是TEI@I复杂系统研究方法论(Wang et al. (2005)), 该方法论采用"分而治之"的策略, 将复杂的原始信号分解成具有不同特征的分量, 并结合各类不同的预测方法进行建模. 这一方法近年来被广泛运用于能源领域的预测(Yang and Wang (2018), Sun and Zhang (2018)). TEI@I复杂系统研究方法论中的信号处理方法用于分解时间序列, 预测模型用于预测分解后的分量.
常用的信号处理方法包括小波变换(wavelet transform, WT) (Walczak and Massart (1997))、小波包分解(wavelet packet decomposition, WPD) (Meng et al. (2016))、经验模式分解(empirical mode decomposition, EMD) (Huang et al. (1998))、集合经验模式分解(integrated empirical mode decomposition, EEMD) (Wang et al. (2016))和变分模态分解(variable mode decomposition, VMD) (Dragomiretskiy et al. (2014)). 杨云飞等(2010)结合经验模式分解(EMD)和支持向量机(SVMs) 构建了非线性的组合预测方法对原油价格进行预测. 张金良等(2019)基于变分模态分解(VMD)和果蝇(FOA) 算法优化后的最小二乘支持向量机(LSSVM) 构建了对原油价格的混合预测模型. Zhang et al. (2008)将改进的EMD技术应用到原油价格的分析中. Li et al. (2019)提出了基于变分模式分解(VMD)和人工智能技术的混合预测模型, 对月度的原油价格进行预测, 实证结果表明基于VMD的人工智能模型是原油价格分析和预测的有效工具. 在二层分解的研究中, Sun and Huang (2020)构建了EMD-VMD-GA-BP模型对碳价格进行预测, 并将预测结果与EMD-ELM, EMD-BP, EMD-GA-BP, EMD-VMD-ELM和EMD-VMD-BP等模型进行比较. 实证结果表明, 基于二次分解技术的混合预测模型比单级分解混合模型具有更高的预测精度. 在上述分解算法中, EMD和EEMD和CEEMD等算法存在着在恢复信号的过程中引入新的噪声和"模态混合''等的问题, VMD技术近年来则作为一种改进的分解技术被广泛使用.
作为组成TEI@I复杂系统研究方法中预测方法, 任何回归方法理论上都是可行的. 然而, 不同模型在预测精度和完成预测所需的时间上均存在差异. 上述人工智能模型(SVR, ANN, LSTM等) 虽然相比于传统经济计量模型在模型设定上具有优势, 但其对于具有时变特性的非平稳数据的预测仍存在参数设定上的缺陷. 因此, 极限学习机(extreme learning machine, ELM) (Bin et al. (2004))由于在学习收敛速度和参数设置方面具有优势而被广泛应用于各种领域的预测研究中(Yan et al. (2019)).
综上所述, 在现有原油价格预测研究中, 以"分解-集成"为代表的TEI@I复杂系统研究方法在预测领域取得了公认的优势. 然而, 现有的研究仍然存在以下不足:
1) 在使用VMD技术的现有研究中, 残差项被丢弃或作为普通成分处理(Lahmiri (2016), E et al. (2017), Lahmiri (2017)), 这些研究都没有重点关注包含丰富信息的残差项.
2) 仅使用ELM算法预测研究无法保证预测结果的可靠性, 降低了模型预测性能的稳定性.
3) 前向多步的预测可以帮助投资者规划长期投资目标. 然而现有对原油价格预测的研究大多仅停留在前向1步的预测.
鉴于已有研究的不足, 本文构建了VMD-RES.-EEMD-DE-ELM混合模型, 其中RES.代表VMD分解之后的残差剩余项. 该模型基于VMD和EEMD的二次分解技术, 进一步结合差分进化(differential evolution, DE)算法(Storn et al. (1997))优化后的ELM模型. VMD-RES.-EEMD-DE-ELM模型的优势如下:
1) 对原油价格序列应用VMD和EEMD相融合的二次分解技术, 其中EEMD技术用于处理VMD分解后的残差剩余项. 二次分解技术能够更好地捕捉数据的整体特征, 提高混合模型的整体预测精度.
2) 引入已被证明有效的差分进化(DE) 算法(Qin et al. (2009), Dash et al. (2016), Khushaba et al. (2011)), 在模型训练过程中优化输入权重和隐层的阈值, 改善ELM预测模型结果的稳定性. 在VMD-RES.-EEMD-DE-ELM模型中, 将DE-ELM模型作为预测模型.
3) 将VMD-RES.-EEMD-DE-ELM模型应用于前向多步的预测中, 验证了模型预测性能的准确性和稳健性.
为验证模型的有效性, 本文以布伦特(Brent)和西德克萨斯(West Texas Intermediate, WTI) 原油周度现货价格为实证样本, 并选取了其他7个基准模型作为对比模型, 分别为ELM、KELM、DE-ELM、EEMD-DE-ELM、EEMD-VMD-DE-ELM、VMD-DE-ELM、VMD-RES.-DE-ELM.
本文的剩余部分如下: 第2部分介绍了VMD-RES.-EEMD-DE-ELM模型的构成方法和构建VMD-RES.-EEMD-DE-ELM模型的具体步骤. 第3部分介绍了其他基准模型, 并对Brent和WTI原油的样本数据进行实证分析, 以检验本文提出的模型的性能. 第4部分是本文的总结.

2 模型构建

2.1 集成经验模态分解(EEMD)

EEMD通过在原始数据集的基础上添加白噪声序列, 利用白噪声均匀分布的特点, 使得增加的噪声会相互抵消, 以此来避免经验模式分解所产生的混叠现象, 从而保持了原始时间序列数据的非平稳和非线性特征, 使其具有更强的自适应特征.
EEMD分解的主要步骤如下:
步骤1 将多个白噪声q(t)加到原始时间序列o(t)上, 生成新的时间序列x(t), 该过程表示为:
x(t)=o(t)+q(t).
(1)
步骤2 识别新序列x1(t)的局部极值, 创建上下包络线, 并计算上下包络线的平均e1(t), x1(t)的表达式如下:
x1(t)=x(t)e1(t).
(2)
步骤3 使用标准偏差(sd)来确定上述过程是继续迭代还是停止迭代:
sd=t=0T[|xi(t)x(i1)(t)|2/x2(i1)(t)],
(3)
步骤4 当标准差小于预定值时, 应停止上述过程, 并计算第一个分量IMF1. IMF (intrinsic mode functions)为本征模态函数, 需满足两个条件: 1)在其整个长度上, 极值和零交叉的个数之差必须不大于1. 2)无论何时, 由局部最大值定义的上包络线和局部最小值定义的下包络线的均值为零;
IMF1=xt(t)=xt1(t)et(t).
(4)
步骤5 计算IMF1和信号x1(t)之间的差值r(t):
r(t)=x1(t)IMF1.
(5)
步骤6 重复步骤1至步骤5, 直到rn(t)成为一个单调函数:
ri=ri1IMFi, i=2,3,,n.
(6)
步骤7 计算所有IMF分量和残差分量的平均值以消除白噪声对原分量的影响. 至此, 完整的时间序列可表示为IMF和残差的总和:
x(t)=i=1mIMFi(t)+r(t).
(7)

2.2 变分模态分解(VMD)

VMD将输入信号分解成一系列稀疏分量信号, 通过求解模式分量的变分问题来确定分量信号的带宽和中心频率. 在构造变分问题时, 其基本原理是对分量信号应用希尔伯特变换和混频等信号处理手段来实现. 在各个模态分量之和等于原始信号的前提下, 将模态分量的变分问题转化为求估计带宽的最小和的模态函数. VMD分解的主要步骤如下:
步骤1 对分量信号进行希尔伯特变换获得单边谱. 通过与ejwkt相乘, 将每个分量信号的频谱调整到以预测中心频率为中心的频带. 然后, 计算混合信号梯度范数的平方, 以此估计频移后分量信号的带宽. 获得以下约束变分模态优化的问题:
{min{uk},{wk}{kt[(δ(t)+jπt)uk(t)]ejwkt22}s.t. kuk=f.
(8)
式中, {uk}:={u1,,uK}, {wk}:={w1,,wK}为VMD分解后的各模态分量VMF及各VMF所对应的中心频率. t表示对t求偏导, δ(t)为冲击函数, 为卷积符号, f为原始输入信号. 通过希尔伯特变换获取相关uk(t)的解析信号进而得到其单边谱, 指数项ejwkt用于调整各wk的估计值, 并将uk的频谱整合到基础频带上;
步骤2 为了获得上述约束变分模态的最优解, 保证信号重构的精确性与严格的约束条件, 引入了二次罚函数项α和拉格朗日乘数λ. 因此, 该约束性变分模态计算公式变为如下形式:
L({uk},{wk},λ):= αkt[(δ(t)+jπt)uk(t)]ejwkt22+f(t)kuk(t)22+λ(t),f(t)kuk(t).
(9)
步骤3 通过ADMM (alternating direction method of multipliers)算法将(10)至(12)式进行多次迭代, 得到u^kn+1(w),w^kn+1, λ^n+1求解上述变分问题, 直到满足收敛条件(13)时, 停止迭代, 以获得约束变分模型的最优解:
u^kn+1(w)=f^(w)ikui^(w)+λ^(w)21+2α(wwk)2,
(10)
w^kn+1=0w|u^k(w)|2dw0u^k|(w)|2dw,
(11)
λ^n+1=λ^n+τ[f^(w)ku^kn+1(w)].
(12)
式中, u^kn(w)f^(w)λ^n(w)分别为u^knf(t)λn所对应的傅里叶变换.
ku^kn+1u^kn22u^kn22<ε.
(13)

2.3 差分进化优化的极限学习机(DE-ELM)

2.3.1 极限学习机(ELM)

ELM通过随机选择输入权重, 并通过隐式计算隐藏层来输出矩阵, 从而得到输出权重, 该过程无需过多的人工干预. ELM具体实现的过程如下:
选取随机样本N(xi,ti), 其中XiRn, tiRm, 包含其前馈神经网络输出的具有L个隐藏神经元及激活函数g(x), 极限学习模型可以表示成如下的等式:
fL(xj)=i=1Lβig(Wi.Xj+bi), j=1,,N,
(14)
式中β是输出权重, 输入权重wi和偏置bi是随机分配. (14)式的矩阵形式可变换为Hβ^=Y, 其中:
H(WL,bL,XN)=[g(W1X1+b1)g(W2X1+b2)g(WLX1+bL)g(W1X2+b1)g(W2X2+b2)g(WLX2+bL)g(W1XN+b1)g(W2XN+b2)g(WLXN+bL)]N×L,
(15)
β=[β1TβLT]L×m,  Y=[Y1TYNT]N×m,
(16)
其中H为网络的隐藏层输出矩阵, 此时β为输出权重矩阵, Y为期望的输出矩阵. 在ELM算法中, 由于输出权重和隐层偏差是随机设定的, 隐层矩阵H为确定的矩阵. 此时前馈神经网络转化为求解输出权矩阵的最小二乘解的问题, 意味着网络训练的结束, 最优输出权重矩阵可通过等式(17)获得:
β^=HY,
(17)
其中H是隐层输出矩阵H的Moore-Penrose广义逆矩阵.
ELM的算法如图 1所示.
图1 ELM算法示意图

Full size|PPT slide

2.3.2 差分进化算法(DE)

差分进化算法是一种新的群体智能优化算法, 通过对初始父代种群进行变异、交叉、选择等操作, 最后使得种群达到或接近优化问题的全局最优解. 它具有收敛速度快和涉及参数少的优点. 图 2为差分进化算法的流程图.
图2 差分进化算法流程图

Full size|PPT slide

DE算法的基本步骤为如下:
步骤1 随机选取个体x, 数量为NP, 生成父代种群X(t)={x1t,x2t,,xNPt}, xit=(xi1t,xi2t,,xiDt)T. 对相关参数进行初始化, 设置种群规模数量为NP、变异因子为F、交叉因子CR、空间维数D、进化代数t=0.
步骤2 对父代个体进行变异操作. 由父代个体xit间通过式vit=xr1t+F(xr2txr3t)进行变异, 其中xr1txr2txr3t分别为群体中随机选择的3个父代个体, 且r1r2r3i, 进而生成变异个体vit=(vi1t,vi2t,,viDt)T.
步骤3 对父代和变异个体进行交叉操作. 由父代个体xit和变异个体vit之间进行交叉操作生成混合个体uit=(ui1t,ui2t,,uiDt)T, 其生成过程如式(18)所示:
uijt={vijt  if rand[0, 1]CR   or    j=j_rand,xijt  if rand[0, 1]>CR  and  jj_rand,
(18)
其中rand[0,1]为取值于[0,1]间的随机数, j_rand为取值于[1,D]的随机整数.
步骤4 进行选择操作. 计算单个个体的适合度值, 即DE算法的目标函数. DE算法通过比较父代个体xit和混合个体uit的适合度值, 保留具有最好适合度值的个体xit+1, 选择过程如下式所示:
xit+1={xit  if fitness(xit)<fitness(uit),uit  otherwise,
(19)
其中fitness()为适合度函数, 该函数为需优化的求极小值的目标函数.
步骤5 重复上述变异、交叉和选择过程, 直到最大迭代次数tmax和输出达到最优输入权值和偏差.

2.3.3 差分进化优化的极限学习机(DE-ELM)

虽然ELM可以用小样本学习来实现非线性函数拟合和预测问题, 但其输入权值和隐含层阈值决定了模型的训练的稳定性. 为了提高ELM模型的精度和实现快速建模, 本文结合DE算法强大的全局优化能力以优化权值和隐含层阈值, DE-ELM模型的具体步骤如下:
步骤1 对ELM模型的随机输入权重及隐层阈值进行编码, 初始化种群.
步骤2 初始化DE算法相关参数.
步骤3 计算种群中独立个体的适合度值, 本文即为ELM模型预测输出的均方根误差值.
步骤4 依次执行变异、交叉和选择, 并进行迭代终止检验. 若满足终止条件, 则输出最优输入权重及隐层阈值, 否则, 继续迭代, 直到获取最优输出.
步骤5 将ELM模型的输入权重及隐层阈值设定为经DE算法优化后的最优个体, 即得到优化后的DE-ELM模型.

2.4 VMD-RES.-EEMD-DE-ELM模型

本文所构建的VMD-RES.-EEMD-DE-ELM模型包含三个模块: 1)预处理模块: 考虑原油价格的非线性和非平稳特性, 本文采用VMD技术对原始序列进行处理. 2)预测模块: 应用DE-ELM模型对各个分量和残差项进行预测. 3) 优化模块: 应用DE算法对ELM模型训练过程中的参数进行优化. 通过VMD技术将复杂的非线性和非平稳原油价格分解成相对简单的组成部分, 并利用EEMD技术对富含复杂信息的残差项进一步分解. 二次分解技术和预测模型的结合可有效提升模型的预测精度. 混合模型的结构如图 3所示.
图3 VMD-RES.-EEMD-DE-ELM模型的结构图

Full size|PPT slide

VMD-RES.-EEMD-DE-ELM模型包括以下四个主要步骤:
步骤1 VMD分解. 原油的周度原始价格序列被分解成两组组成部分: 一系列的分量VMFs和一个残差.
步骤2 EEMD分解. 对VMD分解后得到的残差项进行EEMD分解.
步骤3 各个分量的预测. 将各个VMF分量、IMF分量以及残差项分为训练集和测试集, 应用DE-ELM模型进行预测.
步骤4 预测结果的叠加. 将步骤3中所有分量及残差项的单个预测结果相加, 得到最终的预测结果.

3 实证分析

3.1 数据来源

本文利用Brent原油和WTI原油的现货价格检验VMD-RES.-EEMD-DE-ELM组合模型的实际预测性能. Brent和WTI原油的每周现货价格来自美国能源信息管理局(EIA) (http://www.eia.doe.gov/). Brent原油数据选自1987年5月15日至2019年12月13日, 共有1701笔交易数据. WTI原油数据的选择范围为1986年1月3日至2019年12月13日, 共有1772笔交易数据. 本文中的所有模型都是使用MATLAB 2019b运行的.
此外, 本文将样本数据分为训练样本和测试样本. 在Brent原油数据中, 前1551个数据作为训练样本, 后150个数据作为测试样本. 在WTI原油数据中, 前1622个数据作为训练样本, 后150个数据作为测试样本.

3.2 数据处理

在将分解技术应用于原油价格序列之前, 需要选择适当数量的分量n. 根据经验法则, 2的n次方近似等于样本数据的数量, 本文中的最优分量数n为10. 此外, 为了保证DE-ELM模型的预测效果, 需要对每个分解的模态分量子序列数据进行归一化处理. 在本文中, 使用最小-最大偏差归一化方法对数据进行线性改变, 其表达式如下:
x=xxminxmaxxmin,
(20)
其中x是归一化的子序列数据, x是其原始值, xmaxxmin分别是其最大值和最小值.

3.3 评定标准

本文选取均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE) 三个评价指标来检验模型的预测效果. 指标的计算公式如下:
eRMSE=1/ni=1n(yiy^i)2,
(21)
eMAE=1ni=1n|yiy^i|,
(22)
eMAPE=1ni=1n|yiy^i|/yi,
(23)
其中yi y^i分别是时间序列的真实值和预测值, n是测试样本大小, i是测试样本点序列号. eRMSE, eMAEeMAPE的值越小, 模型的预测精度越高.

3.4 实证检验

为了证明VMD-RES.-EEMD-DE-ELM模型的优越性, 本文构造了另外七个不同的基准模型进行比较. 这些模型可分为非组合模型和组合模型, 其中非组合模型是指没有包含分解技术的单一预测模型, 而组合模型是指包含分解技术的混合预测模型. 此外, 为了测试VMD-RES.-EEMD-DE-ELM模型的稳健性, 本文对所有模型都进行了向前1步、3步和5步的预测检验, 即将前6个交易日的数据分别用于预测第7、第9和第11个交易日的数据.
图 4展示了各个模型对Brent原油和WTI原油的预测结果. 另外, 表 1表 2表 3分别记录了各个预测模型对Brent原油和WTI原油预测的评价指标的具体数值. 实证结果表明, 在对Brent原油和WTI原油的预测结果中, 本文提出的VMD-RES.-EEMD-DE-ELM混合模型在所有情景下都取得了优于其他基准模型的结果.
图4 不同模型对Brent原油和WTI原油价格预测结果的对比图

Full size|PPT slide

表1 非组合预测模型对Brent原油和WTI原油现货价格的向前1步、3步和5步的预测结果
模型 Brent WTI
1步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
ELM 2.1348 1.7348 0.0277 1.8868 1.4684 0.0257
KELM 2.0601 1.6841 0.0269 1.8481 1.4452 0.0253
DE-ELM 2.0563 1.6894 0.0269 1.8475 1.4431 0.0252
Brent WTI
3步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
ELM 2.1653 1.7691 0.0283 1.9850 1.5414 0.0270
KELM 2.1454 1.7497 0.0279 1.9321 1.5096 0.0264
DE-ELM 2.1333 1.7415 0.0279 1.9312 1.4982 0.0263
Brent WTI
5步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
ELM 2.1841 1.8076 0.0288 1.9357 1.5199 0.0267
KELM 2.1533 1.7701 0.0283 1.9265 1.5089 0.0264
DE-ELM 2.1342 1.7606 0.0281 1.9137 1.5159 0.0266
注: 表示取得该指标的最优表现.
表2 不考虑残差项分解的组合模型对Brent原油和WTI原油现货价格的向前1步、3步和5步的预测结果
模型 Brent WTI
1步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
EEMD-DE-ELM 1.2889 1.0451 0.0168 1.1414 0.8925 0.0157
EEMD-VMD-DE-ELM 0.4322 0.3534 0.0057 0.3651 0.2853 0.0049
VMD-DE-ELM 0.4820 0.3940 0.0063 0.4540 0.3593 0.0062
Brent WTI
3步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
EEMD-DE-ELM 1.6750 1.3806 0.0223 1.5664 1.2456 0.0217
EEMD-VMD-DE-ELM 0.7949 0.6067 0.0098 0.7681 0.5978 0.0103
VMD-DE-ELM 0.5493 0.4389 0.0070 0.5222 0.4111 0.0071
Brent WTI
5步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
EEMD-DE-ELM 1.8813 1.5437 0.0249 1.7380 1.3710 0.0238
EEMD-VMD-DE-ELM 1.1116 0.8809 0.0142 0.9769 0.7654 0.0133
VMD-DE-ELM 0.6622 0.5317 0.0086 0.5954 0.4657 0.0081
注: 表示取得该指标的最优表现.
表3 考虑残差项的组合模型对Brent原油和WTI原油现货价格的向前1步、3步和5步的预测结果
模型 Brent WTI
1步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
VMD-RES.-DE-ELM 0.4599 0.3732 0.0059 0.4381 0.3485 0.0060
VMD-RES.-EEMD-DE-ELM 0.3146 0.2449 0.0039 0.2772 0.2186 0.0038
Brent WTI
3步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
VMD-RES.-DE-ELM 0.5583 0.4476 0.0071 0.4880 0.3831 0.0067
VMD-RES.-EEMD-DE-ELM 0.4610 0.3745 0.0060 0.4106 0.3317 0.0057
Brent WTI
5步 eRMSE eMAE eMAPE eRMSE eMAE eMAPE
VMD-RES.-DE-ELM 0.6641 0.5307 0.0086 0.5712 0.4449 0.0077
VMD-RES.-EEMD-DE-ELM 0.5838 0.4575 0.0074 0.5297 0.4154 0.0072
注: 表示取得该指标的最优表现.

3.4.1 非组合模型

表 1为ELM模型、核极限学习机(kernel extreme learning machine, KELM)模型和DE-ELM模型对Brent原油和WTI原油价格的预测结果. 虽然KELM模型的个别指标在向前1步和向前5步的预测中略优于DE-ELM模型, 但在向前1步、3步和5步预测的整体结果中, 与传统的ELM模型和KELM模型相比, DE-ELM模型在结果指标上更加精确. 即通过DE算法优化的DE-ELM模型比ELM模型和KELM模型具有预测优势, 显示了其预测性能的优越性和稳健性. 因此, 在本文构建的混合模型中, 选择DE-ELM模型作为预测模型.

3.4.2 不考虑残差项分解的组合模型

表 2为Brent原油和WTI原油价格的EEMD-DE-ELM, EEMD-VMD-DE-ELM和VMD-DE-ELM模型的预测结果.
EEMD-DE-ELM模型是将EEMD技术应用于原始价格序列后, 丢弃残差剩余项, 并利用DE-ELM模型对剩余分量进行组合预测. EEMD-VMD-DE-ELM模型是对原始价格序列应用EEMD技术之后, 进一步对高频分量(IMF1)应用VMD技术以提高其预测精度, 然后将每个分量的预测结果和残差项叠加以形成最终的预测结果. VMD-DE-ELM模型是对原始原油价格序列应用VMD技术后丢弃残差剩余项, 利用DE-ELM模型对剩余的各个分量进行组合预测.
通过比较表 1中的单一预测模型和表 2中结合分解技术的预测模型的预测结果, 可知结合分解技术的组合模型的预测精度优于单一的预测模型. 单一预测模型的预测精度较差, 而采用分解技术的预测模型提高了整体模型的预测精度. 表明分解技术能有效降低原始价格序列的复杂度, 提高预测精度.
此外, VMD-DE-ELM模型的预测结果在所有预测情景下均优于EEMD-DE-ELM模型, 而采用二次分解技术的EEMD-VMD-DE-ELM组合模型在向前3步和向前5步的预测中的结果仍次于VMD-DE-ELM模型, 进一步证明了VMD技术相比于EMMD技术在提取序列数据特征和处理复杂信号方面的优越性能.

3.4.3 考虑残差项的组合模型

表 3中的VMD-RES.-DE-ELM是使用DE-ELM模型预测, 对原始序列应用VMD技术后的每个VMF分量和残差剩余项进行组合预测的模型. VMD-RES.-EEMD-DE-ELM模型是本文构建的混合模型.
通过比较表 2表 3中的预测结果, 可知在多步向前预测的结果中, 包含残差项的VMD-RES.-EEMD-DE-ELM模型的所有评价指标结果整体优于VMD-DE-ELM模型. 实证结果表明, 将包含复杂信息的残差项纳入模型进行预测分析, 有助于提高模型的整体预测效果.
此外, 通过比较VMD-RES.-DE-ELM模型和VMD-RES.-EEMD-DE-ELM模型的预测结果, 可知将原始价格序列应用VMD技术后所产生的残差项包含重要的复杂信息, 应用DE-ELM模型直接对残差项进行预测的效果有限. 因此, 本文针对残差项所提出的二次分解技术能够有效结合VMD和EEMD的优点来生成更平滑的子序列, 从而进一步获得更准确的预测结果.

4 结论

本文构建了一种新的原油价格预测的混合模型(VMD-RES.-EEMD-DE-ELM). 该模型将VMD和EEMD相融合的二次分解技术引入原油价格的分析之中, 并结合DE-ELM模型进行预测. 本文以Brent原油和WTI原油的周度现货价格为实证样本, 将构建的混合模型与ELM、KELM、DE-ELM、EEMD-DE-ELM、EEMD-VMD-DE-ELM、VMD-DE-ELM和VMD-RES.-DE-ELM模型的预测性能进行比较. 结果表明: 1) VMD-RES.-EEMD-DE-ELM在所有对比的基准模型中表现最好. 2) 结合分解算法的模型优于单个预测模型, 分解算法能够显著降低原油价格时间序列预测的复杂性. 3) 考虑残差项的二次分解算法适用于原油价格预测, 能够有效提取原油价格的非线性特征, 提高其预测的效果.
此外, VMD-RES.-EEMD-DE-ELM模型在向前1步、3步和5步的预测研究中均取得了最优的预测效果, 证明了模型的稳健性. 本文的研究结果为提高原油价格预测的准确性提供了一种新的途径, 有助于原油市场的利益相关者更准确地把握原油市场未来的价格趋势, 为决策者和投资者提供决策参考. 然而, 原油价格序列的趋势受多维复杂因素的影响. 在未来的研究中, 本文提出的模型可考虑结合其他影响因素, 进一步提高预测效果.

References

范秋枫, 王涛, 张智峰, 量子粒子群智能算法在国际布伦特原油价格预测中的应用[J]. 模糊系统与数学, 2017, 31 (4): 84- 90.
Fan Q F , Wang T , Zhang Z F , Application of QPSO Algorithm in the International Brent Crude Oil Price Prediction[J]. Fuzzy Systems and Mathematics, 2017, 31 (4): 84- 90.
李洪海, 石油价格走势及对石油上市公司的影响[J]. 管理世界, 2000, (6): 196- 197.
Li H H , The Trend of Crude Oil Prices and Its Impact on Listed Oil Companies[J]. Management World, 2000, (6): 196- 197.
任泽平, 能源价格波动对中国物价水平的潜在与实际影响[J]. 经济研究, 2012, 47 (8): 59- 69.
Ren Z P , The Potential and Actual Impact of Energy Price Increase to General Price Level in China[J]. Economic Research Journal, 2012, 47 (8): 59- 69.
田利辉, 谭德凯, 原油价格的影响因素分析: 金融投机还是中国需求?[J]. 经济学(季刊), 2015, 14 (3): 961- 982.
Tian L H , Tan D K , Determinants of Crude Oil Prices: Driven by Financial Speculations or China's Demands?[J]. China Economic Quarterly, 2015, 14 (3): 961- 982.
王珏, 胡蓝艺, 齐琛, 基于网络关注度的大宗商品市场预测研究[J]. 系统工程理论与实践, 2017, 37 (5): 1163- 1171.
Wang J , Hu L Y , Qi C , Prediction of Bulk Commodities Based on Internet Concerns[J]. Systems Engineering—Theory & Practice, 2017, 37 (5): 1163- 1171.
杨云飞, 鲍玉昆, 胡忠义, 张瑞, 基于EMD和SVMs的原油价格预测方法[J]. 管理学报, 2010, 7 (12): 1884- 1889.
Yang Y F , Bao Y K , Hu Z Y , Zhang R , Crude Oil Price Prediction Based on Empirical Mode Decomposition and Support Vector Machines[J]. Chinese Journal of Management, 2010, 7 (12): 1884- 1889.
张金良, 李德智, 谭忠富, 基于混合模型的国际原油价格预测研究[J]. 北京理工大学学报(社会科学版), 2019, 21 (1): 59- 64.
Zhang J L , Li D S , Tan Z F , International Crude Oil Price Forecasting Based on a Hybrid Model[J]. Journal of Beijing Institute of Technology (Social Sciences Edition), 2019, 21 (1): 59- 64.
Alvarez-Ramirez J , Soriano A , Cisneros M , Suarez R , Symmetry/Anti-symmetry Phase Transitions in Crude Oil Markets[J]. Physica A: Statistical Mechanics and Its Applications, 2003, 322, 583- 596.
Bin H G, Zhu Q Y, Siew C K, (2004). Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks[C]//IEEE International Conference on Neural Networks-Conference Proceedings, 2: 985-990.
Bollerslev T , Generalized Autoregressive Conditional Heteroskedasticity[J]. Journal of Econometrics, 1986, 31 (3): 307- 327.
Burlando P , Rosso R , Cadavid L G , Salas J D , Forecasting of Short-term Rainfall Using ARMA Models[J]. Journal of Hydrology, 1993, 144, 193- 211.
Chai J , Xing L M , Zhou X Y , Zhang G , Zhe J X , Forecasting the WTI Crude Oil Price by a Hybrid-refined Method[J]. Energy Economics, 2018, 71, 114- 127.
Contreras J, Espínola R, Nogales F J, Conejo J A, (2003). ARIMA Models to Predict Next-day Electricity Prices[C]//IEEE Transactions on Power Systems, 18(3): 1014-1020.
Dash S K , Bisoi R , Dash P K , A Hybrid Functional Link Dynamic Neural Network and Evolutionary Unscented Kalman Filter for Short-term Electricity Price Forecasting[J]. Neural Computing and Applications, 2016, 27 (7): 2123- 2140.
Ding Y , A Novel Decompose-ensemble Methodology with AIC-ANN Approach for Crude Oil Forecasting[J]. Energy, 2018, 154, 328- 336.
Dragomiretskiy K , Zosso D , Variational Mode Decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62 (3): 531- 544.
E J , Bao Y , Ye J , Crude Oil Price Analysis and Forecasting Based on Variational Mode Decomposition and Independent Component Analysis[J]. Physica A: Statistical Mechanics and Its Applications, 2017, 484, 412- 427.
Fan L , Pan S , Li Z , Li H P , An ICA-Based Support Vector Regression Scheme for Forecasting Crude Oil Prices[J]. Technological Forecasting and Social Change, 2016, 112, 245- 253.
Huang N E , Shen Z , Long S R , Wu M C , Shih H H , et al. The Empirical Mode Decomposition and the Hubert Spectrum for Nonlinear and Non-stationary Time Series Analysis[J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences, 1998, 454 (1971): 903- 995.
Kaufmann R K , Bradford A , Belanger L H , Mclaughlin J P , Miki Y , Determinants of OPEC Production: Implications for OPEC Behavior[J]. Energy Economics, 2008, 30 (2): 333- 351.
Kaufmann R K , The Role of Market Fundamentals and Speculation in Recent Price Changes for Crude Oil[J]. Energy Policy, 2011, 39 (1): 105- 115.
Khashei M , Bijari M , A New Hybrid Methodology for Nonlinear Time Series Forecasting Model[J]. Modelling and Simulation in Engineering, 2011, 2011, 1687- 5591.
Khushaba R N , Al-Ani A , Al-Jumaily A , Feature Subset Selection Using Differential Evolution and a Statistical Repair Mechanism[J]. Expert Systems with Applications, 2011, 38 (9): 11515- 11526.
Kilian L , Murphy D P , The Role of Inventories and Speculative Trading in the Global Market for Crude Oil[J]. Journal of Applied Econometrics, 2014, 29 (3): 454- 478.
Lahmiri S , A Variational Mode Decompoisition Approach for Analysis and Forecasting of Economic and Financial Time Series[J]. Expert Systems with Applications, 2016, 55, 268- 273.
Lahmiri S , Comparing Variational and Empirical Mode Decomposition in Forecasting Day-ahead Energy Prices[J]. IEEE Systems Journal, 2017, 11 (3): 1907- 1910.
Lin K P , Pai P F , Yang S L , Forecasting Concentrations of Air Pollutants by Logarithm Support Vector Regression with Immune Algorithms[J]. Applied Mathematics and Computation, 2011, 217 (12): 5318- 5327.
Lizardo R A , Mollick A V , Oil Price Fluctuations and U.S. Dollar Exchange Rates[J]. Energy Economics, 2010, 32 (2): 399- 408.
Meng A , Ge J , Yin H , Chen S Z , Wind Speed Forecasting Based on Wavelet Packet Decomposition and Artificial Neural Networks Trained by Crisscross Optimization Algorithm[J]. Energy Conversion and Management, 2016, 114, 75- 88.
Panas E , Ninni V , Are Oil Markets Chaotic? A Non-linear Dynamic Analysis[J]. Energy Economics, 2000, 22 (5): 549- 568.
Qin A K, Huang V L, Suganthan P N, (2009). Differential Evolution Algorithm with Strategy Adaptation for Global Numerical Optimization[C]//IEEE Transactions on Evolutionary Computation, 13(2): 398-417.
Ramsay K W , Revisiting the Resource Curse: Natural Disasters, the Price of Oil, and Democracy[J]. International Organization, 2011, 65 (3): 507- 529.
Storn R , Price K , Differential Evolution—A Simple and Efficient Heuristic for Global Optimization Over Continuous Spaces[J]. Journal of Global Optimization, 1997, 11 (4): 341- 359.
Sun W , Huang C , A Carbon Price Prediction Model Based on Secondary Decomposition Algorithm and Optimized Back Propagation Neural Network[J]. Journal of Cleaner Production, 2020, 243, 118671.
Sun W , Zhang C C , Analysis and Forecasting of the Carbon Price Using Multi Resolution Singular Value Decomposition and Extreme Learning Machine Optimized by Adaptive Whale Optimization Algorithm[J]. Applied Energy, 2018, 231, 1354- 1371.
Taylan O , Modelling and Analysis of Ozone Concentration by Artificial Intelligent Techniques for Estimating Air Quality[J]. Atmospheric Environment, 2017, 150, 356- 365.
Walczak B , Massart D L , Noise Suppression and Spinal Compression Using the Wavelet Packet Transform[J]. Chemometrics and Intelligent Laboratory Systems, 1997, 36 (2): 81- 94.
Wang S Y , Yu L , Lai K K , Crude Oil Price Forecasting with TEI@I Methodology[J]. Journal of Systems Science & Complexity, 2005, 18 (2): 145- 166.
Wang S , Zhang N , Wu L , Wang Y , Wind Speed Forecasting Based on the Hybrid Ensemble Empirical Mode Decomposition and GA-BP Neural Network Method[J]. Renewable Energy, 2016, 94, 629- 636.
Wu J , Chen Y , Zhou T , Li T Y , An Adaptive Hybrid Learning Paradigm Integrating CEEMD, ARIMA and SBL for Crude Oil Price Forecasting[J]. Energies, 2019, 12 (7): 1239.
Wu Y X , Wu Q B , Zhu J Q , Improved EEMD-based Crude Oil Price Forecasting Using LSTM Networks[J]. Physica A: Statistical Mechanics and Its Applications, 2019, 516, 114- 124.
Yan K , Ji Z , Lu H , Xue Y , Fast and Accurate Classification of Time Series Data Using Extended ELM: Application in Fault Diagnosis of Air Handling Units[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49 (7): 1349- 1356.
Yang C W , Hwang M J , Huang B N , An Analysis of Factors Affecting Price Volatility of the US Oil Market[J]. Energy Economics, 2002, 24 (2): 107- 119.
Yang Z S , Wang J , A Combination Forecasting Approach Applied in Multistep Wind Speed Forecasting Based on a Data Processing Strategy and an Optimized Artificial Intelligence Algorithm[J]. Applied Energy, 2018, 230, 1108- 1125.
Yu L , Wang S , Lai K K , Forecasting Crude Oil Price with an EMD-Based Neural Network Ensemble Learning Paradigm[J]. Energy Economics, 2008, 30, 2623- 2635.
Yu L , Zhang X , Wang S Y , Assessing Potentiality of Support Vector Machine Method in Crude Oil Price Forecasting[J]. Eurasia Journal of Mathematics, Science and Technology Education, 2017, 13, 7893- 7904.
Zhang X , Lai K K , Wang S Y , A New Approach for Crude Oil Price Analysis Based on Empirical Mode Decomposition[J]. Energy Economics, 2008, 30 (3): 905- 918.
Zhang Y , Zhang J , Volatility Forecasting of Crude Oil Market: A New Hybrid Method[J]. Journal of Forecasting, 2018, 37, 781- 789.

Funding

National Natural Science Foundation of China(71573042)
National Natural Science Foundation of China(71973028)

RIGHTS & PERMISSIONS

All rights reserved, without authorization
PDF(796 KB)

2080

Accesses

0

Citation

Detail

Sections
Recommended

/