基于CNN与LSTM多组合策略的中国碳市场价格预测
Carbon Price Forecasting in Chinese Carbon Trading Market Based on Multi-Strategy CNN-LSTM
通讯作者: 曹文治, 副教授, 博士, 研究方向: 大数据分析技术与应用, E-mail:2652@hnuc.edu.cn
收稿日期: 2021-09-13
基金资助: |
|
Received: 2021-09-13
Fund supported: |
|
作者简介 About authors
陈晓红,中国工程院院士,教授,博士生导师,研究方向:两型社会与生态文明、大数据分析技术与应用、决策理论与方法,E-mail:c88877803@163.com
龚思远,硕士研究生,研究方向:两型社会与碳排放分析,E-mail:gsyuan28@163.com
贺怡帆,硕士研究生,研究方向:能源与环境分析,E-mail:heyifanniubi@163.com
刘厚盾,硕士研究生,研究方向:能源与环境分析,E-mail:liuhoudun@foxmail.com
随着全球对碳排放问题的日益关注, 碳市场价格变得越来越重要. 准确可靠的碳市场价格预测不仅可以为政府宏观调控实现"双碳"目标提供更好的参考, 还可以帮助企业更有效地管理碳排放带来的风险. 本文针对碳市场价格预测, 利用经验模态分解(EMD)、卷积神经网络(CNN)和长短期记忆网络(LSTM), 提出不同的EMD-CNN-LSTM组合模型, 并探讨了CNN-LSTM组合策略, 将其分为串行策略和并行策略. 本文使用广东、上海、湖北、重庆碳交易所价格数据, 系统地对比了EMD-CNN-LSTM组合策略和单一预测模型、组合预测模型的预测效果, 验证了EMD-CNN-LSTM四种组合模型预测的精准性和稳健性, 并论证了并行策略预测对于碳市场价格序列普适性更佳.
关键词:
With the increasing global attention to carbon dioxide emissions, the carbon market price has become more and more important. Accurate and reliable carbon market price forecasts can not only provide a better reference for the government's macro-control to achieve the "Chinese carbon peak and carbon neutralization" goal, but also help enterprises can more effectively manage the risks brought by carbon emissions. This article uses empirical mode decomposition (EMD), convolutional neural networks (CNN) and long short-term memory networks (LSTM) to predict carbon emissions trading prices to propose different EMD-CNNs-LSTM combination strategy, and discussed the effect of the CNN-LSTM combination strategy, divide it into serial strategy and parallel strategy. This article uses the Guangdong, Shanghai, Hubei, and Chongqing carbon market price data to systematically compare the EMD-CNN-LSTM combination strategy with single prediction model and combination prediction model. The prediction effect of EMD-CNN-LSTM verifies the accuracy and robustness of the four combined strategy models of EMD-CNN-LSTM, demonstrated that parallel strategy forecasting is better for the universality of carbon market price series.
Keywords:
本文引用格式
陈晓红, 龚思远, 贺怡帆, 曹文治, 刘厚盾.
CHEN Xiaohong, GONG Siyuan, HE Yifan, CAO Wenzhi, LIU Houdun.
1 引言
2021年两会, "碳达峰、碳中和"被重点提出, 并指出建立全国碳排放权交易市场刻不容缓. 碳市场价格预测影响国家碳排放市场交易相关的政策制定(陈晓红等(2018, 2021)), 有利于建立全国统一的碳排放权市场和减少碳排放, 帮助"双碳"目标的实现. 同时可以帮助企业分析碳排放权市场波动特征, 更有效地管理碳排放带来的风险(陈晓红等(2017), Zhang, Li and Li et al. (2020), Zhang, Li and Luo et al. (2020)). 因此, 碳市场价格预测已经成为了许多学者研究关注的问题(陈晓红等(2012), 张晨等(2016), Zhou et al. (2018), Zhu et al. (2018), Adekoya et al. (2021)).
统计和计量模型(Tang et al. (2020))在传统碳价格预测研究中就得到了利用, 如非参数统计、灰色马尔可夫等预测方法(刘金培等(2019)). 然而, 碳市场价格序列本质上具有高噪声、非线性、非平稳等特性(杨星等(2018)), 传统的统计和计量模型处理非线性模式并不具有优势. 为此, 机器学习(Zhao et al. (2019), 赵康宁等(2019))和人工智能技术(Wang et al. (2021)) 应用到了碳市场价格预测中(朱帮助等(2011), Zhu et al. (2017)), 现有的碳市场价格预测方法分为单一预测模型和组合预测模型. 其中常用的单一预测模型包括长短期记忆(long short-term memory, LSTM)神经网络(Huang et al. (2021), Shahid et al. (2021))、BP (back propagation)神经网络等预测模型.
采用单一预测模型进行价格预测时, 会把原始碳价时间序列中不同特征的信息同质化, 进而影响预测结果的精准性. 因此, 近年来一些学者将组合预测模型(Anand et al. (2017), Sun et al. (2018))引入到碳市场价格预测(Zhang et al. (2018), Hao et al. (2020))研究领域, 典型的有相空间重构(phase space reconstruction, PSR)和最小二乘支持向量回归(least square support vector regression, LSSVR)组合模型(石雪涛等(2017)), 多贝西小波三层变换和单支重构的遗传算法径向基函数神经网络(Daubechies wavelet genetic algorithm radial basis function neural network model, Db3-GA-RBF)组合模型(杨星等(2018)), 多分辨率奇异值分解(multi-resolution singular value decomposition, MRSVD)和极限学习机(extreme learning machine, ELM)组合模型(Zhang et al. (2019)), 碳价格网络极限学习机(carbon price network-extreme learning machine, CPN-ELM)模型、快速多输出关联向量回归(fast multi-output relevance vector regression, FMRVR)和多目标鲸鱼优化算法(multi-objective whale optimization algorithm, MOWOA) 组合模型(Xiong et al. (2019)).
对于神经网络和上述组合模型, 碳市场价格数据不稳定产生的滞后效应会很大程度影响预测效果的精准性. 为此当前研究采用小波分解和经验模态分解(empirical mode decomposition, EMD)等方法, 对时间序列进行多尺度分解, 分解后的序列拥有更优秀的尺度波动规律性. 相比于小波分解方法, EMD对于分解尺度不需要预先设定, 在适应性、拟合精度等方面具有一定优势(李合龙等(2019)). 当前EMD-GA (genetic algorithm, 遗传算法) - BP、EMD-CNN (convolutional neural network, 卷积神经网络) - LSTM (刘亚珲等(2021))等组合模型广泛应用于不同领域的数据预测. 其中EMD-GA-BP与EMD-PSO (particle swarm optimization, 粒子群算法) - LSSVM组合模型(崔焕影和窦祥胜(2018))、EMD-PSO-SVM组合模型(Yang et al. (2014)) 在碳市场价格预测中取得了良好的预测效果.
基于上述文献综述, 本文认为孙少龙等(2021)提出的分解-预测-集成思想的多组合机器学习预测模型在提高中国区域性碳市场价格预测精度上具有显著优势. 然而, 现有研究仍存在一定的局限性:
1) CNN-LSTM组合模型在众多领域的预测性能获得了验证, 但是对于中国碳市场价格预测领域的效果研究还存在空缺.
2) CNN和LSTM具有很强的数据特征提取能力, 其中CNN能提取数据空间特性, LSTM提取时间特性. 现有研究对于CNN-LSTM组合方式进行了不同探索, 但未系统分析CNN-LSTM不同组合结构的特点和预测性能, 未能形成较完整的CNN-LSTM组合策略.
鉴于已有研究的不足, 本文构建了EMD-CNN-LSTM组合模型, 主要贡献可以归纳为以下三个方面:
1) 为了比较CNN和LSTM组合网络结构的特性, 本文在相关研究的基础上, 归纳并提出了CNN-LSTM串行和并行策略, 从串行策略和并行策略角度对比分析了CNN-LSTM模型对于碳市场价格预测的适用性.
2) 在CNN-LSTM串行和并行策略的基础上, 结合EMD分解技术, 组合出多种EMD-CNN-LSTM预测模型. 这些容易复制的模型结构可以扩展到大多数类型的CNN-RNN网络, 用于具有多个输入特征的预测任务, 为碳市场价格预测提供了有用的参考.
3) 采用了国内广东、上海、重庆、湖北四大碳交易所数据, 验证了本文所提EMD-CNN-LSTM模型的精确性和稳定性.
后续章节内容分别为: 第2部分首先介绍了EMD-CNN-LSTM模型的构成方法, 归纳了CNN-LSTM组合策略, 然后详细介绍了四种不同的EMD-CNN-LSTM模型. 第3部分以四所碳交易所的碳市场价格作为样本数据, 开展实证分析, 系统化检验不同CNN-LSTM策略结构的预测性能, 并将EMD-CNN-LSTM与其他基准模型进行对比, 验证该模型预测性能的准确性和稳定性. 最后是本文的总结.
2 模型构建
2.1 经验模态分解(EMD)
碳交易额受到多方面因素的影响, 例如碳排放量、能源计价、经济发展等, 表现出非线性、波动性的特点, 非线性和波动性会影响碳交易额预测的准确性, 因此需要利用EMD (张雯等(2021))对碳市场价格数据进行多尺度分解, 将碳市场价格序列数据分解为不同频率的振动模块和残差项, 用于后续的碳市场价格预测. EMD的核心思想是将不稳定的数据序列分离出不同尺度的平稳波动项以及一个残差趋势项, 波动项即本征模态函数(intrinsic mode function, IMF).
EMD的具体分解过程如下:
步骤1 确定初始待分解序列
步骤2 求出包络线的均值曲线
步骤3 求出初始序列与包络均值曲线的差值
若其不满足IMF分量的两个条件, 即极值和过零点的数目必须相等或者最多相差1, 其次包络平均值必须为0. 则用
步骤4 IMF1分量为
相对应剩余分量为
步骤5 重复步骤1
步骤6 最终得到EMD分解公式如下:
经过上述步骤, 本文利用EMD将碳市场价格初始序列
2.2 卷积神经网络(CNN)
CNN (convolutional neural networks)是一种能自动进行特征提取的技术, 在图像视觉领域取得了巨大的成功, 它在处理时间序列方面也显示出强大的潜力.本文通过卷积运算从相邻时间点的碳市场价格中提取空间特征, 输出特征图, 提取EMD相邻IMF中存在的显著空间关系特征. 一维卷积和二维卷积公式如下:
其中,
2.3 长短期神经网络(LSTM)
LSTM (long-short term memory)是一种改进的循环神经网络(recurrent neural network, RNN). 单元结构如图 1所示:
图1
LSTM网络结构的主要特点是在RNN原有的结构中加入的三个"门"结构, 分别是遗忘门、输入门和输出门.
遗忘门决定了上一层结构的输出中有哪些信息可以进入当前结构, 控制内部状态信息; 输入门是决定有多少新的信息加入到该层中来, 控制输入信息; 输出门用来决定本层的信息有多少输出到下一层去, 控制输出信息. LSTM模型因为其三个门结构的设计, 提升了传统RNN神经网络对长时间序列的学习能力. 这三个门的功能在数学上表述如下:
在式(10)到(13)中, 三个单元和存储单元的权重矩阵和偏置变量分别为
2.4 CNN-LSTM组合策略
CNN和LSTM具有强大的提取数据特征的能力, 尤其是, CNN可以直接学习时间序列数据的内部表示, 不需要领域的专业知识来手动提取特征, 而LSTM有较强的时间特征提取能力, 可以更准确地捕捉时间序列趋势中隐含的信息. 将CNN和LSTM结合使用能充分利用这两个神经网络的优势, 充分挖掘数据的潜在特质, 为预测提供支撑.
本文在相关研究的基础上分析了CNN-LSTM模型的各种策略, 将CNN-LSTM组合策略分为串行和并行两种策略.
串行策略指数据顺序经过CNN网络结构和LSTM网络结构, 如图 2, CNN网络结构可由一个或多个CNN网络组成, 为了提取不同特征, 一般CNN网络采用不同的卷积核, 在CNN网络提取特征后, 通过池化层或者全连接层将多个CNN网络融合; 然后, 融合结果通过LSTM进行学习; 最后通过全连接层得到最终结果.
图2
并行策略(如图 3)是数据同时由CNN网络结构和LSTM网络结构处理. 与串行策略一样, CNN可采用多个CNN网络组成, 通过池化层将多个CNN网络融合. 在经过CNN和LSTM网络学习后, 通过全连接层将数据合并得到最终结果.
图3
2.5 EMD-CNN-LSTM组合预测模型
为了保证CNN-LSTM模型的函数拟合和后续收敛, 本文使用EMD将数据分解成简单的频率特征, 并结合上节讨论的CNN-LSTM组合策略形成EMD-CNN-LSTM组合预测模型. 本文所构建的EMD-CNN-LSTM组合预测模型包含两个模块: 1)模式分解模块: 考虑碳市场价格的非线性和非平稳特性, 本文采用EMD技术对原始序列进行分解处理, 形成不同频率的子序列和残差. 2)预测模块: 应用CNN-LSTM串行或并行组合策略对各个子序列和残差项进行预测. EMD-CNN-LSTM组合预测模型的基本结构如图 4所示.
图4
EMD-CNN-LSTM模型包括以下四个主要步骤:
步骤1 EMD分解. 碳交易额序列经过预处理后, 被EMD分解成两组组成部分: 一系列的分量IMF和一个残差.
步骤2 分量合并. 合并EMD分解获得的分量IMF和残差, 形成二维数组, 并划分为训练数据集、测试数据集.
步骤3 模型训练. 将训练数据集输入CNN-LSTM网络进行训练学习, 并通过验证数据集对CNN-LSTM拟合进行无偏估计, 以此调整模型超参数. 通过训练和评估得到CNN-LSTM神经网络的最优超参数, 形成预测模型.
步骤4 输入待预测数据, 使用预测模型进行预测, 最后得到预测结果.
根据不同的CNN-LSTM网络结构, 本节提出四种EMD-CNN-LSTM神经网络结构模型, 具体结构如下.
首先, 利用CNN-LSTM串行结构构建简单的预测模型EMD-CNN-LSTM-Ⅰ, 本文将EMD子序列进行变化, 将子序列合并为1维序列, 并输入到CNN-LSTM串行结构中进行预测, 该模型的特点是不改变CNN-LSTM串行结构, 可以使用传统的预测结构. 具体结构如图 5.
图5
参照Xie et al. (2020)等人提出的CNN-LSTM预测模型, 本文提出当前最常用的EMD-CNN-LSTM网络结构(EMD-CNN-LSTM-Ⅱ), 该模型的特点是以CNN-LSTM串行结构为处理单元, 对每个EMD子序列进行预测. 首先将原始碳价格序列分解成具有不同频率的子序列, 然后将每个子序列输入CNN-LSTM串行结构的处理单元当中, 使用一维卷积提取相邻数据的关联特征, 再通过LSTM对特征时间序列进行处理, 得到分量的预测结果, 最后对子序列的预测结果进行重构. 具体结构如图 6.
图6
由于在EMD-CNN-LSTM-Ⅱ中, 割裂了各个EMD分量之间的关系, 本文提出第三个网络结构EMD-CNN-LSTM-Ⅲ中, 意在将EMD分量在LSTM阶段对EMD分量组合分析. 本文将EMD子序列通过CNN结构, 使用一维卷积提取其特征, 而后合并为二维数组, 并输入LSTM进行预测, 最后通过全连接层进行预测值合成. 具体结构如图 7.
图7
以上3个预测模型均基于CNN-LSTM串行结构进行构建, 本文提出的第四个网络结构EMD-CNN-LSTM-Ⅳ采用CNN-LSTM并行策略进行构建. 以EMD分量组合的二维矩阵为CNN和LSTM部分的输入, 分别提取EMD分量的时空特征, 在提取完成后将两部分特征融合, 并通过全连接层进行预测值合成. 具体结构如图 8.
图8
3 实证分析
3.1 数据来源
本文采集汇总了国内广东、重庆、上海、湖北四所碳交易所的碳市场价格数据, 交易数据时间跨度从2017年3月至2021年3月. 四所碳交易所价格数据来源于国内各碳交易所官网权威平台数据. 数据特征丰富, 包含交易时间、成交价等对价格影响因素. 其中, 广东碳交易所数据集1030条数据, 重庆碳交易所数据集1022条数据, 上海碳交易所数据集1023条数据, 湖北碳交易所数据集1025条数据, 为了测试组合模型的预测质量, 选择四个数据集中前700条集合数据用于训练, 后300条数据集合用于测试.
3.2 评价指标
为了证明EMD-CNN-LSTM模型的有效性, 本文选择了CNN、LSTM、GRU、CNN-LSTM、CNN-GRU等五个不同的模型为基准模型. 其中, CNN、LSTM、GRU为单一预测模型, CNN-LSTM、CNN-GRU为组合预测模型.本文使用均方根误差(RMSE)、平均绝对误差(MAE)和均方误差(MSE)用于评估预测误差, 值越小, 代表模型预测结果越准确.
其中
3.3 模型参数
本文采用PyTorch1.8实现预测模型. 为了防止优化函数陷入局部最优值, 提高预测的准确性, 本文采用批梯度下降法训练神经网络的权值和偏置, 批大小数为30, 学习率为0.0001, 遗弃率为0.6, 选用Adam优化器作为优化器, 共训练300到500期. 对于不同的CNN和RNN网络结构参数如表 1.
表1 不同模型下的CNN和RNN网络结构参数
模型 | CNN层 | RNN层 |
LSTM | - | 单LSTM结构: 隐藏层2层, 单元个数192 |
GRU | - | 单GRU结构: 隐藏层2层, 单元个数192 |
CNN | 单CNN结构: 出口通道32, 卷积核为(1, 3) | - |
CNN-LSTM | 单CNN结构: 输出通道32, 卷积核为(1, 3) | 单LSTM结构: 隐藏层2层, 单元个数192 |
CNN-GRU | 单CNN结构: 输出通道32, 卷积核为(1, 3) | 单GRU结构: 隐藏层2层, 单元个数192 |
EMD-CNN-LSTM-Ⅰ | 单CNN结构: 输出通道32, 卷积核为(1, 3) | 单LSTM结构: 隐藏层2层, 单元个数192 |
EMD-CNN-LSTM-Ⅱ | 每个分量单CNN结构: 输出通道32, 卷积核为(1, 3) | 每个分量单LSTM结构: 隐藏层2层, 单元个数192 |
EMD-CNN-LSTM-Ⅲ | 每个分量单CNN结构: 输出通道32, 卷积核为(1, 3) | 单LSTM结构: 隐藏层2层, 单元个数192 |
EMD-CNN-LSTM-Ⅳ | 多CNN结构: 输出通道32, 卷积核依次为(1, 20)、(2, 20) | 单LSTM结构: 隐藏层2层, 单元个数192 |
由于不同城市碳市场价格数据特点不同, 对于预测模型参数会进行微调. 其次全连接层一般采用两层Liner进行处理, CNN后和Liner层后会使用激活函数ReLu.
3.4 EMD分量分解
本文采用EMD分解技术分别对广东、湖北、上海、重庆四个碳市场价格序列进行了向量分解, 第一行Raw data表示碳市场价格原始数据趋势, 中间行表示IMF, 最后一行表示残差. 其中, 广东、湖北、上海有8个IMF和1个残差, 重庆有6个IMF和1个残差.
如图 9所示, 广东碳市场因其配额分配方案呈"稳中偏紧"的特性, 碳市场交易一直呈现稳定行情. 湖北碳市场自开市以来就采取"低价起步、适度从紧"的分配策略, 是四所碳市场中交易集中度最低的, 活跃度相对较高. 详细的监管制度和严格处罚力度使得上海碳市场表现一直活跃. 重庆碳市场受其配额分配机制"先松后紧", 交易体系目标不以交易为主的影响, 自开市以来碳市场处于极度不活跃状态. 从EMD分解结果上分析可知, 越后分解出的IMF分量振荡幅度越平缓. 与原始数据特征相似, 不同碳市场的IMF分量呈现出各自市场的特征, 广东分量整体保持稳定, 波动区间具有集中性; 湖北分量表现出强烈的活跃上升特性, 呈现整体平稳但波动性逐渐增强的趋势; 上海分量具有较强的离散性, 并且后期周期性愈发明显; 重庆分量表现平缓, 变化趋势都集中在后面阶段, 且规律性较混乱.
图9
3.5 实证检验
本文对所有模型进行了向前1步的预测检验, 即将前20个交易日(四周)的数据用于预测第21个交易日的碳市场价格. 各个模型对广东、重庆、上海、湖北的碳市场价格预测结果对比如图 10所示.
图10
另外, 表 2显示了各个预测模型对碳市场价格预测的MAE、MSE、RMSE评价值. 在单一预测模型中, CNN和LSTM在四个城市碳市场价格预测性能表现较好, 说明CNN和LSTM对碳市场价格数据有较好的特征提取能力. 在组合预测模型中CNN-LSTM组合模型效果较好, 同时好于单一预测模型, 说明CNN-LSTM组合预测模型能同时对碳市场价格数据进行时空特征提取. 对于湖北数据, 分量图和数据分布图显示, 湖北稳定活跃的时期占据了大多数时间, 但是与其他城市不一样的是部分分量呈现单向的骤降和骤升, 使得EMD-CNN-LSTM-Ⅱ组合模型对分量采用CNN-LSTM结构进行预测时误差会增加, 同时预测结果累加会使误差叠加, 使EMD-CNN-LSTM-Ⅱ方法的结果略差于CNN-LSTM方法.
表2 不同模型碳市场价格预测结果评价指标对比表
模型 | 广东 | 重庆 | |||||
MSE | RMSE | MAE | MSE | RMSE | MAE | ||
LSTM | 1.0249 | 1.1510 | 0.8534 | 3.9616 | 1.9904 | 1.4534 | |
GRU | 1.1060 | 1.1518 | 1.0659 | 5.1085 | 2.2602 | 1.6947 | |
CNN | 1.1032 | 1.0503 | 1.0587 | 4.9673 | 2.2287 | 1.6122 | |
CNN-LSTM | 0.9012 | 0.9493 | 0.6791 | 3.3859 | 1.6712 | 1.2351 | |
CNN-GRU | 0.9564 | 0.9608 | 0.8688 | 3.4382 | 1.8543 | 1.5388 | |
EMD-CNN-LSTM-Ⅰ | 0.7925 | 0.8902 | 0.5888 | 1.3867 | 1.1245 | 0.7186 | |
EMD-CNN-LSTM-Ⅱ | 0.3323* | 0.5765* | 0.4821* | 2.3236 | 1.5243 | 1.1283 | |
EMD-CNN-LSTM-Ⅲ | 0.8948 | 0.9459 | 0.7603 | 2.0197 | 1.4211 | 0.8637 | |
EMD-CNN-LSTM-Ⅳ | 0.5035 | 0.7095 | 0.4923 | 1.2378* | 1.1126* | 0.8783* | |
模型 | 上海 | 湖北 | |||||
MSE | RMSE | MAE | MSE | RMSE | MAE | ||
LSTM | 1.6591 | 1.6658 | 1.3988 | 1.8571 | 1.3627 | 1.1480 | |
GRU | 2.6815 | 1.7277 | 1.9243 | 2.7676 | 1.6636 | 1.5537 | |
CNN | 1.6653 | 1.6731 | 1.5587 | 2.6811 | 1.6374 | 1.4551 | |
CNN-LSTM | 1.6169 | 1.6330 | 1.2193 | 1.1090 | 1.0530 | 0.8692 | |
CNN-GRU | 1.9647 | 1.7218 | 1.3976 | 1.8076 | 1.3445 | 1.0981 | |
EMD-CNN-LSTM-Ⅰ | 0.8050* | 0.8972* | 0.6713* | 0.4871 | 0.6979 | 0.5503 | |
EMD-CNN-LSTM-Ⅱ | 1.3368 | 1.1562 | 0.9408 | 1.1346 | 1.0689 | 0.8706 | |
EMD-CNN-LSTM-Ⅲ | 1.4734 | 1.5727 | 1.1032 | 0.6267 | 0.7916 | 0.6379 | |
EMD-CNN-LSTM-Ⅳ | 0.9619 | 0.9807 | 0.7476 | 0.3128* | 0.5593* | 0.4581* |
整体实证结果表明, 在对碳市场价格的预测, 本文提出的四个EMD-CNN-LSTM组合模型在所有城市都取得了优于其他基准模型的预测结果, 说明EMD-CNN-LSTM组合模型预测性能更优.根据以上结果分析, 本文选取CNN、CNN-LSTM、EMD-CNN-LSTM-Ⅰ、EMD-CNN-LSTM-Ⅳ模型绘制了广东、重庆、上海、湖北碳市场价格预测结果图.
如图 11所示, 在各个碳交易市场价格预测中, EMD-CNN-LSTM-Ⅳ组合模型的预测曲线与真实值曲线吻合度较高, 即EMD-CNN-LSTM-Ⅳ组合模型预测精度较好, 与前述分析结果一致.
图11
3.5.1 未经分解与分解组合模型的对比
CNN-LSTM组合模型和CNN-GRU组合模型均是直接利用碳市场价格序列作为预测模型输入的预测模型, 通过比较表 2的预测结果可知CNN-LSTM组合模型和CNN-GRU组合模型预测精度优于单一的预测模型, 在重庆和湖北交易所碳市场价格预测中性能提升尤为显著. 结构上, CNN-LSTM与EMD-CNN-LSTM模型Ⅰ、Ⅱ、Ⅲ均属于串行策略, 而采用了EMD分解技术的EMD-CNN-LSTM组合模型提高了整体模型的预测精度, 预测效果好于未经分解技术的CNN-LSTM组合模型和CNN-GRU组合模型, 这说明分解技术能有效降低碳市场价格序列的复杂度, 提高预测精度.
3.5.2 CNN-LSTM串行策略与并行策略对比分析
EMD-CNN-LSTM组合模型分为串行策略和并行策略两大类. 其中, 并行策略以EMD-CNN-LSTM-Ⅳ组合模型为代表, 其他三种均为串行策略.
对比表 2可知, EMD-CNN-LSTM模型相较于单一神经网络预测模型, 多尺度的组合模型EMD-CNN-LSTM无论在预测的拟合程度还是减小误差方面均有较大的优势. 结合表 2和图 10可得, EMD-CNN-LSTM-Ⅰ组合模型在离散性较强的上海碳市场价格预测结果中相比其他串行策略取得了最优结果, 同时预测效果也强于并行策略EMD-CNN-LSTM-Ⅳ组合模型; 串行策略EMD-CNN-LSTM-Ⅱ组合模型的在起伏趋势平稳的广东碳市场价格预测结果中MSE、MAE、RMSE评价值与基准模型相比只占了30%, 在所有模型中为最小, 而并行策略EMD-CNN-LSTM-Ⅳ组合模型的预测结果仅次于EMD-CNN-LSTM-Ⅱ组合模型. 除此之外, 并行策略EMD-CNN-LSTM-Ⅳ组合模型在价格变化不活跃的重庆碳市场和活跃的湖北碳市场价格预测中对比其他所有串行策略均取得了最好结果; 串行策略EMD-CNN-LSTM-Ⅲ组合模型碳市场价格预测结果虽然优于单一模型和未经分解模型, 但是在四种策略结果中表现一般.
串行策略中, EMD-CNN-LSTM-Ⅰ组合模型的预测过程采用将所有分量组合成一维特征作为预测输入, 传进CNN-LSTM模型中进行训练, 因其结构的简洁性, 在计算上能很好地适应离散型较强的数据. EMD-CNN-LSTM-Ⅱ组合模型采用将EMD算法分解后的多维向量作为输入, 随后CNN和LSTM在单个分解组件中对碳市场交易价格序列进行训练, 最后由多个LSTM模块累加得到预测结果, 此种累加结构的优势是能对具有分布均匀特性的数据进行更好的预测, 但累加结构会造成结果误差的叠加. EMD-CNN-LSTM-Ⅲ组合模型是对碳市场价格序列应用EMD分解算法后, 将所得子序列合并输入CNN-LSTM结构中, 这种合并结构让LSTM结构部分处理结果比较简洁, 从而会忽略个别数据特性, 在表现上略差一筹. 与它们不同的是, 并行策略结构的EMD-CNN-LSTM-Ⅳ组合模型采用将经过分解后的向量并行输入CNN和LSTM模型中, 最后将两者结果进行累加得到预测结果, 并行结构的使用, 使得此策略结构能照顾到更多的数据特性细节, 从而具备了更好的适应性, 因此在大多数数据集上都表现优秀.
3.5.3 模型时间复杂度对比分析
由于EMD-CNN-LSTM组合模型采用了组合策略, 增加了预测模型的复杂度. 为此, 本节通过实验对比了EMD-CNN-LSTM组合模型训练运行时间和时间复杂度. 本文对LSTM等单一模型和EMD-CNN-LSTM组合模型分别进行了500、750、1000条数据三个量级的时间复杂度实验, 结果如表 3所示.
表3 不同模型碳市场价格时间复杂度对比表
模型 | 广东(秒) | 重庆(秒) | |||||
500 | 750 | 1000 | 500 | 750 | 1000 | ||
LSTM | 23 | 36 | 51 | 22 | 36 | 51 | |
GRU | 20 | 34 | 47 | 21 | 33 | 46 | |
CNN | 25 | 40 | 58 | 24 | 41 | 56 | |
CNN-LSTM | 27 | 45 | 62 | 27 | 45 | 60 | |
CNN-GRU | 24 | 41 | 56 | 25 | 40 | 55 | |
EMD-CNN-LSTM-Ⅰ | 71.2 | 108.54 | 150.19 | 57.46 | 101.27 | 130.71 | |
EMD-CNN-LSTM-Ⅱ | 282.15 | 476.54 | 758.75 | 237.61 | 365.46 | 584.76 | |
EMD-CNN-LSTM-Ⅲ | 95.12 | 147.1 | 198.7 | 96.16 | 140.63 | 199.33 | |
EMD-CNN-LSTM-Ⅳ | 141.54 | 213.64 | 304.49 | 143.86 | 211.59 | 296.95 | |
模型 | 上海(秒) | 湖北(秒) | |||||
500 | 750 | 1000 | 500 | 750 | 1000 | ||
LSTM | 23 | 36 | 51 | 22 | 37 | 52 | |
GRU | 20 | 33 | 45 | 20 | 34 | 46 | |
CNN | 26 | 39 | 58 | 25 | 41 | 59 | |
CNN-LSTM | 29 | 44 | 62 | 28 | 44 | 61 | |
CNN-GRU | 25 | 39 | 55 | 26 | 40 | 55 | |
EMD-CNN-LSTM-Ⅰ | 66.17 | 107.7 | 135.57 | 69.55 | 104.11 | 137.68 | |
EMD-CNN-LSTM-Ⅱ | 242 | 425.32 | 758.84 | 257.37 | 489.97 | 734.28 | |
EMD-CNN-LSTM-Ⅲ | 87.24 | 143.44 | 198.36 | 96.14 | 143.66 | 195 | |
EMD-CNN-LSTM-Ⅳ | 135.88 | 217.01 | 295.32 | 142.53 | 215.43 | 293.03 |
对比四个碳市场交易价格预测模型的训练运行时间可知不同城市数据特性和数据分布对于模型训练运行时间影响不大, 对比三个数据量级模型运行时间可知, 未经分解的预测模型运行时间随着数据量级提升呈现线性增长, 本文提出的EMD-CNN-LSTM-Ⅰ、Ⅲ、Ⅳ组合模型也呈现此特点, 而EMD-CNN-LSTM-Ⅱ组合模型运行时间会随着数据量级增加而成倍数增加. EMD-CNN-LSTM-Ⅰ、Ⅲ、Ⅳ组合模型采用了经过EMD分解后的多个向量作为输入, 相比其他基准模型在输入量上成倍增加, 另外模型结构也相较于单一模型复杂, 所以这些模型的训练运行时间比单一模型长. 但是对比分析所有模型的同量级运行时间可知, 本文提出的EMD-CNN-LSTM组合模型相比于单一模型和未经分解模型, 在多出EMD分解向量运行负荷的步骤下, 运行时间并没有呈现成倍增加, 而是正常范围内的结构性组合导致的运行时间叠加增长, 显现了本文策略结构在提升预测精度和稳定性的同时具有较好的时间复杂度.
其中, EMD-CNN-LSTM-Ⅱ组合模型对多个分量采用CNN-LSTM进行预测, 并对分量预测结果进行求和, 所以EMD-CNN-LSTM-Ⅱ组合模型对于高量级数据的运行和分析需要更长的时间.
4 结论
本文主要提出了一种基于EMD-CNN-LSTM的碳市场价格序列预测模型. 该模型采用EMD分解技术, 并结合CNN-LSTM模型进行预测. 以广州、上海、重庆、湖北碳交易所的碳市场价格作为实证样本, 从串行策略和并行策略角度出发, 将两类EMD-CNN-LSTM模型与CNN-LSTM、CNN-GRU、GRU、CNN、LSTM模型的预测性能进行了比较. 本文主要贡献如下:
1) 证明与GRU、CNN、LSTM等单一预测模型和CNN-LSTM、CNN-GRU等组合模型相比, EMD-CNN-LSTM组合模型预测误差较小, 预测结果更准确.
2) EMD-CNN-LSTM-Ⅳ组合模型对于活跃度较高的湖北碳市场价格预测和活跃度不好的重庆碳市场价格预测中均获得良好的预测效果, 说明并行策略对于不同特性的碳市场价格序列具有良好的普适性.
3) 相比其他串行策略, 串行策略EMD-CNN-LSTM-Ⅰ组合模型针对离散特性的碳市场价格序列具有更好的预测表现, 串行策略EMD-CNN-LSTM-Ⅱ组合模型对于表现平稳的碳市场价格序列预测效果更好.
此外, 本文的研究结果为提高碳市场价格预测的准确性提供了一种新的途径, 丰富了CNN和LSTM组合网络结构特性的比较研究, 这种容易扩展的策略可以应用于更多领域的CNN-LSTM预测模型中. 然而, 由于本文暂时未将碳市场价格变化季度特性, 国内不同碳市场覆盖行业特性等纳入比较指标, 因此, 在未来研究方向上, 可以在串行策略和并行策略CNN-LSTM组合模型基础上, 从不同行业特性下碳市场价格序列预测适用性的角度出发, 进一步提升预测效果.
参考文献
基于EMD-GA-BP与EMD-PSO-LSSVM的中国碳市场价格预测
[J]. ,
Carbon Price Forecasts in Chinese Carbon Trading Market Based on EMD-GA-BP and EMD-PSO-LSSVM
[J].
碳配额免费分配法下寻租对市场运行效率影响
[J]. ,
Study on the Effect of Rent-Seeking on Carbon Emission Trading Market Performance Under Free Carbon Emission Allowances
[J].
环境规制下区域间企业绿色技术转型策略演化稳定性研究
[J]. ,
Research on Green Technology Transformation Strategy of Inter-Regional Enterprises Under Enviromental Regulation Based on Evolutionary Gamen Theory
[J].
碳排放权交易价格影响因素实证研究——以欧盟排放交易体系(EUETS)为例
[J]. ,
Empirical Research on Price Impact Factor of Carbon Emission Exchange: Evidence from EUETS
[J].
基于三阶段SBM-DEA模型的中国区域碳排放效率研究
[J]. ,
Analysis of the Low Carbon Economy Efficiency in China: Based on a Method of Three Stage SBM-DEA Model with Undesirable Outputs
[J].
基于非结构数据流行学习的碳价格多尺度组合预测
[J]. ,
Multi-Scale Combined Forecast of Carbon Price Based on Manifold Learning of Unstructured Data
[J].
我国股票市场行业间波动溢出效应研究——基于改进的EMD去噪方法
[J]. ,
A Survey on Industrial Spoillover Effect of China's Stock Market — Based on Revised EMD Denoising Methon
[J].
基于聚类经验模态分解的CNN-LSTM超短期电力负荷预测
[J]. ,
Ultra-short-term Power Load Forecasting Method Based on Cluster Empirical Mode Decomposition of CNN-LSTM
[J].
基于分解-聚类-集成学习的汇率预测方法
[J]. ,
Exchange Rates Forecasting with Decomposition-clustering-ensemble Learning Approach
[J].
基于相空间重构和最小二乘支持向量回归模型参数同步优化的碳市场价格预测
[J]. ,
Carbon Price Forecasting Based on Phase Space Reconstruction and Least Square Support Vector Regression
[J].
多标度分形特征下碳排放权价格预测算法
[J]. ,
Price Forecasting Algorithm of Carbon Emission Rights Under Multiscale Fractal Characteristics
[J].
基于多频组合模型的中国区域碳市场价格预测
[J]. ,
Forecasting of China's Regional Carbon Market Price Based on Multi-frequency Combined Model
[J].
基于GMDH-PSO-LSSVM的国际碳市场价格预测
[J]. ,
Carbon Price Prediction Based on Integration of GMDH, Particle Swarm Optimization and Least Squares Support Vector Machines
[J].
基于改进贝叶斯神经网络的光伏出力概率预测
[J]. ,
Probabilistic Forecasting for Photovoltaic Power Based on Improved Bayesian Neural Network
[J].
Predicting Carbon Allowance Prices with Energy Prices: A New Approach
[J]. ,
Forecasting of Electricity Demand by Hybrid ANN-PSO Models
[J]. ,
A Hybrid Framework for Carbon Trading Price Forecasting: The Role of Multiple Influence Factor
[J]. ,
A Hybrid Model for Carbon Price Forecasting Using GARCH and Long Short-Term Memory Network
[J]. ,
Predicting Residential Energy Consumption Using CNN-LSTM Neural Networks
[J]. ,
Carbon Trading Volume and Price Forecasting in China Using Multiple Machine Learning Models
[J]. ,
A Novel Genetic LSTM Model for Wind Power Forecast
[J]. ,
Analysis and Forecasting of the Carbon Price Using Multi-Resolution Singular Value Decomposition and Extreme Learning Machine Optimized by Adaptive Whale Optimization Algorithm
[J]. ,
Quantitative Models in Emission Trading System Research: A Literature Review
[J]. ,
A Novel Framework for Carbon Price Prediction Using Comprehensive Feature Screening, Bidirectional Gate Recurrent Unit and Gaussian Process Regression
[J]. ,
Motion Trajectory Prediction Based on A CNN-LSTM Sequential Model
[J]. ,
Multi-Step-Ahead Carbon Price Forecasting Based on Variational Mode Decomposition and Fast Multi-Output Relevance Vector Regression Optimized by The Multi-Objective Whale Optimization Algorithm
[J]. ,
A New Prediction Method of Gold Price: EMD-PSO-SVM
[J]. ,
A Hybrid Model Using Signal Processing Technology, Econometric Models and Neural Network for Carbon Spot Price Forecasting
[J]. ,
Emission Reduction Effect and Carbon Market Efficiency of Carbon Emissions Trading Policy in China
[J]. ,
Carbon Price Forecasting Based on Multi-Resolution Singular Value Decomposition and Extreme Learning Machine Optimized by the Moth-Flame Optimization Algorithm Considering Energy and Economic Factors
[J]. ,
The Effect of Emission Trading Policy on Carbon Emission Reduction: Evidence from An Integrated Study of Pilot Regions in China
[J]. ,
Speech Emotion Recognition Using Deep 1D & 2D CNN LSTM Networks
[J]. ,
An Empirical Analysis of Carbon Emission Price in China
[J]. ,
A Novel Multiscale Nonlinear Ensemble Leaning Paradigm for Carbon Price Forecasting
[J]. ,
Forecasting Carbon Price Using Empirical Mode Decomposition and Evolutionary Least Squares Support Vector Regression
[J]. ,
/
〈 | 〉 |