Stock Index Prediction and Industry Rotation Strategy Based on a Decomposition-Reconstruction-Integration Framework

Li ZHENG, Mingchen LI, Yunjie WEI, Shouyang WANG

China Journal of Econometrics ›› 2024, Vol. 4 ›› Issue (3) : 673-698.

PDF(1888 KB)
PDF(1888 KB)
China Journal of Econometrics ›› 2024, Vol. 4 ›› Issue (3) : 673-698. DOI: 10.12012/CJoE2024-0091

Stock Index Prediction and Industry Rotation Strategy Based on a Decomposition-Reconstruction-Integration Framework

Author information +
History +

Abstract

Stock index data is influenced by multiple factors, exhibiting nonlinear, non-stationary, high complexity, and high volatility characteristics. Therefore, it is difficult for a single model to fully capture its data features. This paper proposes a hybrid forecasting model for stock index returns based on a decomposition-reconstruction-integration framework. Utilizing variational mode decomposition (VMD), the original high-complexity stock index time series is decomposed. The composite multiscale entropy (CMSE) is employed as a reconstruction indicator to reorganize the stock index data components into long-term trend terms, medium-term impact terms, and short-term disturbance terms. ARIMA, BPNN, and LSTM models are adopted for forecasting based on their respective data characteristics. Finally, the predictions of various frequency components are integrated to obtain the ultimate forecasting results. The proposed method is applied to forecasting eight significant industry stock indices and is compared with models utilizing fine to coarse (FTC), sample entropy (SE), fuzzy entropy (FE), and multiscale permutation entropy (MSPE) as reconstruction methods. Furthermore, two industry rotation strategies, equal-weight investment and dynamic-weight investment, are proposed to validate the performance of the proposed model in practical trading from both conservative and aggressive perspectives. The empirical results demonstrate that CMSE outperforms other reconstruction indicators in stock index forecasting. Compared to benchmark models, the hybrid model presented in this paper achieves lower forecasting errors and higher directional accuracy, and the proposed industry rotation strategies exhibit excellent performance in terms of risk and return.

Key words

decomposition-reconstruction-integration / stock index prediction / composite multiscale entropy / industry rotation

Cite this article

Download Citations
Li ZHENG , Mingchen LI , Yunjie WEI , Shouyang WANG. Stock Index Prediction and Industry Rotation Strategy Based on a Decomposition-Reconstruction-Integration Framework. China Journal of Econometrics, 2024, 4(3): 673-698 https://doi.org/10.12012/CJoE2024-0091

1 引言

近年来, 中国股票市场在国家经济中的地位不断提升, 股指的涨跌直接影响到金融市场的稳定和实体经济的发展. 但中国股票市场呈现出复杂、波动聚集的特点, 使得股指预测极具挑战性, 这主要归因于以下三方面: 从股票市场自身角度, 中国股票市场受到宏观经济形势、政策变动、国际政治局势、外围股票市场表现等多种因素的影响(邓可斌, 关子桓和陈彬, 2018; 姜富伟, 郭鹏和郭豫媚, 2019; 朱民和徐钟祥, 2021; 李岸, 粟亚亚和乔海曙, 2016); 从投资者构成角度, 相较于国外成熟资本市场, 中国股票市场存在大量投机行为和缺乏经验的散户投资人(陈坚和张轶凡, 2018), 且中国机构投资者不成熟, 其羊群行为会提高股价崩盘风险(许年行, 于上尧和伊志宏, 2013); 从法律建设角度, 中国股票市场法律体现体系仍不够完善, 内幕交易、市场操纵、虚假信息等现象削弱了股票市场的有效性. 这些因素共同作用, 导致了中国股票市场呈现出高波动性、高换手率、牛短熊长和暴涨暴跌等特征, 进而增加了预测的难度. 近年来, 由于新冠疫情的暴发及国际局势的动荡, 中国股票市场受到了巨大的影响, 市场波动性进一步加剧, 给股指预测带来了新的挑战.
虽然股票市场不确定性高, 预测难度大, 但对其的预测却是至关重要的. 对监管者来说, 由于股指在经济环境的早期预警中扮演着重要的角色(Liu and Long, 2020), 对股指表现的预测有助于制定更合理的政策、防范金融风险、维护金融市场的稳定; 对投资者来说, 对股指的预测有助于优化投资组合、获取超额收益、进行资金风险管理; 对上市公司来说, 对股市表现的预测有助于制定合理的财务政策, 扩大公司经营成果, 如可以通过对股指的预测制定相匹配的融资或分红计划, 保障公司现金流, 降低公司财务风险.
目前学术界对于金融领域时间序列的预测主要采用两类模型: 传统统计学模型和机器学习模型. 统计学模型在金融时间序列预测中得到了广泛的应用, 包括自回归差分移动平均模型(autoregressive integrated moving average model, ARIMA) (万建强和文洲, 2001; Challa et al., 2020)、广义自回归条件异方差模型(generalized autoregressive conditional heteroskedasticity model, GARCH) (Franses and Ghijsels, 1999)、向量自回归模型(vector autoregression model, VAR)(Brandt and Kang, 2004)、误差修正模型(error correction model, ECM) (Maysami and Koh, 2000; kim, 2003)等. 然而, 股指数据难以满足统计学模型关于平稳性和正态性的假设(Long et al., 2020), 且这些统计学模型无法捕捉数据的非线性特征, 因此在应用于具有非线性、非平稳、高波动特征的中国股指数据时, 预测表现较差.
为了捕捉时间序列数据的非线性特征, 提高预测精度, 机器学习算法被引入到金融时间序列的预测中. 常用的机器学习算法包括支持向量机(support vector machine, SVM) (Yu et al., 2017)、支持向量回归(support vector regression, SVR) (Kao et al., 2013)、神经网络(neural network, NN) (Zhang and Qi, 2005)、多层感知器(multilayer perceptron, MLP) (Sheta et al., 2015)、循环神经网络(recurrent neural network, RNN) (Cao et al., 2012)、长短期记忆网络(long short-term memory network, LSTM) (Fischer and Krauss, 2018)等. 其中, 神经网络是一种模拟人脑神经元网络结构的计算模型, 由多个神经元组成层级结构. 每个神经元接收输入信号, 通过激活函数进行非线性变换, 并输出到下一层神经元. 具体而言, 神经网络一般可分为前馈神经网络和循环神经网络. 前馈神经网络是指输入数据通过神经网络逐层传递, 最终得到输出结果. BP神经网络(backpropagation neural network, BPNN) 是一种特殊的多层前馈网络, 可以根据根据输出结果和目标值之间的误差, 通过梯度下降等优化算法更新神经网络中的权重和偏置项, 以最小化误差, 实现模型训练. BPNN在股价预测、汇率中长期预测等经济领域的应用已经取得很好的效果(闻岳春和王婧婷, 2010). RNN主要用于处理序列数据, 其最大的特点就是神经元在某时刻的输出可以作为输入再次输入到神经元, 这种串联的网络结构非常适合于时间序列数据, 可以保持数据中的依赖关系(杨丽等, 2018). 但是由于RNN的迭代性, 标准的循环神经网络存在梯度消失和梯度爆炸的问题(Bengio et al., 1994). 为了解决这个问题, Hochreiter and Schmidhuber (1997)对RNN进行了改进, 提出LSTM网络. LSTM通过引入门控机制和细胞状态, 克服了梯度消失和爆炸问题, 在处理长序列时表现更好.
虽然机器学习模型在时间序列预测领域取得了较好的结果, 但是单个模型在预测复杂的金融数据时仍存在劣势, 很难在所有情况下都获得最佳表现. 在这种情况下, 集成了多种单个模型的复合模型逐渐获得关注. 其中, 基于“分而治之”思想的分解集成框架是最常使用的一类复合方法(Yu et al., 2008). 分解-集成框架是指先利用分解方法对原始数据进行分解, 得到多个子序列(即本征模态函数, intrinsic mode functions, IMFs), 然后分别对每个子序列进行预测, 通过集成每个子序列的预测结果得到最终预测. 例如Niu et al. (2020)使用VMD-LSTM模型(变分模态分解, variational mode decomposition, VMD)对恒生和标普指数进行预测, 获得了比单个模型更高的精度. 但是, 对每个序列进行预测均会有误差, 最终的集成会导致误差的累积, 在某些情况下反而会增大预测误差(Yu and Ma, 2021). 为了解决这个问题, 部分学者提出在分解后先进行各个子序列的重构, 再对重构后的序列进行预测和集成. 如梁小珍等(2020)通过奇异谱分解和重构对航空客运需求进行预测, 高海翔, 胡瑜和余乐安(2021)通过集合经验模态分解(ensemble empirical mode decomposition, EEMD)和重构对原油价格进行预测, 均获得了好于基准模型的预测结果.
对于分解-集成-重构框架, 分解和重构方法对模型的预测性能有重要的影响(Yu and Ma, 2021). 目前学术界对于时间序列数据存在三种主流的分解方法, 分别是经验模态分解(empirical mode decomposition, EMD) (Huang et al., 1998)、集合经验模态分解(EEMD) (Wu and Huang, 2009)和变分模态分解(VMD) (Dragomiretskiy and Zosso, 2014). EMD能根据信号的时间尺度特征将原始信号分解为本征模态函数, 且具有良好的自适应性, 无需预设基函数. 但是EMD分解存在模态混叠问题, 可能会出现一个IMF中包含时间尺度差异极大的两个特征, 或相近的时间尺度特征分布在不同的IMF中的现象. 为了解决这个问题, Wu and Huang (2009)提出了EEMD. EEMD较好地解决了EMD中存在的模态混叠问题, 但是其对噪音和采样敏感, 导致结果缺乏稳健性. Dragomiretskiy and Zosso (2014)进一步提出了VMD, VMD通过自适应方法获得频域中不同中心频率的有效分量, 能获得更有效的特征选择. 此外, VMD具有自适应和非递归的优点, 同时还能预先确定分解的IMF的数量, 适用于具有高复杂度、强非线性特征的时间序列数据. 相比于EMD和EEMD, VMD能获得更好的分解结果和预测表现(Niu et al., 2020; Yu and Ma, 2021), 因此本文采用VMD对数据进行处理.
目前学术界一般使用两类重构方法, 一类是Fine to Coarse (FTC) 方法, 一类是以序列复杂度(即熵) 作为标准, 将具有相似复杂度的序列进行重构, 这主要包括样本熵(sample entropy, SE)、多尺度排列熵(multiscale permutation entropy, MSPE)、模糊熵(fuzzy entropy, FE)、复合多尺度熵(composite multiscale entropy, CMSE)等(Li et al., 2022). 如Zhang et al. (2008)使用FTC方法对分解后的原油价格序列进行重构, 进而分析其长期、中期和短期价格特征; Sun et al. (2022)基于样本熵提出了一种聚类方法, 将分解后的序列进行重构, 进而利用机器学习方法对原油价格进行预测, 得到了较好的结果; Niu et al. (2022)提出了一种融合了VMD、样本熵和异常值鲁棒极限学习机的混合模型, 该模型比EMD具有更强的噪声鲁棒性, 并在碳价格预测方面取得了较好的预测结果; Yang et al. (2022)基于MSPE对电力短期负荷分解后的序列进行重构, 并对未来需求进行预测, 相较于单一模型和未进行序列重构的复合模型, 获得了更高的预测精度; 陈凯杰等(2022)基于模糊熵对利用EEMD分解后的数据进行重构, 并将其应用于沪深300和中证500指数预测, 取得了良好的预测准确性. 总体来看, 熵方法被广泛用于重构(Liu et al., 2018), 但不同熵的重构效果缺乏比较.
鉴于复合多尺度熵还未被应用于金融时间序列的分解集成预测中, 学术界缺乏对其重构效果的研究, 本文基于分解-重构-集成框架提出了一个新颖的股指预测与交易方法, 该方法主要分为5步: 第一, 收集相关原始数据. 第二, 我们利用VMD将原始数据进行分解; 第三, 我们以复合多尺度熵衡量序列复杂度, 进而将具有相似复杂度的子序列进行重构, 得到股指的长期趋势项、中期影响项和短期扰动项; 第四, 根据重构后的序列特征, 分别采用计量经济学方法(ARIMA)、机器学习方法(BPNN)、深度学习方法(LSTM) 进行预测; 随后, 我们将三个序列的预测结果进项加总, 得到最终的预测结果. 为了验证所提出方法的优越性, 我们将其应用于总市值排名靠前(以2023-10-31为基准) 的八个申万一级行业指数. 实证结果表明, 相比于单一模型和以其他熵作为重构标准的复合模型, 本文提出的VMD-CMSE-ARIMA-BPNN-LSTM模型具有较高的预测精度和方向准确度. 第五, 交易模拟; 预测模型的真正价值体现在其对实际市场行为的指导能力, 一个高效的预测模型能够提供关于市场趋势、潜在风险和投资机会的关键信息, 从而使投资者能够更好地理解市场动态, 采取适当的投资策略, 优化资产配置, 以及管理潜在风险. 因此, 在对八种重要申万一级行业预测的基础上, 我们创新性地构建了两种行业轮动策略, 分别从保守和激进两个视角出发, 旨在全面验证所提出模型的实践应用效果. 在这两种策略下, 本文提出的复合模型的表现均好于其余模型. 本文的主要贡献如下:
1) 本文首次将复合多尺度熵作为重构指标引入股指预测领域, 提出了一个新颖的基于分解-重构-集成框架的股指预测模型. 相较于基准模型, 该模型能获得较高的预测精度和方向准确度.
2) 相比于现有文献聚焦于分解方法和预测模型, 本文通过将基于多种重构方法的模型进行比较, 证实了重构方法对预测结果的重要性, 对已有文献的研究结果进行了补充. 另外, 本文发现对于中国股指预测, 基于复合多尺度熵的重构能获得较好的结果, 丰富了已有的研究.
3) 本文提出了基于日度预测的行业轮动策略, 且本文提出的复合模型在等权和动态权重的策略下表现均好于其余模型. 已有的关于行业轮动的文章, 大多聚焦于宏观数据对行业轮动的指导作用, 如经济周期、货币周期等(Conover et al., 2008; Chong and Phillips, 2015), 这些研究能够解释周期性因素对行业投资的影响, 但是由于宏观经济数据获得的滞后性(如本月的CPI和M2数据发布时间为次月), 其应用于实际策略执行的有效性有待商榷. 而本文提出的行业轮动策略只依赖于预测结果, 不但获得较好的表现, 且具有较高的实际操作性.
本文的剩余章节安排如下: 第二章介绍本研究所使用的模型和方法, 随后对研究流程进行了详细的介绍; 第三章进行实证分析, 对八个重要的申万一级行业进行预测, 并与基准模型进行比较; 第四章介绍提出的行业轮动策略, 并进行策略表现分析; 第五章进行总结, 并对未来研究进行展望.

2 模型与研究框架介绍

2.1 变分模态分解

Dragomiretskiy and Zosso (2014)提出的变分模态分解(VMD) 是一种信号处理方法, 能自适应、非递归地将原始输入信号分解为一组准正交离散有限带宽的子序列, 具有可以预先确定分解的子序列个数的优点. VMD具有坚实的数学理论基础, 不仅将特征搜索过程公式化为识别最优风险因素的优化问题, 而且有效地解决了端点效应和模态混叠问题.
VMD算法包括以下几个步骤. 首先, 希尔伯特变换被应用于原始数据, 产生单侧频谱; 其次, 利用指数调谐将每个模态函数的频谱移动到相应基带; 最后, 利用高斯平滑来估计已解调信号的带宽, 将问题转化为求解带约束的的变分问题.
VMD通过最小化每个模态的带宽将原始信号f(t)分解为多个模态{uk}, 可以用以下形式表示:
min{uk},{wk}{k=1Kt[(δ(t)+jπt)uk(t)]ejwkt22}, s.t. k=1Kuk=f(t),
(1)
其中uk表示子序列模态, wk表示它们各自的中心频率, K为模态个数, f(t)是原始输入信号, δ(t)表示Dirac分布, 是卷积算子.
VMD采用二次惩罚因子和拉格朗日乘子将约束优化问题转化为无约束形式. 增广拉格朗日函数定义如下:
({μk},{ωk},λ)=αk=1Kt[(δ(t)+jπt)μk(t)]ejωkt22+f(t)k=1Kμk(t)22+λ(t),f(t)kμk(t),
(2)
其中α表示二次惩罚因子, λ表示拉格朗日乘子.
μkn+1,ωkn+1,λn+1的更新过程如下:
μ^kn+1(ω)=f^(ω)ikμ^i(ω)+λ^(ω)21+2α(ωωk)2,ω^kn+1=0ω|μ^k(ω)|2dω0|μ^k(ω)|2dω,λ^n+1(ω)=λ^n+τ(f^(ω)kμ^kn+1),
(3)
其中n代表迭代次数, f^(ω), μ^i(ω), λ^(ω)μ^kn+1(ω)分别为f(t), μi(t), λ(t)μkn+1(t)的傅里叶变换, τ为噪声边际.
重复上述迭代, 直到满足如下停止条件:
kμ^kn+1μ^kn2μ^kn2<ϵ,
(4)
其中ϵ>0, 代表收敛精度. 满足停止条件后, 我们便得到了将原始序列分解后的K个IMF.

2.2 重构方法

目前学术界常用的重构方法分为两类, 一类是Fine to Coarse方法, 其以均值作为IMF的分类方法, 另一类是熵, 以复杂度作为IMF的分类方法. 目前已有多种熵方法被提出和完善以用于分析数据特征. 在金融时间序列的分解集成预测领域, 样本熵、多尺度排列熵、模糊熵均被作为重构方法对分解后的子序列进行重构(Niu et al., 2022; Sun et al., 2022; Yang et al., 2022; 陈凯杰等, 2022), 但我们还未观察到复合多尺度熵在本方向的应用. 另外, 已有文献大多使用一种重构方法来对子序列进行重构, 但是不同的方法重构的结果一般不同, 而已有文献缺乏对利用不同重构方法进行预测的结果比较. 因此, 本文分别利用Fine to Coarse方法及以上4种熵方法来对股指数据分解后的子序列进行重构, 并对预测结果进行对比.

2.2.1 Fine to Coarse

Fine to Coarse (FTC) 方法由Zhang et al. (2008)提出, 基本思想为如下: 对IMF的均值进行t检验, 根据IMF的均值是否显著不为0将子序列分为两类, 均值不为0的子序列合并为低频项, 均值为0的子序列合并为高频项, 另外, Residual单独作为趋势项. 基于t检验的Fine to coarse (FTC) 重构过程可以探索不同分量的内部因素, 减少分量的数量, 从而降低计算复杂度(Zhang et al., 2008). 在本文中, 趋势项、低频项、高频项分别代表本文提出的长期趋势项、中期影响项和短期扰动项.

2.2.2 样本熵

样本熵由Richman and Moorman (2000)提出, 被广泛用于数据复杂度测量, 具有不依赖于数据长度的优点. 一般地, 对于由N个数据组成的时间序列{x(n)} =x(1),x(2),,x(N), 样本熵的计算方法如下:
1) 按序号组成一组维数为m的向量序列, Xm(1), ,Xm(Nm+1), 其中Xm(i)=[x(i),x(i+1),,x(i+m1)], 1iNm+1. 这些向量代表从第i点开始的m个连续的x的值.
2) 定义向量Xm(i)Xm(j)之间的距离d[Xm(i),Xn(j)]为两者对应元素中最大差值的绝对值. 即:
d[Xm(i),Xm(j)]=maxk=0,,m1(|x(i+k)x(j+k)|).
(5)
3) 预先给定相似容限r, 对每个Xm(i), 统计Xn(i)Xm(j)之间距离不超过rj (1jNm,ji)的数目, 并记作Bi. 对于1iNm, 定义:
Bim(r)=1Nm1Bi,
(6)
B(m)(r)=1Nmi=1NmBim(r).
(7)
4) 同理, 计算Xm+1(i)Xm+1(j) (1jNm,ji)距离小于等于r的个数, 记为Ai. 定义:
Aim(r)=1Nm1Ai,
(8)
Am(r)=1Nmi=1NmAim(r).
(9)
这样, Bm(r)是两个序列在相似容限r下匹配m个点的概率, 而Am(r)是两个字列匹配m+1个点的概率. 样本熵定义为:
SE(m,r)=ln[Am(r)Bm(r)].
(10)

2.2.3 模糊熵

模糊熵(FE) 是基于样本熵的改进, 由Chen et al. (2007)提出. 样本熵两个向量的相似性是基于单位阶跃函数而定义的, 即以两个向量间的距离与相似容限的比较为标准, 要么距离大于相似容限(不属于一类), 要么距离不大于相似容限(属于一类). 而在现实世界中, 各个类之间的边缘往往较模糊, 很难确定输入样本是否完全属于其中一类. 因此, 模糊熵在样本熵的基础上, 引入了模糊隶属度来度量向量间相似性. 相比样本熵, 模糊熵具有更好的连续性和稳定性.
一般地, 对于由N个数据组成的时间序列{x(n)}=x(1),x(2),,x(N), 设定嵌入维度为m, 模糊熵的计算方法如下:
1) 构造嵌入向量, 得到时间序列Xm为: Xim=[x(i),x(i+1),,x(i+m1)]xmi¯,1iNm+1. xmi¯表示Xim的均值, 即xmi¯=1mk=0m1x(i+k).
2) 定义向量XimXjm的距离dijm为:
dijm=D(Xim,Xjm)=maxk=0,,m1|(x(i+k)xmi¯)(x(j+k)xmj¯)|.
(11)
3) 引入参数为nr的模糊隶属函数, 度量Xim,Xjm的相似度. 对于1jNm,ji, 有:
Dijm,n,r=e(dijm)nr.
(12)
4) 定义ϕm,r,n为:
ϕm,r,n=1Nm+1i=1Nm+1[1Nmj=1,jiNm+1Dijm,n,r].
(13)
.
5) 同样的, 构造时间序列Xm+1, 计算ϕm+1,r,n:
ϕm+1,r,n=1Nmi=1Nm+1[1Nm1j=1,jiNmDijm+1,n,r].
(14)
6) 计算模糊熵:
FE(m,r,n)=lnϕm,r,nlnϕm+1,r,n.
(15)

2.2.4 多尺度排列熵

Bandt and Pompe (2002)提出的排列熵(PE)是一种描述序列复杂程度的统计量, 它可以反映出序列的不规则性、不对称性和非线性特征, 但缺点是只能反映单一尺度下信号的突变信息. 在此基础上, Aziz and Arif (2005)提出多尺度排列熵(MSPE)算法, 其将时间序列分解成多个时域尺度, 计算每个尺度下的排列熵值, 并将它们结合起来获得整个时间序列的复杂性特征.
对于由N个数据组成的时间序列{x(n)}=x(1), x(2),,x(N), 多尺度排列熵的计算方法如下:
1) 将序列进行粗粒化处理:
yi(s)=1si=(j1)s+1jsx(i),      j=1,2,[N/s],
(16)
其中, s为尺度因子; [N/s]N/s取整.
2) 对yi(s)进行时间重构, 得到:
Yl(s)={yl(s),yl+τ(s),,yl+(m1)τ(s)},
(17)
其中, m为嵌入维数; τ为延迟时间; l为重构分量, l=1,2,,N(m1)τ.
3) 对Yl(s)中的元素进行升序排列, 并取元素位置的列索引组成的一组位置序列为
S(r)=(l1,l2,,lm),
其中, r=1,2,,R, 且Rm!. 位置序列存在m!种可能性, 计算每一种位置序列在Y中出现的可能性{P1,P2,,PR}.
4) 时间序列信号的排列熵公式为:
Hp(m)=i=1RPrln(Pr).
(18)
Pr=1m!时, Hp(m)为其最大值ln(m!).
5) 对多尺度排列熵作归一化处理:
Hp(m)=Hp(m)ln(m!),
(19)
其中Hp(m)为归一化处理后的排列熵值, 其越小, 说明时间序列数据复杂度越低.
6) 计算每个粗粒序列的排列熵, 得到与多个尺度因子对应的排列熵的过程即称为多尺度排列熵分析.

2.2.5 复合多尺度熵

传统的多尺度熵(multi-scale entropy, MSE) 是基于样本熵的改进, 其将原始数据进行粗粒化并将各个尺度上的样本熵值组成一组数列, 如果一个时间序列在每个尺度下的熵值都高于另一个时间序列, 就说明前者的复杂度要高于后者. 多尺度熵用于描述一个时间序列在各个不同的时间尺度中的复杂程度, 其缺点是随着尺度因子的增大, 熵估计的可靠性会降低. 基于此, Wu et al. (2014)提出复合MSE (composite MSE, CMSE) 算法. 在对原始序列以尺度因子为进行粗粒化时, 与传统多尺度熵只生成一个粗粒化序列不同, 复合多尺度熵算法可以生成τ个粗粒化后的序列, 这些粗粒度序列样本熵的平均值即为复合多尺度熵.
对于由N个数据组成的时间序列{x(n)}=x(1),x(2),,x(N), 复合多尺度熵的计算方法如下:
1) 以尺度因子τ对原始序列进行粗粒化, 第k个粗粒化序列中的元素如下所示:
y(k,j)(τ)=1τi=(j1)τ+kjτ+k1x(i),    (1jN/τ,1kτ).
(20)
2) 对尺度因子τ, 计算每个序列y(k)(τ),k=1,2,,τ的样本熵SE(k), 则该尺度因子下的复合多尺度熵为:
CMSE(X,τ,m,r)=k=1τSE(k)τ.
(21)
3) 对每个尺度因子均计算出该尺度因子下的复合多尺度熵, 并进行比较, 这个过程称为复合多尺度熵分析.

2.3 分解-重构-集成预测框架

通过对分解后的子序列进行熵分析并进行重构, 我们得到三条重构后的时间序列数据, 分别代表原始数据的长期趋势项、中期影响项和短期扰动项. 根据其数据特征, 我们分别采用ARIMA、BPNN和LSTM模型来预测, 其具体构建方法请参见Dai and MacBeth (1997), Fischer and Krauss (2018).
图 1是本文所提出的分解-重构-集成预测框架的流程图, 主要包含五个步骤:
图1 基于分解-重构-集成框架股指预测及交易模拟

Full size|PPT slide

1) 数据收集. 自WIND数据库收集八大行业的股指数据, 作为本研究的数据源.
2) 数据分解. 利用VMD算法对原始的股指数据进行分解, 得到n个IMF成分和1个残差成分;
3) 成分重构. 利用复合多尺度熵衡量各个子序列复杂度, 并对子序列进行重构, 得到三条重构后的序列, 分别代表原始数据的长期趋势项、中期影响项和短期扰动项;
4) 序列预测. 对以上重构后的长期、中期、短期序列, 我们分别采用ARIMA、BPNN和LSTM模型来预测, 得到每条序列的预测结果; 然后, 对长期、中期、短期序列的预测结果进行加总, 得到最终预测结果;
5) 交易模拟. 我们根据对未来的股指预测结果, 执行本文提出的交易策略. 同时, 利用多种指标来衡量所提的行业轮动策略.

3 实证分析

3.1 数据描述

本文以31个申万一级行业为基础, 选取在2023年10月31日总市值排名前八的重要行业进行预测, 这些行业分别是: 基础化工、电力设备、机械设备、汽车、食品饮料、医药生物、电子、计算机. 数据集为2010年1月4日至2023年10月31日共3358个交易日的八大行业的收盘价数据, 其中训练集为2010年1月4日至2019年10月31日共2388个交易日的数据, 测试集为2019年11月1日至2023年10月31日共970个交易日的数据, 数据均来自于Wind数据库. 我们采用滚动向前一步的预测策略, 首先以2010年1月4日至2019年10月31日的数据作为训练集预测2019年11月1日的股指收盘价, 之后依次加入数据进行下一次预测.

3.2 评价准则

我们采用两类误差指标对模型预测结果进行评估. 第一类是水平精度评价指标, 包括均方根误差(RMSE)和平均绝对百分比误差(MAPE), 定义如下:
RMSE=t=1n(XtX^t)2n,
(22)
MAPE=1nt=1n|XtX^tXt|100%.
(23)
考虑到方向预测对于金融市场参与者的重要性, 我们采用方向预测精度评价指标作为第二类评判准则, 包括方向精度(DA)和F1score. 方向精度即为预测股指的涨跌与真实的涨跌一致的比例, 其定义如下:
DA=t=1nat/n,
(24)
其中
at={1,(XtXt1)(X^tXt1)>0,0,otherwise.
F1score是基于如图 2所示的混淆矩阵计算的. 首先, 我们计算出预测结果的准确率(P)与召回率(R), 其中P=TPTP+FP, 代表预测为涨的样本中实际也为涨的样本所占的比例, R=TPTP+FN, 代表实际为涨的样本中预测正确的比例. F1score为准确率与召回率的调和平均, 可以对二者进行综合评价, 其定义如下:
F1score=21P+1R.
(25)
图2 混淆矩阵

Full size|PPT slide

3.3 对比模型选择

为了验证基于分解-重构-集成框架的复合模型相对于单一模型的优越性, 我们首先选择ARIMA、BPNN、LSTM三个单一模型进行比较. 为了更好地发挥机器学习模型在处理高维数据方面的优势, 我们将股指数据的开盘价、收盘价、最高价、最低价、成交量和成交额6个变量作为用于对比的BPNN和LSTM模型的输入, 进行收盘价预测, 并与本文提出的模型进行比较. 另外, 为了检验复合多尺度熵相对于其余重构方法在股指预测方面的优越性, 我们在本文的框架基础上, 将以FTC、样本熵、模糊熵、多尺度排列熵为重构方法的模型作为比较模型, 即将VMD-FTC-ARIMA-BPNN-LSTM, VMD-SE-ARIMA-BPNN-LSTM, VMD-FE-ARIMA-BPNN-LSTM, VMD-MSPE-ARIMA-BPNN-LSTM也作为我们的对比模型. 在下文中, 我们将其简写为VMD-FTC, VMD-SE, VMD-FE, VMD-MSPE, 将本文提出的VMD-CMSE-ARIMA-BPNN-LSTM模型简写为VMD-CMSE. 同时, 我们也采用EMD分解方法作为对比, 以探讨分解方法对预测结果的影响, 即将EMD-FTC, EMD-SE, EMD-FE, EMD-MSPE, EMD-CMSE也作为对比模型. 表 1为具体参数设置情况.
表1 参数设置
模型/算法 设置
ARIMA R语言, “forecast'' 包中的auto.arima()函数
BPNN hidden layer sizes=(16, 4), activation=relu, solver=adam, alpha=0.01, batch size=1, epochs=100
LSTM LSTM units=16, optimizer=adam, loss=mean squared error, learning rate=0.001, batch size=1, epochs=100
VMD alpha = 1000, τ = 0, K = 10, DC = 0, init = 1, tol = 1×107

3.4 数据分解与重构

由于我们选取的八大行业指数的相关性较强, 呈现出相同的模式, 在下文以基础化工行业为例, 展示分解与重构结果. 由于EMD分解后的子序列个数为9, 我们将VMD分解后的总序列条数也设置为9, 子序列从低频到高频依次是Residual, IMF1, IMF2, , IMF8. 图 3图 4是基础化工行业EMD和VMD分解结果, 子序列按从低频到高频的顺序排列.
图3 基础化工行业指数EMD分解结果

Full size|PPT slide

图4 基础化工行业指数VMD分解结果

Full size|PPT slide

我们分别对9条子序列进行FTC重构, 并计算样本熵、模糊熵、多尺度排列熵、和复合多尺度熵. 其中对于样本熵和模糊熵, 参考陈凯杰等(2022)设置嵌入维数为2, 对于多尺度排列熵和复合多尺度熵, 参考李瑞和范玉刚(2023)设置嵌入维数为3, 另外设置尺度因子为3, 多尺度排列熵中的延时因子为1. 结合每条子序列熵值及不同尺度下的熵值变化情况, 确定了EMD和VMD分解后子序列的分类结果, 参见表 2. FTC及四种熵重构后的长期趋势项、中期影响项、短期扰动项见图 5图 6.
表2 重构结果
EMD FTC 样本熵 模糊熵 多尺度排列熵 复合多尺度熵
长期趋势项 Residual Residual, IMF1IMF3 Residual, IMF1IMF4 Residual, IMF1IMF4 Residual, IMF1IMF5
中期影响项 IMF1IMF3 IMF4IMF6 IMF5IMF6 IMF5IMF7 IMF6IMF7
短期扰动项 IMF4IMF8 IMF7IMF8 IMF7IMF8 IMF8 IMF8
VMD FTC 样本熵 模糊熵 多尺度排列熵 复合多尺度熵
长期趋势项 Residual Residual, IMF1IMF2 Residual, IMF1IMF2 Residual, IMF1IMF4 Residual, IMF1IMF3
中期影响项 None IMF3IMF4 IMF3IMF5 IMF5 IMF4IMF5
短期扰动项 IMF1IMF8 IMF5IMF8 IMF6IMF8 IMF6IMF8 IMF6IMF8
图5 EMD重构结果

Full size|PPT slide

图6 VMD重构结果

Full size|PPT slide

表 2中可以看到, 由于VMD分解后的子序列(IMF1IMF8) 的平均值均在0附近, 所以在使用FTC方法进行重构时, t检验无法拒绝序列均值为0的原假设, IMF1IMF8均被归类为短期扰动项, 而EMD分解后的IMF无此性质, 使用FTC方法的分类结果为IMF1IMF3为中期影响项, IMF4IMF8为短期扰动项. 熵重构方法与FTC重构方法在长期趋势项的分类上差别较大, 一些低频的子序列在熵重构方法下也被归类到长期趋势项中, 这是因为分解后的Residual项与低频IMF的复杂度较为相似. 四种熵分类结果的区别主要在于处在中间频率的IMF的分类.
图 5图 6中我们可以发现, FTC重构后的短期扰动项仍然较大, 处于1000到1500的点位之间, 而原序列(基础化工行业指数) 最高点为5771, 因此短期扰动项占原始序列的比例在某些时间超过了25%. 基于熵重构后的短期扰动项尺度较小, 其中EMD分解后使用四种熵方法进行重构后的短期扰动项在500到500之间, VMD分解后使用四种熵方法进行重构后的短期扰动项在250到200之间. 相较于EMD, VMD分解重构后的短期扰动项在数据尺度上表现较好.

3.5 预测比较

我们将上述方法分别应用于选取的八个重要申万一级行业指数, 表 3为各个模型对八个行业指数的预测误差, 表 4为VMD-CMSE模型与其余模型在各个行业指数上预测的DM检验结果, 表 5为以LSTM模型为基准, 各复合模型对其预测误差的优化比率, 表 6为使用VMD进行分解的预测模型相较于使用EMD进行分解的预测模型的平均优化百分比.
表3 预测误差比较
基础化工 RMSE MAPE DA F1score 电力设备 RMSE MAPE DA F1score
ARIMA 75.6395 0.0138 0.4953 0.3558 ARIMA 223.2676 0.0183 0.4933 0.3356
BPNN 60.8449 0.0115 0.5180 0.5580 BPNN 187.5506 0.0157 0.4881 0.5616
LSTM 61.2032 0.0114 0.5190 0.6361 LSTM 194.1033 0.0160 0.4912 0.5316
EMD-FTC 49.2360 0.0093 0.6474 0.6640 EMD-FTC 133.8422 0.0118 0.6484 0.6538
EMD-SE 48.1886 0.0100 0.6556 0.6692 EMD-SE 137.5171 0.0120 0.6556 0.6584
EMD-FE 46.8049 0.0102 0.7072 0.7277 EMD-FE 134.7100 0.0115 0.6608 0.6639
EMD-MSPE 45.8271 0.0087 0.7164 0.7363 EMD-MSPE 129.1808 0.0109 0.6845 0.6927
EMD-CMSE 43.8558 0.0091 0.7000 0.7166 EMD-CMSE 130.9736 0.0112 0.6783 0.6835
VMD-FTC 48.5146 0.0104 0.6752 0.6853 VMD-FTC 132.4198 0.0129 0.6711 0.6734
VMD-SE 44.7810 0.0091 0.6786 0.6929 VMD-SE 132.0359 0.0123 0.6622 0.6686
VMD-FE 42.9091 0.0086 0.7116 0.7222 VMD-FE 127.8720 0.0119 0.6714 0.6800
VMD-MSPE 41.0506 0.0082 0.7322 0.7435 VMD-MSPE 125.7633 0.0116 0.6694 0.6741
VMD-CMSE 40.8689 0.0077 0.7229 0.7385 VMD-CMSE 120.9940 0.0100 0.6910 0.7047
机械设备 RMSE MAPE DA F1score 汽车 RMSE MAPE DA F1score
ARIMA 24.9460 0.0128 0.4902 0.3261 ARIMA 116.6076 0.0158 0.5231 0.3441
BPNN 20.3051 0.0105 0.5097 0.4994 BPNN 93.3247 0.0129 0.5272 0.5719
LSTM 20.4840 0.0105 0.4902 0.6962 LSTM 93.1862 0.0129 0.5231 0.6358
EMD-FTC 16.7632 0.0089 0.6762 0.6945 EMD-FTC 68.6535 0.0097 0.6659 0.6713
EMD-SE 17.7022 0.0094 0.6804 0.7007 EMD-SE 72.3501 0.0103 0.6474 0.6510
EMD-FE 16.9772 0.0093 0.6865 0.7013 EMD-FE 73.6916 0.0107 0.6432 0.6484
EMD-MSPE 16.0392 0.0083 0.6567 0.6794 EMD-MSPE 70.4071 0.0102 0.6525 0.6550
EMD-CMSE 15.0742 0.0078 0.6793 0.6995 EMD-CMSE 66.6971 0.0096 0.6639 0.6733
VMD-FTC 19.1389 0.0110 0.6752 0.6878 VMD-FTC 82.6860 0.01248 0.6731 0.6807
VMD-SE 17.1356 0.0094 0.6313 0.6404 VMD-SE 72.1996 0.0109 0.6416 0.6506
VMD-FE 15.8812 0.0087 0.6477 0.6660 VMD-FE 68.4636 0.0102 0.6601 0.6646
VMD-MSPE 15.9036 0.0086 0.6481 0.6481 VMD-MSPE 68.5173 0.0102 0.6549 0.6633
VMD-CMSE 13.6513 0.0071 0.6333 0.6563 VMD-CMSE 64.7736 0.0091 0.6889 0.6986
食品饮料 RMSE MAPE DA F1score 医药生物 RMSE MAPE DA F1score
ARIMA 520.8553 0.0163 0.4974 0.3761 ARIMA 206.9296 0.0147 0.4850 0.3242
BPNN 425.4355 0.0137 0.5221 0.4940 BPNN 170.8959 0.0125 0.4881 0.4529
LSTM 419.0281 0.0137 0.5066 0.5188 LSTM 181.4243 0.0130 0.5087 0.4633
EMD-FTC 352.2843 0.0118 0.6062 0.6133 EMD-FTC 151.9797 0.0121 0.6814 0.6894
EMD-SE 363.9338 0.0125 0.6021 0.6045 EMD-SE 154.8763 0.0123 0.6659 0.6760
EMD-FE 360.5713 0.0124 0.6237 0.6309 EMD-FE 157.1087 0.0125 0.6484 0.6552
EMD-MSPE 354.0642 0.0122 0.6247 0.6262 EMD-MSPE 151.6850 0.0120 0.6515 0.6536
EMD-CMSE 350.3146 0.0120 0.6329 0.6322 EMD-CMSE 147.9094 0.0118 0.6855 0.6897
VMD-FTC 375.0199 0.01341 0.6597 0.6639 VMD-FTC 150.0258 0.0122 0.6742 0.6755
VMD-SE 359.6157 0.0128 0.6591 0.6577 VMD-SE 148.1139 0.0121 0.6722 0.6774
VMD-FE 363.7681 0.0130 0.6323 0.6330 VMD-FE 145.4940 0.0119 0.6711 0.6735
VMD-MSPE 354.5632 0.0124 0.6488 0.6552 VMD-MSPE 138.0762 0.0113 0.6721 0.6794
VMD-CMSE 332.5511 0.0118 0.6601 0.6597 VMD-CMSE 132.9015 0.0104 0.6907 0.6963
电子 RMSE MAPE DA F1score 计算机 RMSE MAPE DA F1score
ARIMA 96.4673 0.0171 0.5200 0.3575 ARIMA 108.8869 0.0166 0.4819 0.3451
BPNN 80.7064 0.0143 0.5221 0.6558 BPNN 92.9928 0.0141 0.5046 0.4853
LSTM 78.4350 0.0139 0.5118 0.5784 LSTM 90.5214 0.0138 0.4974 0.5387
EMD-FTC 73.6436 0.0142 0.6443 0.6511 EMD-FTC 68.8637 0.0114 0.6453 0.6446
EMD-SE 75.9693 0.0147 0.6319 0.6390 EMD-SE 74.3434 0.0124 0.6268 0.6306
EMD-FE 74.2275 0.0142 0.6329 0.6418 EMD-FE 72.9007 0.0123 0.6422 0.6404
EMD-MSPE 72.5315 0.0139 0.6288 0.6341 EMD-MSPE 74.3527 0.0122 0.6360 0.6342
EMD-CMSE 70.2439 0.0135 0.6360 0.6445 EMD-CMSE 68.1861 0.0112 0.6494 0.6551
VMD-FTC 76.1730 0.0148 0.6391 0.6492 VMD-FTC 74.5698 0.0127 0.6453 0.6504
VMD-SE 75.3931 0.0145 0.6567 0.6659 VMD-SE 73.3949 0.0120 0.6148 0.6160
VMD-FE 72.4956 0.0140 0.6505 0.6579 VMD-FE 72.9063 0.0119 0.6251 0.6216
VMD-MSPE 68.7628 0.0133 0.6649 0.6713 VMD-MSPE 72.8293 0.0119 0.6302 0.6279
VMD-CMSE 66.2225 0.0127 0.6927 0.7025 VMD-CMSE 64.4893 0.0100 0.6498 0.6509
表4 DM检验结果(以VMD-CMSE为基准模型)
基础化工 电力设备 机械设备 汽车 食品饮料 医药生物 电子 计算机
ARIMA 9.59*** 11.50*** 11.60*** 11.22*** 7.98*** 8.55*** 8.00*** 9.51***
BPNN 8.52*** 9.55*** 8.34*** 8.41*** 5.84*** 6.35*** 4.92*** 7.21***
LSTM 8.06*** 9.97*** 8.24*** 8.50*** 5.48*** 7.40*** 4.26*** 7.10***
EMD-FTC 4.65*** 2.75**** 5.49*** 1.48 1.60 4.48*** 7.73*** 1.84*
EMD-SE 5.00*** 3.48*** 6.46*** 2.89*** 2.56** 5.02*** 8.23*** 3.92***
EMD-FE 3.57*** 2.89*** 6.00*** 3.77*** 2.20** 5.42*** 3.66*** 3.41***
EMD-MSPE 3.25*** 1.77* 4.01*** 2.45** 1.70* 4.11*** 2.95*** 3.99***
EMD-CMSE 2.08** 2.48** 2.50** 0.83 1.42 3.32*** 1.97** 1.59
VMD-FTC 5.05*** 2.55** 10.18*** 7.42*** 3.74*** 3.80*** 4.57*** 4.14***
VMD-SE 3.24*** 3.25*** 7.66*** 4.03*** 4.23*** 3.41*** 3.95*** 4.60***
VMD-FE 1.66* 2.06** 5.47*** 2.04** 4.35*** 2.84*** 2.97*** 4.45***
VMD-MSPE 0.15 1.41 5.27*** 1.90* 3.11*** 1.21 1.22 3.97***
注: * 代表结果在0.1的显著性水平下显著; ** 代表结果在0.05的显著性水平下显著; *** 代表结果在0.01的显著性水平下显著.
表5 复合模型相较于LSTM模型的平均优化百分比
RMSE MAPE DA F1score
EMD-FTC 24.44 18.32 28.87 14.88
EMD-SE 20.54 12.80 27.63 13.73
EMD-FE 21.56 13.40 32.60 15.47
EMD-MSPE 24.60 19.21 29.78 15.52
EMD-CMSE 27.51 22.45 31.63 17.32
VMD-FTC 18.82 5.80 31.26 16.71
VMD-SE 23.40 13.01 28.89 14.60
VMD-FE 25.14 16.71 30.20 15.67
VMD-MSPE 28.58 20.22 31.12 16.63
VMD-CMSE 36.11 33.60 34.15 19.78
表6 使用同一重构方法时VMD分解相较于EMD分解预测的平均优化百分比
RMSE MAPE DA F1score
FTC 4.52 10.58 1.82 1.57
SE 2.37 0.19 0.98 0.76
FE 2.95 2.92 1.84 0.17
MSPE 3.19 0.85 1.02 0.95
CMSE 6.75 9.11 1.88 2.05
注: 第一行代表对于八个行业指数的预测, VMD-FTC模型相较于EMD-FTC模型的预测结果在RMSE,MAPE,DA,F1 score上的优化百分比分别为4.52%、10.58%、1.82%和1.57%, 其余同理.
表 3表 3表 5中我们可以得到如下结论:
首先, 本文提出的VMD-CMSE-ARIMA-BPNN-LSTM模型在所有指数的水平预测上获得最低的误差, 在大部分指数的方向预测上取得最高的精度, 且当以VMD-CMSE模型为目标模型进行DM检验时, 几乎所有对比模型在全部八个行业上的p-value均小于0.01, 这证明了本文提出的VMD-CMSE模型相比于其余模型具有统计上显著的优越性. 根据表 5, 平均而言, VMD-CMSE模型在RMSE, MAPE, DA, F1score四个比较指标上的表现均为最好, 相对于LSTM模型的优化比率分别为36.11%、33.60%、34.15%和19.78%. 较好的预测结果得益于以下因素: 第一, 通过将具有不同特征的序列采用不同的模型预测, 复合模型能更好地利用单一模型的优势. 第二, VMD克服了EMD中存在的模态混叠和端点效应问题, 更加适用于复杂度高的时间序列数据. 第三, 相较于其余重构方法, 复合多尺度熵能够在不同时间尺度上对信号进行分析, 从而捕获信号在不同时间尺度上的动态特征, 提供比单一尺度熵更丰富的信息, 这有助于更全面地理解信号的复杂性和动态性. 同时, 复合多尺度熵通过移动平均过程在高尺度下生成了多个时间序列, 通过综合考虑多条时间序列的复杂度, 提高了其对噪音和干扰的稳定性. 另外, 根据Rapach et al. (2010)的研究, 通过使用能减少与依赖单一模型相关的不确定性的预测组合方法, 可以得到更有效的预测, 而本文提出的模型通过数据的分解与利用复合多尺度熵进行重构也在一定程度上降低了单一模型导致的偏差, 同时深入挖掘了数据中包含的丰富信息, 因此获得了更高的预测精度.
其次, 对所有的八个行业指数, 复合模型在水平预测和方向预测精度上均好于单一模型, 这说明了分解-重构-集成框架在股指预测中的有效性. 通过分解与重构, 我们能够将非线性、非平稳、高复杂度的股指数据转化为具有明显特征的长期趋势项、中期影响项和短期扰动项, 并根据其数据特征分别选择合适的预测模型, 得到较好的预测结果. 根据表 6, 在使用同样的重构方法和预测方法时, 利用VMD进行分解能获得比利用EMD进行分解更好的预测结果(在利用FTC重构时例外). 这说明相较于EMD, VMD是更有效的对于股指数据的处理方法.
另外, 在单一模型的比较中, 我们发现ARIMA、BPNN和LSTM模型的预测精度依次提升, 这主要是由于股指数据具有高波动和高复杂度特征, 传统的ARIMA模型很难捕捉其运动特征, 而机器学习模型能较好地学习其呈现的非线性模式.
最后, 在复合模型的比较中, 我们发现以样本熵、模糊熵、多尺度排列熵、复合多尺度熵作为重构指标的模型的预测精度依次提升, 其中基于复合多尺度熵重构的模型表现最好, 说明复合多尺度熵能够更好地度量序列复杂度. 但是, FTC重构方法在EMD和VMD分解方法上的表现存在差异: 在使用EMD进行分解时, EMD-FTC方法表现较好, 在水平预测精度上好于EMD-SE和EMD-FE, 在方向预测精度上也好于EMD-SE. 但是在使用VMD进行分解时, VMD-FTC在水平预测精度上表现最差. 这是由于VMD分解后的IMFs的平均值均在0附近, 导致使用FTC进行重构时所有IMFs均被分类为短期扰动项, 这对预测精度产生了影响, 因此FTC重构方法并不适用于VMD分解. 这些结果证明了重构方法对于预测结果的重要性, 相较于已有文献多聚焦于分解方法和预测模型, 本文的结论对金融时间序列的分解集成预测领域做了一个有益的补充.

4 行业轮动策略及表现

为了验证我们提出的模型在实际交易中的优越性, 我们在第3章对于八个行业指数预测的基础上, 设计了两个行业轮动策略:
策略一: 等权投资. 我们对各个指数预测的收益率进行排序, 平均持有预测收益率最高的四支行业指数;
策略二: 动态权重投资. 我们对各个指数预测的收益率进行排序, 同样投资于预测收益率最高的四支行业指数, 按预测收益率的绝对值比例进行加权. 如对八支行业在某一天的预测收益率从高到低排列为r1,r2,,r8, 则对收益率排名前四的行业进行投资, 权重为wi=|ri|j=14|rj|,i=1,2,3,4.
两种策略均以日度频率进行调仓, 假设交易成本为0.1%, 无风险收益率为5%. 在第一种策略中, 影响投资结果的主要是预测收益率的排序, 即便不同的模型预测的八种行业的收益率不同, 只要收益率的相对排序相同, 那么最终的投资表现是相同的. 在第二种策略中, 我们对预测收益率较高的行业赋予了更高的权重, 因此策略二的表现不但依赖于预测收益率的排序, 也依赖于预测收益率的值, 能更全面地反映预测效果.
为了更全面地分析模型及交易策略的表现, 我们将策略表现结果与买入持有(buy and hold, BH) 策略作对比. 由于本文预测了八大行业, 我们选取在八大行业中表现最好的电力设备行业作为买入持有策略的底层资产, 并将该策略记为BH*.
图 7图 8分别展示了不同模型执行交易策略一和交易策略二时的收益表现, 同时也包括了BH* 策略的表现. 我们选取三类金融指标作为策略表现评判标准: a) 收益类指标, 包括累计收益和年化收益; b) 风险类指标, 包括下行风险和最大回撤; c) 风险调整后收益, 包括夏普比率和索提诺比率. 其中下行风险是投资组合的收益率在低于0时的标准差, 代表投资组合与损失相关的波动性. 夏普比率衡量投资组合每单位总风险所产生的超额收益, 索提诺比率衡量投资组合每单位下行风险所产生的超额收益. 表 7为不同模型执行策略一和策略二后在各个指标上的表现对比. 从中我们可得到如下结论:
图7 收益比较——策略一

Full size|PPT slide

图8 收益比较——策略二

Full size|PPT slide

表7 不同模型及策略的交易表现
策略一 累计收益(%) 年化收益(%) 下行风险(%) 最大回撤(%) 夏普比率 索提诺比率
EMD-FTC 383.16 50.56 0.1451 24.62 1.74 2.73
EMD-SE 266.12 40.09 0.1476 28.21 1.42 2.20
EMD-FE 343.97 47.29 0.1462 24.10 1.64 2.57
EMD-MSPE 450.58 55.76 0.1448 22.23 1.89 2.97
EMD-CMSE 507.21 59.77 0.1452 20.40 1.99 3.14
VMD-FTC 436.99 54.75 0.1511 24.45 1.82 2.82
VMD-SE 367.59 49.28 0.1518 24.88 1.66 2.57
VMD-FE 439.41 54.93 0.1512 24.00 1.83 2.83
VMD-MSPE 373.03 49.73 0.1509 24.22 1.68 2.60
VMD-CMSE 633.93 67.83 0.1465 24.88 2.19 3.45
BH* 81.37 16.73 0.2153 49.45 0.49 0.79
策略二 累计收益(%) 年化收益(%) 下行风险 最大回撤(%) 夏普比率 索提诺比率
EMD-FTC 360.74 48.72 0.1589 28.62 1.58 2.45
EMD-SE 289.06 42.33 0.1602 28.49 1.40 2.15
EMD-FE 386.02 50.79 0.1555 22.07 1.65 2.58
EMD-MSPE 662.13 69.49 0.1544 19.87 2.12 3.36
EMD-CMSE 777.17 75.79 0.1547 20.25 2.25 3.59
VMD-FTC 722.38 72.87 0.1617 26.43 2.17 3.34
VMD-SE 549.98 62.62 0.1607 26.32 1.93 2.98
VMD-FE 567.94 63.78 0.1581 27.01 1.96 3.07
VMD-MSPE 499.14 59.22 0.1593 27.70 1.86 2.87
VMD-CMSE 865.97 80.25 0.1547 26.80 2.35 3.75
BH* 81.37 16.73 0.2153 49.45 0.49 0.79
第一, 从策略角度, 由于策略一为等权投资, 较为保守, 而策略二更为激进——我们为预测收益率较高的行业赋予了更高的权重, 因此在根据同一模型预测结果执行两种策略时, 策略二的收益普遍更高(只有EMD-FTC模型一个例外). 相应地, 更为激进也意味着收益率波动较大, 因此在同一模型下, 策略二的下行风险均高于策略一. 最大回撤与下行风险均用于衡量风险, 其表现也与下行风险一致——在10个复合模型中, 有7个复合模型在执行策略二时的最大回撤高于策略一. 同时, 有八个模型在执行策略二时比执行策略一获得更高的夏普比率和索提诺比率. 总体来看, 策略二与策略一相比, 收益更高, 风险也更大, 但风险增加的幅度小于收益增加的幅度, 因此夏普比率和索提诺比率也普遍较高.
第二, 从分解角度, 在使用同样的重构方法和执行相同的策略时, 以VMD作为分解方法的模型普遍比以EMD作为分解方法的模型表现要好——不论是策略一还是策略二, 在5种重构指标中, 有四种重构指标(除MSPE外) 在VMD下获得更高的收益, 取得更高的夏普比率和索提诺比率. 这也验证了VMD相对于EMD在股指数据中的有效性.
第三, 从重构方法角度, 不论是策略一还是策略二, 不论分解方法是EMD还是VMD, 以复合多尺度熵(CMSE) 作为重构方法的预测模型均获得了最高的收益、夏普比率和索提诺比率, 即EMD-CMSE模型在用EMD分解的预测方法中表现最好, VMD-CMSE模型在用VMD分解的预测方法中表现最好. 这一结果验证了复合多尺度熵在分解-重构-集成预测方法中的优越性.
第四, 从收益角度, 不论是执行策略一还是策略二, VMD-CMSE模型均取得了最高的累计收益和年化收益, 这主要得益于该模型的较高的预测精度. EMD-SE模型在执行两种策略时的收益均最低, 但仍在4年的预测期内分别获得了266.12%和289.06%的绝对收益, 这一数值远远高于买入持有策略的收益(八大行业中, 买入持有策略收益最高的为电力设备行业, 收益为81.37%). 另外, 即便不考虑交易费用, 单一模型中表现最好的LSTM模型在两种策略下只能获得72.45%和99.80%的累计收益. 因此, 得益于较高的预测精度, 复合模型在两种策略下的表现均好于单一模型, 也好于买入持有策略. 在复合模型中, 本文提出的VMD-CMSE模型表现优异.
第五, 综合考虑风险和收益, 不论是执行策略一还是策略二, VMD-CMSE模型的夏普比率和索提诺比率均远高于其余模型, 这说明VMD-CMSE模型能够在承担单位风险的基础上取得更高的超额收益. 另, 较高的索提诺比率说明VMD-CMSE模型在下行市场中表现较好.
第六, 将我们提出的模型与策略与买入持有策略进行对比时, 我们发现, 不论是策略一还是策略二, 本文提出的复合模型在风险、收益和风险调整后收益指标上的表现均好于买入持有策略, 这也证明了分解-重构-集成方法及本文提出的策略的有效性.
综合表 5表 7, 我们发现预测精度的提升对策略表现至关重要. 如VMD-VMSE模型在RMSE, MAPE, DA, F1score四个比较指标上的表现比VMD-FTC模型分别提升14.55%, 26.27%, 2.20%, 2.63%, 而总收益在两种策略下分别多了197%和143%. 因此, 提升预测精度对投资者具有重要意义.

5 结论

本文将复合多尺度熵作为重构指标引入分解集成领域, 提出了一个新颖的应用于股指预测的分解-重构-集成框架. 我们根据重构后序列的特征选择合适的预测模型, 集成后得到最终的预测, 并基于预测结果提出了一种行业轮动策略. 对选取的八个重要申万一级行业指数的实证表明, 所提出的VMD-CMSE-ARIMA-BPNN-LSTM模型在预测精度和策略表现上均好于对比模型. 总体来看, 我们可以得到如下结论:
1) 基于分解-重构-集成框架的复合模型在股指预测方面具有优越性, 且VMD分解算法在股指数据上的表现好于EMD分解. VMD算法能够将原始的复杂序列分解为多个子序列, 重构过程可以将具有相似复杂度的序列进行重构, 得到股指序列的长期趋势项、中期影响项和短期扰动项, 进而根据序列特征选择合适的方法预测, 提高预测精度.
2) 基于复合多尺度熵(CMSE) 的重构相较于利用FTC、样本熵、模糊熵和多尺度排列熵的重构能获得更高的精度. 平均而言, VMD-CMSE模型比VMD-FTC、VMD-SE、VMD-FE和VMD-MSPE模型在RMSE上提高14.55%、10.30%、8.77%和5.86%, 在方向精度(DA) 上提高2.20%、4.09%、3.04%和2.32%. 这说明了重构方法对于分解-重构-集成框架的重要性.
3) 本文提出的VMD-CMSE模型不但在预测精度上表现优异, 应用于本文提出的两种行业轮动策略时均获得了最高的收益、夏普比率和索提诺比率. 这得益于三方面的原因: 复合模型能结合单一模型的优点、VMD相对于EMD更适用于复杂度高的数据及复合多尺度熵在重构时的优越性.
本文所提的模型具有较低的水平预测误差和较高的方向预测精度, 不但可以适用于股指预测, 也适用原油、黄金、汇率等金融时间序列数据的预测. 另外, 本文对比了VMD算法与EMD算法, 但是, 相关研究领域还存在着多种具有特性的模态分解算法, 未来也可被纳入研究范畴. 最后, 本文所提的模型能否更广泛地应用于其它国家股票市场, 也值得进一步研究.

References

陈坚, 张轶凡, 中国股票市场的已实现偏度与收益率预测[J]. 金融研究, 2018,(9): 107- 125.
Chen J, Zhang Y F, Realized Skewness of Chinese Stock Market and the Predictability of Stock Return[J]. Journal of Financial Research, 2018,(9): 107- 125.
陈凯杰, 唐振鹏, 吴俊传, 杜晓旭, 蔡毅, 基于分解-集成和混频数据采样的中国股票市场预测研究[J]. 系统工程理论与实践, 2022, 42(11): 3105- 3120.
Chen K J, Tang Z P, Wu J C, Du X X, Cai Y, Forecasting China's Stock Index: A Hybrid Method Based on Decomposition-integrated and Mixed-frequency Data Sampling[J]. Systems Engineering — Theory & Practice, 2022, 42(11): 3105- 3120.
邓可斌, 关子桓, 陈彬, 宏观经济政策与股市系统性风险——宏微观混合β 估测方法的提出与检验[J]. 经济研究, 2018, 53, 68- 83.
Deng K B, Guan Z H, Chen B, Macroeconomic Policies and Systemic Risk in China's Stock Market: An Approach Based on Integrated Hybrid Betas[J]. Economic Research Journal, 2018, 53, 68- 83.
高海翔, 胡瑜, 余乐安, 基于分解集成的LSTM神经网络模型的油价预测[J]. 计算机应用与软件, 2021, 38, 78- 83.
Gao H X, Hu Y, Yu L A, Forecasting WTI Crude Oil Price With an EEMD-Based LSTM Neural Network Ensemble Learning Paradigm[J]. Computer Applications and Software, 2021, 38, 78- 83.
姜富伟, 郭鹏, 郭豫媚, 美联储货币政策对我国资产价格的影响[J]. 金融研究, 2019,(5): 37- 55.
Jiang F W, Guo P, Guo Y M, The Impact of Federal Reserve Monetary Policy on China's Asset Prices[J]. Journal of Financial Research, 2019,(5): 37- 55.
李岸, 粟亚亚, 乔海曙, 中国股票市场国际联动性研究——基于网络分析方法[J]. 数量经济技术经济研究, 2016, 33(8): 113- 127.
Li A, Su Y Y, Qiao H S, Co-movement between Chinese and Global Stock Market: A Network Approach[J]. Journal of Quantitative & Technological Economics, 2016, 33(8): 113- 127.
李瑞, 范玉刚, 基于CEEMDAN多尺度排列熵和SO-RELM的高压隔膜泵单向阀故障诊断[J]. 振动与冲击, 2023, 42(5): 127- 135.
Li R, Fan Y G, Fault Diagnosis of One-way Value of High-pressure Diaphragm Pump Based on CEEMDAN Multiscale Permutation Entropy and SO-RELM[J]. Journal of Vibration and Shock, 2023, 42(5): 127- 135.
梁小珍, 郭战坤, 张倩文, 杨明歌, 汪寿阳, 基于奇异谱分析的航空客运需求分析与分解集成预测模型[J]. 系统工程理论与实践, 2020, 40(7): 1844- 1855.
Liang X Z, Guo Z K, Zhang Q W, Yang M G, Wang S Y, An Analysis and Decomposition Ensemble Prediction Model for Air Passenger Demand Based on Singular Spectrum Analysis[J]. Systems Engineering — Theory & Practice, 2020, 40(7): 1844- 1855.
万建强, 文洲, ARIMA模型与ARCH模型在香港股指预测方面的应用比较[J]. 数理统计与管理, 2001, 20(6): 1- 4.
Wan J Q, Wen Z, The Comparison of ARIMA Model and ARCH Model Application in HongKong Stock Price Index Prediction[J]. Journal of Applied Statistics and Management, 2001, 20(6): 1- 4.
闻岳春, 王婧婷, 基于FA-BPNN的金融控股公司风险预警系统研究——以美国和台湾地区为例[J]. 国际金融研究, 2010,(11): 37- 46.
Wen Y C, Wang J T, Study on the Risk Warning System of Financial Holding Companies Based on Factor Analysis and BP Neural Network: The USA and Taiwan Cases[J]. Studies of International Finance, 2010,(11): 37- 46.
许年行, 于上尧, 伊志宏, 机构投资者羊群行为与股价崩盘风险[J]. 管理世界, 2013, 7(3): 31- 43.
Xu N X, Yu S Y, Yi Z H, Institutional Investors' Herding Behavior and Stock Price Crash Risk[J]. Journal of Management World, 2013, 7(3): 31- 43.
杨丽, 吴雨茜, 王俊丽, 刘义理, 循环神经网络研究综述[J]. 计算机应用, 2018, 38(A2): 1- 6.
Yang L, Wu Y X, Wang J L, Liu Y L, Research on Recurrent Neural Networks[J]. Journal of Computer Applications, 2018, 38(A2): 1- 6.
朱民, 徐钟祥, 中美贸易摩擦对中国股票市场的影响[J]. 国际金融研究, 2021,(4): 3- 12.
Zhu M, Xu Z X, The Impact of the China US Trade Tensions on China's Stock Market[J]. Studies of International Finance, 2021,(4): 3- 12.
Aziz W, Arif M, (2005). Multiscale Permutation Entropy of Physiological Time Series[C]// 2005 Pakistan Section Multitopic Conference, IEEE.
Bandt C, Pompe B, Permutation Entropy: A Natural Complexity Measure for Time Series[J]. Physical Review Letters, 2002, 88(17): 174102.
Bengio Y, Simard P, Frasconi P, Learning Long-term Dependencies with Gradient Descent is Difficult[J]. IEEE Transactions on Neural Networks, 1994, 5(2): 157- 166.
Brandt M W, Kang Q, On the Relationship Between the Conditional Mean and Volatility of Stock Returns: A Latent VAR Approach[J]. Journal of Financial Economics, 2004, 72(2): 217- 257.
Cao Q, Ewing B T, Thompson M A, Forecasting Wind Speed with Recurrent Neural Networks[J]. European Journal of Operational Research, 2012, 221(1): 148- 154.
Challa M L, Malepati V, Kolusu S N R, S & P BSE Sensex and S & P BSE IT Return Forecasting Using ARIMA[J]. Financial Innovation, 2020, 6(1): 47.
Chen W, Wang Z, Xie H, Yu W, Characterization of Surface EMG Signal Based on Fuzzy Entropy[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2007, 15(2): 266- 272.
Chong J, Phillips G M, Sector Rotation with Macroeconomic Factors[J]. The Journal of Wealth Management, 2015, 18(1): 54- 68.
Conover C M, Jensen G R, Johnson R R, Mercer J M, Sector Rotation and Monetary Conditions[J]. The Journal of Investing, 2008, 17(1): 34- 46.
Dai H, MacBeth C, Effects of Learning Parameters on Learning Procedure and Performance of a BPNN[J]. Neural Networks, 1997, 10(8): 1505- 1521.
Dragomiretskiy K, Zosso D, Variational Mode Decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62(3): 531- 544.
Fischer T, Krauss C, Deep Learning with Long Short-term Memory Networks for Financial Market Predictions[J]. European Journal of Operational Research, 2018, 270(2): 654- 669.
Franses P H, Ghijsels H, Additive Outliers, GARCH and Forecasting Volatility[J]. International Journal of Forecasting, 1999, 15(1): 1- 9.
Hochreiter S, Schmidhuber J, Long Short-term Memory[J]. Neural Computation, 1997, 9(8): 1735- 1780.
Huang N E, Shen Z, Long S R, Wu M C, Shih H H, et al. The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Non-stationary Time Series Analysis[J]. Proceedings of the Royal Society of London. Series A: Mathematical, Physical and Engineering Sciences, 1998, 454(1971): 903- 995.
Kao L J, Chiu C C, Lu C J, Chang C H, A Hybrid Approach by Integrating Wavelet-Based Feature Extraction with MARS and SVR for Stock Index Forecasting[J]. Decision Support Systems, 2013, 54(3): 1228- 1244.
Kim K, Dollar Exchange Rate and Stock Price: Evidence from Multivariate Cointegration and Error Correction Model[J]. Review of Financial Economics, 2003, 12(3): 301- 313.
Li M, Zhang C, Wang S, Sun S, Multi-scale Analysis-driven Tourism Forecasting: Insights from the Peri-COVID-19[J]. Current Issues in Tourism, 2022, 26(19): 3231- 3254.
Liu H, Duan Z, Han F, Li Y, Big Multi-step Wind Speed Forecasting Model Based on Secondary Decomposition, Ensemble Method, and Error Correction Algorithm[J]. Energy Conversion and Management, 2018, 156, 525- 541.
Liu H, Long Z, An Improved Deep Learning Model for Predicting Stock Market Price Time Series[J]. Digital Signal Processing, 2020, 102, 102741.
Long J, Chen Z, He W, Ren J, An Integrated Framework of Deep Learning and Knowledge Graph for Prediction of Stock Price Trend: An Application in Chinese Stock Exchange Market[J]. Applied Soft Computing, 2020, 91, 106205.
Maysami R C, Koh T S, A Vector Error Correction Model of the Singapore Stock Market[J]. International Review of Economics & Finance, 2000, 9(1): 79- 96.
Niu H, Xu L, Wang W, A Hybrid Stock Price Index Forecasting Model Based on Variational Mode Decomposition and LSTM Network[J]. Applied Intelligence, 2020, 50, 4296- 4309.
Niu X, Wang J, Zhang L, Carbon Price Forecasting System Based on Error Correction and Divide-conquer Strategies[J]. Applied Soft Computing, 2022, 118, 107935.
Rapach D E, Strauss J K, Zhou G, Out-of-sample Equity Premium Prediction: Combination Forecasts and Links to the Real Economy[J]. The Review of Financial Studies, 2010, 23(2): 821- 862.
Richman J S, Moorman J R, Physiological Time-series Analysis Using Approximate Entropy and Sample Entropy[J]. American Journal of Physiology-heart and Circulatory Physiology, 2000, 278(6): H2039- H2049.
Sheta A F, Ahmed S E M, Faris H, A Comparison Between Regression, Artificial Neural Networks and Support Vector Machines for Predicting Stock Market Index[J]. Soft Computing, 2015, 7(8): 2.
Sun B, Bai J, Chu X, Sun S, Li Y, et al. Interval Prediction Approach to Crude Oil Price Based on Three-way Clustering and Decomposition Ensemble Learning[J]. Applied Soft Computing, 2022, 123, 108933.
Wu S, Wu C, Lin S, Lee K, Peng C, Analysis of Complex Time Series Using Refined Composite Multiscale Entropy[J]. Physics Letters A, 2014, 378(20): 1369- 1374.
Wu Z, Huang N, Ensemble Empirical Mode Decomposition: A Noise-assisted Data Analysis Method[J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1- 41.
Yang D, Guo J, Sun S, Han J, Wang S, An Interval Decomposition-ensemble Approach with Data-characteristic-driven Reconstruction for Short-term Load Forecasting[J]. Applied Energy, 2022, 306, 117992.
Yu L, Ma M, A Memory-trait-driven Decomposition-reconstruction-ensemble Learning Paradigm for Oil Price Forecasting[J]. Applied Soft Computing, 2021, 111, 107699.
Yu L, Wang S, Lai K, Forecasting Crude Oil Price with an EMD-based Neural Network Ensemble Learning Paradigm[J]. Energy Economics, 2008, 30(5): 2623- 2635.
Yu L, Zhang X, Wang S, Assessing Potentiality of Support Vector Machine Method in Crude Oil Price Forecasting[J]. EURASIA Journal of Mathematics, Science and Technology Education, 2017, 13(12): 7893- 7904.
Zhang G P, Qi M, Neural Network Forecasting for Seasonal and Trend Time Series[J]. European Journal of Operational Research, 2005, 160(2): 501- 514.
Zhang X, Lai K K, Wang S Y, A New Approach for Crude Oil Price Analysis Based on Empirical Mode Decomposition[J]. Energy Economics, 2008, 30(3): 905- 918.

Funding

National Natural Science Foundation of China(71988101)
National Natural Science Foundation of China(72171223)
National Natural Science Foundation of China(71801213)

RIGHTS & PERMISSIONS

All rights reserved, without authorization
PDF(1888 KB)

1023

Accesses

0

Citation

Detail

Sections
Recommended

/