Can Combination Forecasts with Dimensionality Reduction Data Improve the Prediction Performance of Stock Excess Returns?

Zheng YANG, Haocheng WU, Jing ZHANG, Yongkai MA

China Journal of Econometrics ›› 2023, Vol. 3 ›› Issue (3) : 828-847.

PDF(818 KB)
PDF(818 KB)
China Journal of Econometrics ›› 2023, Vol. 3 ›› Issue (3) : 828-847. DOI: 10.12012/CJoE2022-0099

Can Combination Forecasts with Dimensionality Reduction Data Improve the Prediction Performance of Stock Excess Returns?

Author information +
History +

Abstract

We propose a new method combining dimensionality reduction data forecasts and combination forecasts in this study. The purpose is to avoid the uncertainty caused by the method selection of dimensionality reduction data forecasts and the information loss caused by the dimensionality reduction process. This paper forecasts the excess return of S&P 500 index based on a data set consisting of 122 macroeconomic factors and 14 technical index factors. We compare the forecasting results of univariate forecast, univariate combination forecasts, dimensionality reduction data forecasts and dimensionality reduction data combination forecasts. The conclusion of this paper includes three aspects. First, the out-of-sample goodness of fit (ROoS2) shows that the dimensionality reduction data combination forecasts is superior to three dimensionality reduction data methods, and is inferior to the univariate VOL(1, 9) forecasts and univariate combination forecasts. Certainty equivalent return (CER) indicates that the dimensionality reduction data combination forecasts is better than the univariate combination forecast, and is worse than the univariate VOL(1, 9) forecasts and the principal component analysis forecasts. The comprehensive results show that the dimensionality reduction data combination forecasts take into account both forecasting accuracy and economic benefits. Second, the performance of the dimensionality reduction data combination forecasts is robust in different economic cycles and different risk aversion levels. Finally, we propose an econometric test method for the information contained in the combined results. The test results show that the dimensionality reduction data combination forecasts make full use of the forecasting information with the best dimensionality reduction data forecasts, and avoids the information loss caused by a single model.

Key words

stock excess return / dimensionality reduction data / out-of-sample goodness of fit / certainty equivalent return / combination forecasts

Cite this article

Download Citations
Zheng YANG , Haocheng WU , Jing ZHANG , Yongkai MA. Can Combination Forecasts with Dimensionality Reduction Data Improve the Prediction Performance of Stock Excess Returns?. China Journal of Econometrics, 2023, 3(3): 828-847 https://doi.org/10.12012/CJoE2022-0099

1 引言

预测股票的未来状态一直是许多股票市场参与者非常感兴趣的问题. 一些研究者基于Fama (1965)的有效市场假说(EMH), 认为样本外的可预测性要么局限于某一特定时期(Pesaran and Timmermann (1995)), 要么这种可预测性根本不存在(Bossaerts and Hillion (1999), Goyal and Welch (2003), Welch and Goyal (2008)). 另一些研究者认为股票收益是可以预测的(Campbell and Thompson (2008), Rapach et al. (2010), Ferreira and Santa-Clara (2011), Pettenuzzo et al. (2014), Pettenuzzo and Ravazzolo (2016), Pan et al. (2020)). 为了更准确地预测股票超额收益, 研究者希望获得更多的预测因子信息. Welch and Goyal (2008)利用14个宏观基本面因子预测SP500股指超额收益, 发现股票收益不可预测. 在Welch and Goyal (2008)的基础上, Neely et al. (2014)增加14个技术指标因子发现股票收益可以预测. Çakmakli and Van Dijk (2016)利用118个宏观经济因子来预测SP500股指超额收益. Giovannelli et al. (2021)利用了122个宏观经济因子进行预测. Gu et al. (2020)搜集了920个预测因子预测美国股票. 类似于Gu et al. (2020)的方法, Leippold et al. (2022)在中国股市选择了1160个因子进行预测. 随着预测因子数量的增加, 采用降维方法来处理大维数据信息是必要的.
把数据降维后进行预测面临两方面问题. 一方面, 数据在大维数据降维过程中会损失一些信息, 这些信息是否会影响到预测结果. 另一方面, 由于数据降维方法较多, 每一种降维方法的原理不同, 存在方法选择的不确定性风险. 为此, 本文提出数据降维预测方法和组合预测相组合的一种新方法, 在Giovannelli (2021)的122个宏观经济因子的基础上, 结合Neely et al. (2014)的14个技术因子对SP500股指超额收益进行预测.
传统模型组合方法由Bates and Granger (1969)提出, Granger and Ramanathan (1984), Granger (1989), Clemen (1989), Hendry and Clements (2002)等做了拓展. 贝叶斯模型平均的思想由Min and Zellner (1993)提出, 其有效性被Wright (2003a, b)证实. Stock and Watson (2004, 2006)提供了详细的经验证据, 证明通过组合预测可以提高预测精度, 尤其是等权组合和贝叶斯模型平均. 国内众多学者拓展了组合预测的理论和应用研究. 曾勇等(1995)研究了非负权重最优组合预测方法的结构特征和计算方法, 并在此基础上提出了冗余方法. 马永开和唐小我(1998)研究了线性组合预测模型的优化方法. 汪同三和张涛(2008)介绍了预测信息组合技术、预测方法组合技术、预测结果组合技术以及组合预测的基本理论, 回答了为什么要进行组合预测、什么时候进行组合预测、怎样实现组合预测等具有重要实践意义的问题. 吴登生等(2017)研究了模型相关性的组合预测过程中单项模型的筛选问题. 袁宏俊等(2019)提出了基于三角模糊数相似度的区间型组合预测模型. 李程(2021)比较了一类相关性指标优化IOWHA组合模型的预测结果. 刘金培等(2022)对非结构化数据进行研究, 构建了混合二次分解汇率区间多尺度组合预测.
传统模型组合方法适用于预测因子维度较小的简单线性模型组合. 例如Liu and Kuo (2016)Welch and Goyal (2008)收集的14个宏观基本面因子中选择了10个因子预测SP500股指超额收益, 一共估计了210个线性模型做组合预测. 对于本文中136个预测因子, 传统组合预测将会产生2136个模型, 计算量大难以实现. 因此对预测因子做降维处理是必要的. 本文提出的数据降维组合预测方法是选择几种典型的数据降维方法进行预测, 然后利用几种权重方式对预测结果进行组合. 由于实际操作中数据降维方法众多, 这里选择主成分分析(PCR)、岭回归(RR)和LASSO等方法预测. 在构建组合时, 权重方式采用了等权、DMSPE权重、BIC权重、SAIC权重和MMA权重. 进而检验再次组合是否可以避免选择降维方法的不确定性. 同时, 组合预测结果是否包含了比单一数据降维方法更多的预测信息, 检验单一方法造成的信息损失也是本文研究的动机.
本文从两个维度进行组合预测. 一方面, 对单变量模型预测结果进行组合. 参考Welch and Goyal (2008)的预测方式, 先用一系列单因子进行预测, 再对预测结果进行组合. 相对于多元回归预测, 单变量模型以牺牲估计参数的无偏性为代价减小参数的方差. 但对于变量较多的数据, 该方法存在模型选择的不确定性, 而模型组合既可以减小估计参数的偏差, 又避免了模型选择问题. 另一方面, 对数据降维预测结果进行组合. 类似于Neely et al. (2014), Gu et al. (2020), Leippold et al. (2022)的数据降维方法, 我们得到数据降维预测结果后再次使用组合方法进行预测.
关于SP500股指超额收益的样本外预测结果表现在几个方面. 首先, 单变量回归模型的预测结果不仅受选择单变量模型影响程度较大, 且其在预测期的稳定性也较差. 组合预测法既解决了模型选择问题, 又提高了预测精度和模型稳健性, 其中SAIC、BMA和MMA权重组合法表现最佳, 但预测精度仍不如个别单变量模型. 其次, 包含所有预测因子的多元线性模型的总体预测性能很差, 而且在预测期中受2008年金融危机影响程度很大, 累计残差平方和呈断崖式下降. 降维方法在很大程度上改善了多元线性模型, 其中PCR模型表现最佳. 降维数据预测组合提高了单一降维方法的样本外预测性能, δ=0.9的DMSPE权重组合表现较优, 但相对于单变量模型组合而言预测精度依旧不高. 经济意义上的分析表明, PCR模型, 单变量VOL(1,9)模型和降维数据回归模型的组合都取得了较高的经济收益. 综合上述结果, 降维数据预测组合兼顾了预测精度和经济收益.
除此之外, 本文提出一种检验信息差异的检验方法, 即检验降维数据组合预测结果是否包含了比单一降维方法预测结果更多的信息. 检验结果表明权重方式的选择对组合信息有重要影响. 通过研究模型在不同经济周期的预测性能, 组合模型具备一定的稳定性. 投资组合的确定性等价收益CER会随着风险厌恶程度的变化而同步改变, 但风险厌恶程度的不同并不能影响投资者在实践中对预测模型的选择.
本文的结构安排如下: 第二节介绍了线性模型、降维方法和组合预测的原理以及如何用预测因子构造相应的模型. 第三节描述了使用的数据集以及数据预处理方式. 第四节展示了样本外预测结果, 包括统计和经济上的预测性能. 第五节对降维组合预测结果的信息进行检验, 并对预测结果进行稳健性分析. 最后一节是结论部分.

2 理论模型和方法

考虑样本总数为T, 使用前M个观测值用作模型的训练, 其中训练集中包含一个验证集, 用于对某些模型的参数训练, 验证集的长度固定为V, 即从第MV+1个观测值开始, 到第M个观测值结束. 剩下的P个观测值作为模型样本外预测的测试集, P=TM. 令X=(x1,x2,,xt)T=(X1,X2,,Xn)是模型输入的自变量, 其中xt=(x1t,x2t,,xnt), Xn=(xn1,xn2,,xnt). X是时间序列数据xit的面板, 其中自变量个数为n. 因变量为股指超额收益r, r=(r1,r2,,rt)T.

2.1 基准模型

类似于Campbell and Thompson (2008), Welch and Goyal (2008), 使用均值模型作为基准模型, 基准模型的表达式如下:
rτ+1=α+ετ+1,
(1)
其中τ=1,,t1, t=M,,T1, εt+1是白噪声误差项, 均值为0且方差为σε2. 该模型基于t时刻产生的t+1时刻的预测值为:
r^t+1|t=t1τ=1trτ.
(2)
使用均值模型作为基准模型, 将其它各模型的预测结果与之相比较, 就可以得出在同一标准下各模型的预测精度的差异.

2.2 单变量回归模型

参考Welch and Goyal (2008)中的单变量回归(univariate regression, UR), 对股票在τ+1的超额收益rτ+1进行建模, 以滞后一阶的第i个变量xiτ作为线性模型的自变量:
rτ+1=α+βxiτ+ετ+1.
(3)
样本外的预测公式为:
r^t+1|t=α^t+β^txit.
(4)
α^tβ^t是通过对式(3)中的αβ进行普通最小二乘估计得到的, 即用常数项和{xiτ}τ=1t1{rτ+1}τ=1t1进行回归. 对t=M,,T1重复此过程, 产生1个长度为P的向前一步预测的时间序列数据, 将其记作{r^t+1|t}t=MT1. 对i=1,,n重复此过程, 产生n个该时间序列数据, 即为n个单变量回归模型预测的结果.

2.3 多元线性回归模型

采用多元线性回归模型(multiple linear regression, MLR)对股票在τ+1的超额收益rτ+1进行建模, 形式如下:
rτ+1=α+β1x1τ+β2x2τ++βnxnτ+ετ+1.
(5)
样本外的预测公式为:
r^t+1|t=α^t+β^1tx1t+β^2tx2t++β^ntxnt.
(6)
α^tβ^1t,β^2t,,β^nt是通过对式(5)中的αβ1,β2,,βn进行普通最小二乘估计得到的, 即用常数项和{x1τ,x2τ,,xnτ}τ=1t1{rτ+1}τ=1t1进行回归. 对t=M,,T1重复此过程, 产生1个长度为P的向前一步预测的时间序列数据{r^t+1|t}t=MT1, 即为多元线性回归模型预测的结果.

2.4 降维预测方法

回归自变量之间的相关性在经济问题的研究中经常存在, 因此本文将用以下几种统计方法对回归自变量进行降维, 从而优化多元线性回归模型.
1) 主成分回归
主成分回归(principal components regression, PCR)只对X进行线性变换, 线性变换矩阵记作μ, 可以生成新的综合变量Y, 满足下式:
{Y1=μ11X1+μ12X2++μ1nXn,Y2=μ21X1+μ22X2++μ2nXn,Yn=μn1X1+μn2X2++μnnXn.
(7)
矩阵μ需要让Yi的方差尽可能大且Yi之间相互独立, 基于此条件所产生的综合变量Y1,Y2,,Yn分别为原始变量的第一到第n主成分. 在做回归时, 通常只挑选前几个方差最大的主成分, 将其作为多元线性回归模型的自变量, 从而达到降维的目的.
2) 岭回归
岭回归(ridge regression, RR)也被广泛应用于解决变量间的多重共线性问题. 岭回归模型是在线性回归模型的目标函数上加了一个2-范数的惩罚项:
Q(β^)=(rXβ^)+λβ^22.
(8)
λ取值越大, 为了使Q(β^)尽量小, 回归系数估计值β^中的某些分量就会趋于0. 由于在目标函数中引入了惩罚项, 使得回归系数β的估计β^不再具备无偏性, 因此岭回归的参数估计是一个有偏估计, 它是一种以放弃无偏性, 降低参数精度为代价来解决参数估计中病态矩阵问题的回归方法.
交叉验证法被用于确定最优λ的值. 其原理如下: 从原始资料X, r中删去第l组资料, 即删去(rl,xl1,xl2,,xln), 删去后的X, r记作X(l), r(l). 以X(l),r(l)作为原始资料, 选择一个初始的岭参数λ, 用岭回归方法算出预测方程中r^λ的表达式, r^λ(l)表示该方程的预测值. 将xl1,xl2,,xln代入预测方程得到r^λ(l), 残差rlr^λl(l)反映了在岭参数取λ时预测方程的好坏在第l组资料上的体现, 于是,
l=1n(rlr^λl(l))2.
(9)
就在整体上反映了在岭参数取λ时预测方程的好坏, 其中l在时间序列数据中代表某一特定时期. 将该损失值记为L(λ), 应该选择λ使得L(λ)达到最小, 即λ满足:
L(λ)=minL(λ).
(10)
通过使用交叉验证法选取最优岭参数, 使得岭回归预测方程的效果往往比较好.
3) LASSO回归
LASSO (least absolute shrinkage and selection operator)回归的特点是在拟合广义线性模型的同时进行变量筛选和复杂度调整. LASSO回归的目标函数如下:
Q(β^)=(rXβ^)+λβ^1.
(11)
回归系数β的估计β^可以通过坐标下降法等其他方法求得, 对于LASSO回归中参数λ的确定, 依旧采用前文中提及的交叉验证法.

2.5 组合预测方法

假设共有N个模型, 对于单变量回归模型而言, N的个数等于自变量的数目n, t时刻的权重向量wt=(w1,t,w2,t,,wN,t)T, 那么在t+1时刻无约束的组合预测结果为:
r^t+1|tcomb=i=1Nwi,tr^i,t+1|t,
(12)
其中i=1,,N, r^i,t+1|t表示在时间t时第i个模型对t+1时刻股指超额收益的预测结果, wi,t表示在时间t时第i个模型预测结果应该被分配的权重.
1) 等权组合法
对于等权组合而言, 权重的计算方式如下:
wi,t=1/N.
(13)
等权组合被广泛应用于模型组合中. 最近的一些研究(Rapach et al. (2010), Claeskens et al. (2016))发现在股指超额收益的预测中, 等权组合法得到的预测性能有时甚至优于一些复杂的模型组合权重法.
2) DMSPE权重组合法
DMSPE (the discounted MSPE) (Stock and Watson (2004))权重组合法将各个模型的预测值的加权平均作为组合预测的结果, 其中权重与每个模型预测的历史表现成反比. 该权重在t时刻的计算公式如下:
wi,t=ϕi,t1j=1Nϕj,t1,
(14)
其中
ϕi,t=τ=tV+1tδtτ(rτr^i,τ|τ1)2.
V表示验证集的长度, δ表示折扣因子, 本文中取δ=1δ=0.9. 当δ=1时, 表示MSPE未进行折扣, 此时该权重等价于Bates and Granger (1969)提出的权重组合法; 当δ=0.9时, 表示距离预测点的时间越远, 给模型预测结果的MSPE越低的权重, 意味着更关注最近时期的预测效果.
3) BMA权重组合法
一些与预测相关的文献对贝叶斯模型平均(Bayesian model averaging, BMA)进行了研究. 假设第i个模型的自变量个数为k(i), 各个模型的自变量个数构成向量K=(k(1),k(2),,k(N))T. 残差矩阵e^t=(e^t(1),e^t(2),,e^t(N)), 单个模型的残差向量e^t(i)=(e^tV+1(i),e^tV+2(i),,e^t(i))T, 其中e^τ(i)=rτr^i,τ|τ1 (τ=tV+1,,t), 残差项的方差估计σ^t2(i)=e^t(i)Te^t(i)/V.
BMA权重在t时刻的计算公式如下:
wi,t=exp(12BIC(i))j=1Nexp(12BIC(j)),
(15)
其中, BIC(i)=Vln(σ^t2(i))+k(i)lnV是第i个模型的贝叶斯信息准则值.
4) SAIC权重组合法
与贝叶斯模型平均相似, 平滑的赤池信息准则(smoothed AIC, SAIC)是基于AIC信息准则提出的. SAIC权重在t时刻的计算公式如下:
wi,t=exp(12AIC(i))j=1Nexp(12AIC(j)),
(16)
其中AIC(i)=Vln(σ^t2(i))+2k(i)是第i个模型的赤池信息准则值.
5) MMA权重组合法
使用Hansen (2007)的MMA (Mallows model averaging)准则选择的权重向量来构建组合预测. MMA准则是对经典的用于模型选择的Mallows准则的拓展, MMA是残差平方和和惩罚项之和的加总:
Cn(wt)=wtTe^tTe^twt+2wtTKst2,
(17)
其中
st2=1Vk(M)e^tT(M)e^t(M).
k(M)=max{k(1),k(2),,k(N)}表示N个模型中自变量个数最多的模型M中所含自变量的个数, 因此st2表示来自模型Mσt2的估计值. wt应满足如下约束:
H={wi,t[0,1]i=1Nwi,t=1}.
(18)
MMA权重应该定义为:
w^t=argminwtHCn(wt).
(19)
Mallows准则是样本内均方误差的近似无偏估计, 对于独立同分布的观测值, Hansen (2007)中已经给出证明. 而在Hansen (2008)中证明了这一结论对于平稳独立的观测值也成立, 同时它还证明了当观测值严格平稳时, Mallows准则可以近似作为预测均方误差的无偏估计.

3 数据集和预测设置

3.1 数据来源

本文使用SP500股指超额收益的月数据作为因变量, 一组大规模预测因子作为自变量. 这些预测因子由两类数据组成. 一是来自FRED-MD数据库的122个变量, FRED-MD数据库将变量分成了8组: 1)产出和收入; 2)劳动力市场; 3)消费市场; 4)订单和库存; 5)货币和信贷; 6)利率和汇率; 7)商品价格指数; 8)股票市场. 前7组包含了122个自变量, 最后一组包含的变量可以用来计算出因变量: 使用SP500的指数收益减去短期国库券利率(本文中取3个月期国库券利率)再加上SP500普通股的股息率, 以此作为股票市场的超额收益. 各因子的详细描述见McCracken and Ng (2016). 二是使用14个技术指标作为预测因子, 其中包括6个移动平均策略(MA)指标, 2个动量策略(Momentum)指标和6个基于成交量策略(VOL)的指标. 这些指标由历史价格和成交量计算得到, 详细计算方法见Neely et al. (2014).
本文选择的样本数据为1960年1月至2019年12月的月度数据, 每组变量累计60年共720条数据. 将这些数据划分为训练集(含验证集)和测试集, 其中训练集用于模型的样本内拟合, 验证集用于某些特殊模型计算参数, 如计算权重参数, 测试集用于模型的样本外预测. 使用1960年1月到1986年12月这27年的月度数据作为模型的训练集, 其中1975年1月到1986年12月这12年的月度数据作为模型的验证集, 剩下的数据为测试集, 即1987年1月到2019年12月这33年的月度数据.
根据FRED-MD数据库的使用描述, 对原始数据进行处理同时进行z-score标准化:
yi=xix¯s,
(20)
其中x¯=t1i=1txis=(t1)1i=1t(xix¯)2. 新序列y=(y1,y2,,yt)即为对变量x标准化后的新数据.

3.2 预测设置

参考Timmermann (2008), 本文区分预测模型和预测方式. 前者是指预测时采用的一些模型和方法, 包括前述模型和方法. 后者指代预测时预测者的一些主观设定, 包括模型的参数设置, 估计窗口和评价指标的选择等.
本文采用的预测方式为样本外的一步向前预测, 对于股指超额收益序列在每一个时间点τ+1, 相关的预测信息在时间点τ都是可获得的. 因此是采用时间点τ的自变量的信息来预测时间点τ+1的股指超额收益.
模型参数设置: 对于单变量回归模型和多元回归模型, 无需对模型参数进行设置. 对于主成分回归模型, 根据其在验证集中的预测表现, 取其主成分个数n=17. 对于岭回归和LASSO回归模型, 其最优参数可以通过交叉验证法确定, 这里采用5折交叉验证. 对于DMSPE权重组合法, 分别取δ=1δ=0.9进行分析.
估计窗口设置: 本文使用递归和滚动两种形式的估计窗口. 训练集采用递归窗口, 而验证集采用滚动窗口. 对于单变量回归模型, 多元线性模型和降维数据回归模型, 无需用到验证集, 其样本外预测由以下递归窗口方式产生: 使用1960:01到1986:12的自变量数据和1960:02到1987:01的因变量数据对模型进行拟合, 将1987:01的自变量输入模型得到1987:02的因变量样本外一步向前预测, 作为样本外预测的第一个结果; 使用1960:01到1987:01的自变量数据和1960:02到1987:02的因变量数据对模型进行拟合, 将1987:02的自变量输入模型得到1987:03的因变量样本外一步向前预测, 作为样本外预测的第二个结果, 以此类推, 从而得到一系列样本外预测值.
对于模型组合法, 除等权组合法外, 其它模型组合法都需计算各组合模型的权重. 权重的计算使用验证集数据. 各组合模型的样本外预测值通过上述递归窗口的方式产生, 对于各组合模型的权重值, 由以下滚动窗口方式产生: 使用11975:01到11986:12的数据产生第一组各模型的权重值; 使用1975:02到1987:01的数据产生第二组各模型的权重值, 以此类推, 产生一系列各组合模型的权重值.

4 样本外预测分析

4.1 预测评价指标

为了对各模型预测结果进行比较, 采用预测均方误差(MSFE), 样本外的R2, CW检验和累积预测残差平方和(CSSED)等指标.
类似于Pesaran and Timmermann (1995), Bossaerts and Hillion (1999), 第一个评价指标是预测均方误差(mean squared forecasting error, MSFE), 它评估了一系列预测结果的绝对性能. 具体的计算方式如下:
MSFE=1TMt=M+1T(rtr^t|t1)2.
(21)
rt表示在t时刻的真实值, r^t|t1表示基于t1时刻对t时刻的模型预测值.
ROoS2(%)=100×(1MSFEmodelMSFEbench),
(22)
其中MSFEmodelMSFEbench分别代表所选模型和基准模型的预测均方误差, 由(21)式计算得到. ROoS20当且仅当MSFEmodelMSFEbench, 意味着基准模型的预测精度优于所选模型的预测精度; 相反, ROoS2>0当且仅当MSFEmodel<MSFEbench, 意味着所选模型的预测精度优于基准模型的预测精度.
为了评估所选模型相对于基准模型预测性能改进的显著性, 采用CW检验(Clark and West (2007)), 检验的零假设和备择假设如下:
H0:ROoS20, MSFEmodelMSFEbench,
H1:ROoS2>0, MSFEmodel<MSFEbench.
CW检验首先计算残差序列:
ft=(r^tbenchrt)2(r^tmodelrt)2+(r^tbenchr^tmodel)2.
(23)
利用残差序列对常数项进行回归:
ft=c+ut.
(24)
CW检验统计量就是常数项的t检验统计量值. CW检验如果拒绝原假设, 则所选模型和基准模型之间的估计误差是存在显著差异的, 且所选模型的预测精度更优. 如果接受原假设, 则基准模型表现更好.
为了衡量模型在预测期的预测稳定性, 参考Welch and Goyal (2008), 计算累积预测残差平方和(cumulative sum of squared prediction error difference, CSSED):
CSSEDmodel,t=τ=M+1t(ebench,τ2emodel,τ2),
(25)
其中t=M+1,,T, ebench,τ2emodel,τ2分别表示在时间点τ基准模型和所选模型的预测残差平方. 注意到CSSEDmodel,t1CSSEDmodel,t的增加代表着所选模型在时间点t比基准模型产生了更准确的预测结果.

4.2 样本外的预测结果

依据模型参数设置和评价指标的选择, 计算各模型的样本外ROoS2(%), 结果见表 1.
表1 预测期1987–2019年SP500股指超额收益的ROoS2(%)
Panel A: 单变量模型
NONBORRES IPNMAT UEMP15T26 CES0600000008 VOL(1,9)
9.34 0.87 0.27 0.00 6.66
Panel B: 单变量模型组合
等权 DMSPE权重(δ=1) DMSPE权重(δ=0.9) BMA权重 SAIC权重 MMA权重
0.65 0.75 0.72 5.74 5.74 5.74
Panel C: 多元线性模型和降维数据的回归模型
MLR PCR RR LASSO
522.89 0.64 0.15 0.42
Panel D: 降维数据的回归模型组合
等权 DMSPE权重(δ=1) DMSPE权重(δ=0.9) BMA权重 SAIC权重 MMA权重
1.22 1.23 1.26 0.15 0.18 0.78
注: 分别表示CW检验在10%、5%和1%的水平上显著.
Panel A报告了各单变量回归模型的样本外预测性能, 由于单变量回归模型过多, 不能一次性展示, 将其按照样本外预测性能排序后, 取最小值、下四分位数、中位数、上四分位数、最大值这五数构成表中的结果. 预测因子NONBORRES, IPNMAT, UEMP15T26, CES0600000008属于宏观经济因子, 分别代表非借入准备金, 工业生产指数: 材料, 失业1526周的人群数, 商品业平均时薪. VOL(1,9)表示月度信号相关参数取1和9的基于成交量策略的指标. 从表中可以看出, 不同单变量回归模型的预测性能存在很大差异, 表现最好的VOL(1,9)ROoS2达到了6.66%, 而表现最差的NONBORRES其预测性能不如基准模型. 表中展示的五数之间的预测性能存在很大差异, 说明单变量回归模型的预测性能受选择的变量类型影响较大.
Panel B给出单变量回归模型的模型组合结果, 在各种权重组合下得到的样本外预测性能都显著优于基准模型, 说明模型组合解决了单变量模型的模型选择问题. MMA、BMA和SAIC权重组合表现较好, 其ROoS2达到5.74%, 且在1%的显著性水平下显著, 但是预测性能不如VOL(1,9)单变量模型, 这证实了Neely et al. (2014)中技术指标的较强的预测能力. 注意到时变权重组合的预测效果基本都优于等权组合, 且DMSPE权重在δ=1时表现更好, 说明时间因素对权重没有影响.
Panel C报告了多元线性回归模型和使用不同统计方法得到的降维数据回归模型的样本外预测性能. 多元线性模型的预测性能远远低于基准模型, 其ROoS2甚至跌到522.89%, 说明自变量之间存在严重的多重共线性问题, 冗余信息影响了模型参数估计和预测. 主成分回归模型显著提高了多元线性模型的预测性能, 预测精度达到0.64%. 岭回归和LASSO模型的预测性能也有一定的提升. 显然, 降维数据回归模型都在一定程度上提高了多元线性模型的预测性能, 且预测性能都优于基准模型, 其中主成分回归模型表现最佳.
Panel D报告了降维数据回归模型的组合预测结果, 将Panel C中使用不同统计方法得到的降维数据回归模型进行组合. δ=0.9的DMSPE权重组合此时表现最好, 但效果不如部分单变量模型组合.等权组合此时也优于除DMSPE权重外的其它权重组合, 而MMA权重表现相对较差, 这与Panel B中的结果恰好相反.
图 1绘制各模型在预测期1987–2019年累积预测残差平方和CSSED变化. 图 1(a)的NONBORRES和图 1(c)的多元线性模型(MLR)绘制在次坐标轴, 相应参数见右坐标轴.
图1 预测期19872019年的累积预测残差平方和CSSED

Full size|PPT slide

对比单变量回归模型和单变量模型组合, 可以发现图 1(a)中单变量回归模型在整个预测期的累积残差平方和随时间变化波动较大, 说明某些因子的预测性能优于基准模型, 某些因子的预测却不如基准模型. 而单变量模型组合的CSSED在整个预测期呈现上升趋势, 尤其是MMA、SAIC和BMA权重组合, 相较于其它权重组合表现更有优势. 注意到在2008年前后, 受到金融危机的影响, 模型的预测性能表现出不同的变化情况. 在单变量回归模型中, 除了VOL(1,9)变量回归模型的预测性能基本稳定, 其它单变量模型的预测性能都受到了很大影响, 而单变量模型组合中, 各模型基本保持稳定, 受金融危机的影响较小, 且MMA、SAIC和BMA权重组合此时相对于基准模型而言, 预测性能提升显著, 进一步证实了模型组合的稳定性.
对比不同统计方法得到的降维数据回归模型, 多元回归模型表现很差, 在整个预测期中预测性能一直下降, 受2008年金融危机影响, CSSED跌至谷底. 岭回归, LASSO回归和主成分回归模型在整个预测期中CSSED呈现出一定的波动性, 相比于多元回归模型而言, 受金融危机的影响程度相对更弱. 降维数据回归模型的组合预测, 相对于降维数据回归模型而言, 在整个预测周期中更具有优势. 尤其是δ=0.9的DMSPE权重组合, 虽然受到金融危机的影响, 但其预测性能仍然表现最好..

4.3 模型的经济效益

考虑一个具有均值—方差偏好的投资者, 在SP500股票指数和无风险国库券之间构造投资组合. 股票指数在投资组合中的最优权重是由预测出的收益确定的, 投资组合的期望效用如下:
Et(Ut+1)=Et(wtrt+1+rt,f)γ2Vart(wtrt+1+rt,f),
(26)
其中wt是股票指数在投资组合中的权重, rt+1为超额收益, 无风险利率rt,f是三个月期国库券利率, 系数γ衡量了投资者对风险资产的厌恶程度. 通过最大化Et(Ut+1)可以得到在t时刻的最优股票指数权重:
wt=1γ(r^t+1σ^t+12),
(27)
其中r^t+1σ^t+12是股指超额收益的均值和波动性预测. 遵循Rapach et al. (2010), 使用5年的滚动窗口产生波动率的预测值, 并且设定风险厌恶程度γ=3.
通过给风险资产的最优权重施加约束, wt[0,1.5], 从而避免卖空以及财务杠杆大于50%, 这样动态的投资组合策略收益为:
Rt+1,p=wtrt+1+rt,f.
(28)
最后计算确定性等价收益(certainty equivalent return, CER):
CERp=mean(Rt+1,p)γ2Var(Rt+1,p).
(29)
表 2报告了各模型的CER收益与基准模型之间的差值, 这些差值乘以1200表示年化百分比值. 这里选取的模型是在统计意义上表现较好的模型, 具体包括主成分回归模型, 岭回归模型, LASSO回归模型, VOL(1,9)单变量模型, 所有的单变量模型组合和降维数据的回归模型组合.
表2 风险厌恶程度γ=3时的确定性等价回报, ΔCER(ann.)(%)
Panel A: 降维模型和VOL(1,9)单变量模型
PCR RR LASSO VOL(1,9)
11.14 7.43 7.57 8.81
Panel B: 单变量模型组合
等权 DMSPE权重(δ=1) DMSPE权重(δ=0.9) BMA权重 SAIC权重 MMA权重
0.58 0.55 0.53 4.95 4.95 5.65
Panel C: 降维数据的回归模型组合
等权 DMSPE权重(δ=1) DMSPE权重(δ=0.9) BMA权重 SAIC权重 MMA权重
8.39 8.35 8.36 7.79 7.69 8.21
Panel A报告了不同统计方法得到的降维数据回归模型以及VOL(1,9)单变量模型相对于基准模型CER的提升, 其中主成分回归模型取得了更高的经济收益, 相对于基准模型提升11.14%. Panel B和Panel C分别报告了单变量回归模型和降维数据回归模型的模型组合相对于基准模型CER的提升, 对比这两列数据可以明显发现, 降维数据回归模型组合的CER提升比单变量模型组合表现更好. 在两组数据中, 表现最好的分别是MMA权重组合和等权组合模型, 其CER相对于基准模型分别提高了5.65%和8.39%.

5 拓展性研究

本节首先检验降维组合相对于不同降维方法是否保留了更多的信息. 然后分析这些模型在不同经济周期的统计表现, 以评估模型的预测稳健性. 最后对不同风险厌恶系数下模型的经济效益进行比较, 以评估模型在经济意义上的可预测性是否稳定.

5.1 模型的信息损失检验

组合预测根据优化准则赋予各个降维预测方法不同的权重. 如果某个降维预测方法不具有主导性优势, 那么组合预测将包含其他降维预测方法的结果. 因此, 其他降维预测方法提供了该方法之外的其他信息, 这些信息可能是数据降维处理时造成的损失. 因此, 参考Davidson and MacKinnon (2004)对非嵌套模型的检验方法, 将降维数据的模型组合预测结果和单一降维数据预测结果进行检验, 识别前者相对于后者而言是否包含更多的信息. 检验步骤如下:
第一步, 假设使用降维方法A得到的预测结果为y^A, 模型组合的结果为y^comb, 进行如下回归:
y^comb=βAy^A+u^A.
(30)
计算出回归残差u^A, 表示方法A之外的其他模型给组合提供的预测信息.
第二步, 类似于Ramsey (1969)的RESET检验, 使用u^A的一至三次项和y^A对真实值y回归:
y=βy^A+γ1u^A+γ2u^A2+γ3u^A3+ε.
(31)
对回归系数进行F检验, 假设检验如下:
H0:γ1=γ2=γ3=0,H1:γ10 or γ20 or γ30.
如果F统计量大于对应的临界值则拒绝原假设, 说明降维方法A得到的预测结果相比于模型组合而言具有一定的信息损失. F检验结果见表 3.
表3 三种降维模型预测的信息损失检验
权重类型 PCR RR LASSO
等权 0.31 3.31 2.57
DMSPE权重(δ=1) 0.32 3.23 2.48
DMSPE权重(δ=0.9) 0.32 3.23 2.23
BMA权重 0.47 1.88 1.83
SAIC权重 0.47 1.91 1.70
MMA权重 0.36 1.05 0.50
注: 分别表示F检验在10%、5%和1%的水平上显著.
表 3的检验结果带来三方面的启示. 首先, 对单一降维预测模型的检验来看, PCR和LASSO在所有组合中都不拒绝原假设, 表明这两种方法在每种组合方式中提供占据主导地位的信息, 并且提供的信息是一致的. 而岭回归相对于等权组合和DMSPE权重组合而言有一定的信息损失. 对比表 1中各模型的预测性能, 岭回归相比于PCR模型和LASSO而言性能较差, 可能其在降维过程中损失了较多信息, 对组合提供的预测信息较少. 其次, 从组合信息来看, 组合预测信息融合了各单一模型的预测信息. 由于PCR和LASSO降维预测表现较好, 说明这两个模型对信息的捕捉能力更强, 能够更高效地识别有效信息, 因此在所有组合预测中增加其他模型的额外信息更少. 岭回归的检验在等权组合和DMSPE权重组合是显著的, 说明组合预测信息确实更多包含了PCR和LASSO的预测信息. 最后, 从组合权重方式来看, 不同的权重方式影响了各模型信息的融合程度. 表现最好的等权组合和DMSPE权重组合充分利用了PCR和LASSO的预测优势, 而其他权重方式BIC, SAIC和MMA则融合了表现较差的岭回归模型的信息, 降低了组合预测的整体表现. 因此, 研究模型平均估计找到最优权重是必要的.

5.2 不同经济周期的可预测性

根据Cochrane (1999), Campbell and Cochrane (1999)的研究, 投资者在经济衰退时更倾向于规避风险, 因此需要更高的风险溢价, 这就导致了股票超额收益的可预测性. 大多数的实证文献都支持这一论点. 实证研究表明, 经济指标在衰退期间比在扩张期间表现出更强的预测能力(Rapach et al. (2010), Henkel et al. (2011)).
经济扩张期(EXP)和经济衰退期(REC)的ROoS2计算方式如下:
ROoS,c2(%)=100×(1t=M+1TItc(rtr^t|t1model)2t=M+1TItc(rtr^t|t1bench)2)   c=EXP,REC,
(32)
其中示性变量ItEXP在第t月美国处于扩张期时取值为1, 否则为0. 示性变量ItREC在第t月美国处于衰退期月份是取值为1, 否则为0. 表 4报告了不同经济周期模型的样本外的ROoS2.
表4 不同经济周期的样本外ROoS2(%)
Panel A: 衰退期
降维数据模型 单变量模型组合 降维数据模型组合
PCR 8.06 等权 0.11 等权 7.38
RR 7.85 DMSPE权重(δ=1) 0.52 DMSPE权重(δ=1) 7.36
LASSO 7.90 DMSPE权重(δ=0.9) 0.41 DMSPE权重(δ=0.9) 7.33
VOL(1,9) 11.26 BMA权重 6.82 BMA权重 8.01
SAIC权重 6.82 SAIC权重 7.90
MMA权重 7.64 MMA权重 10.42
Panel B: 扩张期
降维数据模型 单变量模型组合 降维数据模型组合
PCR 4.98 等权 0.92 等权 5.50
RR 4.13 DMSPE权重(δ=1) 0.86 DMSPE权重(δ=1) 5.50
LASSO 4.56 DMSPE权重(δ=0.9) 0.87 DMSPE权重(δ=0.9) 5.54
VOL(1,9) 4.37 BMA权重 5.20 BMA权重 4.20
SAIC权重 5.20 SAIC权重 4.19
MMA权重 4.79 MMA权重 4.01
注: 分别表示CW检验在10%、5%和1%的水平上显著.
表 4中的结果表明, 除了VOL(1,9)单变量模型以及单变量模型的BMA, SAIC和MMA权重组合, 其它模型在经济扩张期的预测性能优于其在经济衰退期的预测性能. Panel A报告了在经济衰退期间模型的预测性能, 除了VOL(1,9)单变量模型, 表现最好的是单变量MMA权重组合模型, ROoS2达到了7.64%, 进一步证实了该模型在取得较高预测精度的同时保持了较为稳定的预测性能.
Panel B报告了在经济扩张期间模型的预测性能, 其中表现最好的是降维数据回归模型δ=0.9的DMSPE权重组合, 其ROoS2为5.54%, 同时在整个预测周期中其在降维数据回归模型组合中预测性能最优, 也表明了预测的稳定性.

5.3 不同的风险厌恶系数

表 2分析了风险厌恶程度γ=3时各模型的确定性等价回报, 为了探究该结果对风险厌恶系数的敏感程度, 考虑更低(γ=2)和更高(γ=4,6)的参数值. 各模型的确定性等价回报见表 5.
表5 不同风险厌恶系数的确定性等价回报, ΔCER(ann.)(%)
Panel A: γ=2
降维数据模型 单变量模型组合 降维数据模型组合
PCR 10.81 等权 0.70 等权 8.12
RR 7.15 DMSPE权重(δ=1) 0.39 DMSPE权重(δ=1) 8.09
LASSO 7.33 DMSPE权重(δ=0.9) 0.37 DMSPE权重(δ=0.9) 8.09
VOL(1,9) 8.29 BMA权重 4.70 BMA权重 7.55
SAIC权重 4.70 SAIC权重 7.46
MMA权重 5.42 MMA权重 7.98
Panel B: γ=4
降维数据模型 单变量模型组合 降维数据模型组合
PCR 11.34 等权 0.57 等权 8.56
RR 7.58 DMSPE权重(δ=1) 0.52 DMSPE权重(δ=1) 8.52
LASSO 7.69 DMSPE权重(δ=0.9) 0.49 DMSPE权重(δ=0.9) 8.52
VOL(1,9) 8.96 BMA权重 4.92 BMA权重 7.91
SAIC权重 4.92 SAIC权重 7.80
MMA权重 5.68 MMA权重 8.33
Panel C: γ=6
降维数据模型 单变量模型组合 降维数据模型组合
PCR 11.24 等权 0.51 等权 8.54
RR 7.47 DMSPE权重(δ=1) 0.46 DMSPE权重(δ=1) 8.49
LASSO 7.65 DMSPE权重(δ=0.9) 0.44 DMSPE权重(δ=0.9) 8.50
VOL(1,9) 8.30 BMA权重 4.76 BMA权重 7.89
SAIC权重 4.76 SAIC权重 7.77
MMA权重 5.41 MMA权重 8.31
表 5报告了模型在不同风险厌恶程度下, 预测期内的确定性等价回报CER. 与表 2类似, 无论γ如何变化, PCR模型都会取得较高的经济收益. 而且随着风险厌恶程度的增加, 各预测模型相对于基准模型的CER提升都会同步上升或者下降. 在风险厌恶程度γ=4时, PCR模型相对于基准模型而言CER提高了11.34%, 经济效益十分可观. 由此可见, 这些模型的经济效益随着风险厌恶程度的变化同步发生改变, 该参数不会影响实践过程中投资者对于模型的选择.

6 结论

随着大数据时代的到来, 在预测中对高维数据进行降维处理有助于提高预测效率. 不同降维方法处理信息的机理存在差异, 导致不同的预测准确度. 对此, 把组合思想从线性模型组合推广到降维方法组合, 本文提出一种降维数据预测再组合的方法. 利用一组包含136个宏观预测因子和技术指标因子的数据集, 研究了SP500股指超额收益的样本外预测表现, 降维数据预测再组合方法降低了不确定性问题带来的影响, 同时减少了降维过程中造成的信息损失. 研究结果表明, 降维数据的组合预测提高了单一降维方法的样本外预测性能, 表现最好的δ=0.9的DMSPE权重组合显著优于三种单一降维方法, 落后于单变量VOL(1,9)和单变量预测组合. 经济意义上的分析表明, 降维数据预测组合的确定性等价回报(CER)优于单变量组合预测, 落后于单变量VOL(1,9)预测和主成分分析预测. 综合结果说明降维数据预测组合均衡兼顾了统计上的预测精度和经济上的收益. 进一步对模型进行信息损失检验, 表明降维数据回归模型的组合相对于单一降维方法得到的预测结果而言保留了更有价值的预测信息.
降维数据预测组合是组合预测方法在大数据新场景的推广和应用. 本文仅选取了三种线性降维方法进行组合, 把其它降维方法和机器学习方法纳入组合中, 将是接下来深入研究的方向.

References

李程, 一类相关性指标优化IOWHA组合模型的预测比较[J]. 统计与决策, 2021, 37 (10): 28- 31.
Li C , Prediction Comparison of a Class of Correlation Index Optimized IOWHA Combination Models[J]. Statistics & Decision, 2021, 37 (10): 28- 31.
刘金培, 罗瑞, 陈华友, 陶志富, 非结构化数据驱动的混合二次分解汇率区间多尺度组合预测[J]. 中国管理科学, 2021,
Liu J P , Luo R , Chen H Y , Tao Z F , Unstructured Data-driven Multi-scale Exchange Rate Interval Combined Forecasting Based on Hybrid Secondary Decomposition[J]. Chinese Journal of Management Science, 2021,
马永开, 唐小我, 线性组合预测模型优化问题研究[J]. 系统工程理论与实践, 1998, 18 (9): 111- 115.
Ma Y K , Tang X W , Research on the Problem of Optimizing Linear Combination Forecasting Model[J]. Systems Engineering — Theory & Practice, 1998, 18 (9): 111- 115.
汪同三, 张涛, 组合预测: 理论、方法及应用[M]. 北京: 社会科学文献出版社, 2008.
Wang T S , Zhang T , Forecast Combination: Theory, Method and Application[M]. Beijing: Social Sciences Academic Press, 2008.
吴登生, 李建平, 孙晓蕾, 考虑模型相关性的组合预测过程中单项模型筛选研究[J]. 系统科学与数学, 2017, 37 (2): 449- 459.
Wu D S , Li J P , Sun X L , Single Model Screening for Combination Forecast Considering Model Correlation[J]. Journal of Systems Science and Mathematical Sciences, 2017, 37 (2): 449- 459.
袁宏俊, 杜康, 胡凌云, 基于三角模糊数相似度的区间型组合预测模型[J]. 统计与决策, 2019, 35 (6): 24- 29.
Yuan H J , Du K , Hu L Y , Hidden Markov Multivariate Linear Regression Model and Its Bayesian Estimation[J]. Statistics & Decision, 2019, 35 (6): 24- 29.
曾勇, 唐小我, 曹长修, 非负权重最优组合预测方法研究[J]. 管理工程学报, 1995, 9 (3): 153- 161.
Zeng Y , Tang X W , Cao C X , A Study of Optimal Combination Forecasting Methods of Nonnegative Weights[J]. Journal of Industrial Engineering and Engineering Management, 1995, 9 (3): 153- 161.
Bates J M , Granger C M J , The Combination of Forecasts[J]. Journal of the Operational Research Society, 1969, 20 (4): 451- 468.
Bossaerts P , Hillion P , Implementing Statistical Criteria to Select Return Forecasting Models: What Do We Learn?[J]. The Review of Financial Studies, 1999, 12 (2): 405- 428.
Çakmakli C , Van Dijk D , Getting the Most out of Macroeconomic Information for Predicting Excess Stock Returns[J]. International Journal of Forecasting, 2016, 32 (3): 650- 668.
Campbell J Y , Cochrane J H , By Force of Habit: A Consumption-Based Explanation of Aggregate Stock Market Behavior[J]. The Journal of Political Economy, 1999, 107 (2): 205- 251.
Campbell J Y , Thompson S B , Predicting Excess Stock Returns out of Sample: Can Anything Beat the Historical Average?[J]. The Review of Financial Studies, 2008, 21 (4): 1509- 1531.
Claeskens G , Magnus J R , Vasnev A L , Wang W , The Forecast Combination Puzzle: A Simple Theoretical Explanation[J]. International Journal of Forecasting, 2016, 32 (3): 754- 762.
Clark T E , West K D , Approximately Normal Tests for Equal Predictive Accuracy in Nested Models[J]. Journal of Econometrics, 2007, 138 (1): 291- 311.
Clemen R T , Combining Forecasts: A Review and Annotated Bibliography[J]. International Journal of Forecasting, 1989, 5 (4): 559- 581.
Cochrane J H , New Facts in Finance[J]. Economic Perspectives, 1999, 23 (3): 36- 58.
Davidson R , MacKinnon J , Econometric Theory and Methods[M]. New York: Oxford University Press, 2004.
Fama E F , The Behavior of Stock-Market Prices[J]. The Journal of Business, 1965, 38 (1): 34- 105.
Ferreira M A , Santa-Clara P , Forecasting Stock Market Returns: The Sum of the Parts is More Than the Whole[J]. Journal of Financial Economics, 2011, 100 (3): 514- 537.
Giovannelli A , Forecasting Stock Returns with Large Dimensional Factor Models[J]. Journal of Empirical Finance, 2021, 63, 252- 269.
Goyal A , Welch I , Predicting the Equity Premium with Dividend Ratios[J]. Management Science, 2003, 49 (5): 639- 654.
Granger C W J , Combining Forecasts — Twenty Years Later[J]. Journal of Forecasting, 1989, 8 (3): 167- 173.
Granger C W J , Ramanathan R , Improved Methods of Combining Forecast Accuracy[J]. Journal of Forecasting, 1984, 3 (2): 197- 204.
Gu S , Kelly B , Xiu D , Empirical Asset Pricing via Machine Learning[J]. Review of Financial Studies, 2020, 33 (5): 2223- 2273.
Hansen B E , Least Squares Model Averaging[J]. Econometrica, 2007, 75 (4): 1175- 1189.
Hansen B E , Least-squares Forecast Averaging[J]. Journal of Econometrics, 2008, 146 (2): 342- 350.
Hendry D F , Clements M P , Pooling of Forecasts[J]. The Econometrics Journal, 2004, 7 (1): 1- 31.
Henkel S J , Martin J S , Nardari F , Time-varying Short-horizon Predictability[J]. Journal of Financial Economics, 2011, 99 (3): 560- 580.
Leippold M , Wang Q , Zhou W , Machine Learning in the Chinese Stock Market[J]. Journal of Financial Economics, 2022, 145, 64- 82.
Liu C A , Kuo B S , Model Averaging in Predictive Regressions[J]. The Econometrics Journal, 2016, 19 (2): 203- 231.
McCracken M W , Ng S , FRED-MD: A Monthly Database for Macroeconomic Research[J]. Journal of Business & Economic Statistics, 2016, 34 (4): 574- 589.
Min C K , Zellner A , Bayesian and Non-bayesian Methods for Combining Models and Forecasts with Applications to Forecasting International Growth Rates[J]. Journal of Econometrics, 1993, 56 (1-2): 89- 118.
Neely C J , Rapach D E , Tu J , Zhou G , Forecasting the Equity Risk Premium: The Role of Technical Indicators[J]. Management Science, 2014, 60 (7): 1772- 1791.
Pan Z , Pettenuzzo D , Wang Y , Forecasting Stock Returns: A Predictor-constrained Approach[J]. Journal of Empirical Finance, 2020, 55, 200- 217.
Pesaran M H , Timmermann A , Predictability of Stock Returns: Robustness and Economic Significance[J]. The Journal of Finance, 1995, 50 (4): 1201- 1228.
Pettenuzzo D , Ravazzolo F , Optimal Portfolio Choice under Decision-Based Model Combinations[J]. Journal of Applied Econometrics, 2016, 31 (7): 1312- 1332.
Pettenuzzo D , Timmermann A , Valkanov R , Forecasting Stock Returns under Economic Constraints[J]. Journal of Financial Economics, 2014, 114 (3): 517- 553.
Ramsey J B , Tests for Specification Errors in Classical Linear Least-squares Regression Analysis[J]. Journal of the Royal Statistical Society B, 1969, 31 (2): 350- 371.
Rapach D E , Strauss J K , Zhou G , Out-of-sample Equity Premium Prediction: Combination Forecasts and Links to the Real Economy[J]. The Review of Financial Studies, 2010, 23 (2): 821- 862.
Stock J H , Watson M W , Combination Forecasts of Output Growth in a Seven-country Data Set[J]. Journal of Forecasting, 2004, 23 (6): 405- 430.
Stock J H , Watson M W , Forecasting with Many Predictors[J]. Handbook of Economic Forecasting, 2006, 1, 515- 554.
Timmermann A , Elusive Return Predictability[J]. International Journal of Forecasting, 2008, 24 (1): 1- 18.
Welch I , Goyal A , A Comprehensive Look at the Empirical Performance of Equity Premium Prediction[J]. The Review of Financial Studies, 2008, 21 (4): 1455- 1508.
Wright J H, (2003a). Bayesian Model Averaging and Exchange Rate Forecasting[R]. International Finance Discussion Papers: 779.
Wright J H, (2003b). Forecasting US Inflation by Bayesian Model Averaging[R]. International Finance Discussion Papers: 780.

Funding

National Natural Science Foundation of China(71531003)

RIGHTS & PERMISSIONS

All rights reserved, without authorization
PDF(818 KB)

959

Accesses

0

Citation

Detail

Sections
Recommended

/