Extraction of Implied Information from Options and Its Impact on the Stock Market: A Machine Learning Perspective

Jian CHEN, Guohao TANG, Jiaquan YAO

China Journal of Econometrics ›› 2024, Vol. 4 ›› Issue (1) : 231-247.

PDF(336 KB)
PDF(336 KB)
China Journal of Econometrics ›› 2024, Vol. 4 ›› Issue (1) : 231-247. DOI: 10.12012/CJoE2023-0010

Extraction of Implied Information from Options and Its Impact on the Stock Market: A Machine Learning Perspective

Author information +
History +

Abstract

How to extract implied information from options and study its impact on the returns of underlying stocks has always been a concern in both academia and industry. Existing research primarily relies on a single dimension: Either moneyness or maturity structure, to extract implied information, such as implied volatility, implied skewness, or implied tail risk, etc. How to extract implied information simultaneously from both dimensions, and how to extract common information factors from numerous pieces of information, are the focal points of this study. To address these issues, this paper utilizes a method combining principal component analysis with machine learning to extract implied information from the options volatility surface, and tests its predictability on the returns of the underlying stocks. Unlike traditional methods, PCA-LASSO can capture the time-varying nature of implied option information, while also refining common driving factors of different types of information, thus providing better predictive power for stock returns.

Key words

index option / option implied information / principle component analysis / machine learning

Cite this article

Download Citations
Jian CHEN , Guohao TANG , Jiaquan YAO. Extraction of Implied Information from Options and Its Impact on the Stock Market: A Machine Learning Perspective. China Journal of Econometrics, 2024, 4(1): 231-247 https://doi.org/10.12012/CJoE2023-0010

1 引言

期权隐含信息的提取, 及其对标的股票收益率的影响, 一直是学界和业界关心的重要问题之一. 期权价格反映了交易者对未来市场不确定性的预期, 因此其价格或者波动率曲面中隐含了标的股票未来价格变化的信息. 基于此, 过往文献利用短期平价期权(at-the-money option)估计股票市场的波动率风险, 如CBOE的波动率指数(VIX), 或者提取期权隐含的偏度风险(Chang, Christoffersen and Jacobs, 2013)、尾部下跌风险(陈坚等, 2019). 然而, 依赖某一个维度, 在值程度(moneyness)或期限结构(maturity), 只能提取单一的信息因子. 那么, 众多期权隐含信息中是否存在共同的驱动因素, 其动态时变性如何更好地捕捉, 这些问题依然是值得进一步研究的.
本文采用机器学习的方法来解决上述问题. 首先, 我们利用期权隐含波动率曲面的数据, 计算其月度改变量. 该改变量很大程度上反映了波动率曲面的月度动态变化, 并且其驱动因素与股票市场风险相关. 接下来, 我们利用主成分分析法(principal component analysis, PCA)计算不同在值程度和到期期限的期权隐含波动率的主成分因子(principal components, PC). PC因子衡量了期权隐含信息中的共同驱动部分, 这种方法已被金融风险领域广泛用于识别金融市场的潜在风险因素, 比如Ludvigson and Ng (2007)以及Neely, Rapach and Tu et al. (2014)的研究. 不同的PC因子可能反映了期权隐含风险的不同层面信息. 此外, 不同PC因子在不同时期的作用也不尽相同. 为了捕捉这种时变性, 同时找到不同PC因子的驱动因素, 我们采用了一种综合的带惩罚线性回归(least absolute shrinkage and selection operator, LASSO)的机器学习方法. 这种方法将主成分分析与机器学习相结合, 我们称之为PCA-LASSO法. 该方法通过最小化PC因子对股票市场收益率的预测误差, 从而确定最优的PC因子, 并且在每次迭代预测中, 不断通过学习调整最优PC因子. 因此, PCA-LASSO法可以动态地选取最能够反映金融市场状况的因子.
实证分析中, 我们采用Campbell and Thompson (2008)Goyal and Welch (2008)所提出的样本外R2(ROS2)来检验股票收益率的样本外预测能力. 结果显示, PCA-LASSO筛选出的风险因子在预测样本外股票收益率时, ROS2为4.57%, 且统计显著. 这表明PCA-LASSO预测产生的预测误差的均值方差(mean squared forecasting error, MSFE)小于不采用预测模型的历史平均基准模型. 作为比较, 我们还使用Zou and Hastie (2005)提出的弹性网络(elastic net, EN)方法来选择最优PC因子. 结果表明, EN最终几乎退化为LASSO (其超参数α接近于1). 在进一步的比较中, 我们将α设为0.5, 这意味着预测模型是一个简单的LASSO和岭回归(ridge regression)的等权组合(表示为LR). 结果显示, LR方法产生的样本外预测ROS2较PCA-LASSO方法没有显著提升, 仅为1.20%, 这再次表明了LR的预测能力主要来自LASSO方法.
我们进一步比较了PCA-LASSO与其它预测方法的异同, 并比较文献中提出的其它股票收益预测指标. 第一, 我们单独使用前5个PC因子或利用Bai and Ng (2002)的信息准则(information criteria, IC)选择最优的PC因子. 第二, 我们使用均值、削减均值和中位数组合方法提取PC因子的公共信息(Stock and Watson, 1998; Rapach et al., 2010). 第三, 我们还使用了Kelly and Pruitt (2013, 2015)的偏最小二乘方法(partial least square, PLS)从期权波动率中提取一个与股票收益率相关的公共因子, 这与Han et al. (2020)的研究方法类似, 他们使用PLS方法从个股期权中提取有效的预测信息. 第四, 我们采用了可替代的其它预测变量作为对比, 包括: Goyal and Welch (2008)的14个经济变量, An, Ang and Bali et al. (2014)的看涨期权和看跌期权隐含波动率, Xing, Zhang and Zhao (2010)提出的隐含偏度, Yan (2011)的隐含跳跃风险, 芝加哥期权交易所(CBOE)的波动率指数VIX, Bollerslev et al. (2009)提出的方差风险溢价, Kelly and Jiang (2014)的尾部风险, 以及Bollerslev, Todorov and Xu (2015)提出的尾部风险溢价. 结果显示, PCA-LASSO方法所选取的因子所产生的ROS2比其它方法或其它预测变量更大, 说明其具有更好的样本外预测能力. 此外, 我们采用了Harvey, Leybourne and Newbold (1998)的预测信息包含性检验, 发现PCA-LASSO的预测信息包含了其它预测方法和其它预测变量的信息, 表明LASSO所选择的因子完全捕捉了现有变量或使用传统预测模型所包含的信息.
我们进一步从资产配置的角度探讨了PCA-LASSO的预测能力能否带来潜在的经济价值. 我们根据Kandel and Stambaugh (1996)以及Campbell and Thompson (2008)的研究, 假设均值-方差投资者在风险资产(股票)和无风险资产直接进行资产配置. 股票的权重由预测模型所决定. 实证结果显示, 当风险厌恶系数(γ)为1、3、5时, PCA-LASSO预测产生的年化确定性等价收益(certainty equivalent return, CER)分别为6.19%、4.93%、3.27%; 产生的年化夏普比率分别为0.79、0.72、0.57. 说明PCA-LASSO产生的较强预测能力确实可以带来较高的经济价值.
最后, 我们对PCA-LASSO法提取的隐含信息进行经济含义的识别, 并且检验其预测能力的驱动因素. 我们选用LASSO提取出的三个被频繁使用的因子(MUF1、MUF2、MUF3), 并检验它们与未来经济状况的关系. 结果表明, MUF1与未来经济状况密切相关; 它的较高值预测了较低的经济不确定性、衰退可能性和金融压力, 以及较高的经济活跃性和经济增长. 因此, MUF1很可能捕捉到市场良好状态的信息. 尽管MUF2对经济状况的可预测性有限, 但其回归系数表现出与MUF1相似的迹象, 表明MUF2也能预测良好的市场状态. 相比之下, MUF3具有相反的回归斜率符号; MUF3取值较高时, 未来经济的不确定性也高, 衰退的可能性较大, 金融压力较大, 经济活动和增长缓慢. 因此, MUF3很可能包含了未来市场下行的信息.
本文是对期权隐含信息领域的重要补充. 期权隐含信息的提取与应用一直是金融工程乃至金融学的重要问题之一. 过往文献尝试从期权价格中提取股票收益率的可预测信息, 如Ang, Hodrick and Xing et al. (2006)Xing, Zhang and Zhao (2010)An, Ang and Bali et al. (2014)Chang, Christoffersen and Jacobs (2013)Bollerslev, Todorov and Xu (2015)Gao, Gao and Song (2018)等. 这些研究提出了很多期权隐含风险指标, 包括期权隐含波动率, 期权隐含偏度, 以及期权隐含尾部风险等. 这些指标大部分是从具有固定期限范围的期权价格的横截面来构造的, 或者从ATM期权中估计出波动率的时间序列. 与过往文献不同, 本文提出了主成分分析结合机器学习的方法, PCA-LASSO, 从整个期权波动曲面中提取隐含信息. 其优点是既能通过LASSO方法捕捉隐含信息的时变性, 又能通过PCA方法充分利用波动曲面的信息并从中找出共同驱动因子. 此外, 近年来也有学者尝试采用机器学习的方法研究期权隐含信息, 如Chen, Guo and Zhou (2022)研究了个股特征如何影响个股期权隐含波动率. 与此区别, 本文则是关注股指期权的隐含信息提取.
本文的内容如下: 第二部分介绍了本文所用的研究方法和数据. 第三部分是主要的实证分析结果. 第四部分尝试从经济机制上对进行分析和解释. 第五节是本文的结论.

2 方法和数据

2.1 提取期权隐含波动率综合信息的方法

主成分分析(principal component analysis, PCA)是一种普遍采用的降维方法, 在经济和金融领域有着广泛的应用(Baker and Wurgler, 2006; Ludvigson and Ng, 2007; Neely et al., 2014). PCA寻求从原始变量的线性组合中来捕捉公共变化的最大部分. 具体来说, 假设我们有一个月度隐含波动率的数据集X, 这是一个T×n矩阵, 其中Tn是观测值和变量的数量. 在不丧失一般性的前提下, 假设所有变量都被降低信息含量. X的奇异值分解(singular value decomposition, SVD)可以写成:
X=UDVT,
(1)
等式(1)中, Z=UD是为T×n主分量矩阵(PCs), V列为对应的主分量载荷. X中包含的公共信息可以用前q(qn)个主成分(PCs)表示, 对主成分的有效提取能保证在不损失原始数据集的主要变化下实现了对数据的降维.
根据Stock and Watson (2002), PCA估计的公共因子是一致的、渐进有效的, 且有较好的预测效果. 但PCA方法在应用中存在一个关键问题, 即如何确定主成分的有效数量. 监督机器学习方法提出了结合预测目标, 从协变量角度来估计主成分个数的思路. 因此, 本文应用LASSO方法来确定与股票预期收益相关的最优主成分数量.
传统意义上的LASSO方法, 是由Tibshirani (1996)为了缓解统计学习领域的过拟合困境而提出的. LASSO方法主要是在估计系数的最小化目标函数中加入一个惩罚项, 将一些与预期目标关系较小的变量前系数缩小到0, 防止对估计变量的过度拟合, 从而使预测更加准确. 简而言之, LASSO方法是在残差平方和上分配一个l1型惩罚项:
β^LASSO=argminβyXβ2+λβ1,
(2)
其中, λ是非负的惩罚项. 不同于岭回归对目标函数使用l2型惩罚项, LASSO可以将冗余变量的系数缩减到接近于0, 从而引入变量的稀疏性.
本文综合了主成分分析(PCA)和LASSO方法的优点, 使用了针对期权隐含波动率的机器学习方法, 即先通过对变量提取主成分, 再运用LASSO方法选取最优的主成分(PCA-LASSO). 这与稀疏主成分分析(Zou et al., 2006; Guan and Dy, 2009; Rapach and Zhou, 2019)不同, 该方法是在提取主成分之前对变量运用LASSO方法进行筛选. 针对本文关注的期权隐含信息, 首先, 根据不同在值程度和到期期限, 我们计算月度隐含波动率增量, 表示为Δ. 然后, 我们使用PCA方法提取Δ的主成分. 对这些主成分因子PC, 我们使用LASSO方法进行筛选, 选出最优因子. 具体如(3)所示:
Rt+1=XtβLASSO+εt+1,s.t.βLASSO1λ,
(3)
其中, Rt+1t+1时刻的股票市场收益, Xt包含Δ的有效主成分, λ是控制系数稀疏性的超参数. 我们注意到如果PC因子的某一主成分系数为0, 则认为这些主成分没有被LASSO选择.
本文还使用了综合主成分和弹性网络(PCA-EN)的方法, 其中弹性网络回归与LASSO回归有着相似的思想, 都在目标函数上增加惩罚项以避免过度参数化. 弹性网络的估计系数可以表示为:
β^=argminβ{12Rt+1Xtβ+λ[12(1α)β22+αβ1]},
(4)
其中, Rt+1是市场风险溢价, Xt是基于Δ截止到时间t的主成分, λα是调整参数, λ控制惩罚项系数的大小, α控制分配给LASSO惩罚项的权重. 由上述方程可以看出, EN回归结合了岭回归和LASSO的特点. 当α=1时, EN估计量退化为LASSO估计量. 但与LASSO不同的是, 系数的稀疏性不能在EN中实现, 这意味着只要α不等于1, EN就不能将主成分前的系数最终缩减为0.

2.2 数据与描述性统计

由于美国期权市场数据量较为充足, 样本期也比较长, 因此本文选用了标普500指数期权作为研究对象. 我们从Option Metrics获得1996年1月至2017年12月期间的月度波动率曲面数据. 由于Delta绝对值介于0.2和0.8之间的为深度实值和虚值期权, 且期限小于30天或大于一年的期权交易并不活跃, 因此我们没有选用这部分数据. 接下来, 我们计算隐含波动率的月度增量(Δ). 此外, 我们构建了标普500指数的月度超额收益率(RMkt).
表 1为数据的描述性统计. 其中, 我们把波动率按照期限和在值程度分为六组进行汇报: 到期日在60天以内的短期期权隐含波动率的增量(ΔS)、到期日在60天到152天之间的中期期权隐含波动率的增量(ΔM)、到期日在152天以上的长期期权隐含波动率的增量(ΔL)、OTM期权隐含波动率的增量(ΔOTM)、ATM期权隐含波动率的增量(ΔATM)、ITM隐含波动率的增量(ΔITM)1. 波动率均值为0.01至0.13. 表 1中还汇报了标准普尔500指数的超额收益率(RMkt)的均值是0.33%, 无条件标准差为4.33%.
表1 描述性统计
观测值 均值 标准差 最小值 最大值 偏度 峰度
RMkt(%) 263 0.33 4.33 -18.63 10.23 -0.84 1.67
ΔS 13728 0.13 7.45 0.05 0.68 1.46 3.64
ΔM 20514 0.08 2.89 -0.13 0.21 0.84 5.82
ΔL 20514 0.06 2.19 -0.09 0.19 0.89 6.07
ΔOTM 21040 0.07 2.91 -0.19 0.25 0.82 7.99
ΔATM 12624 0.02 2.83 -0.16 0.19 0.66 6.09
ΔITM 21040 0.01 3.09 -0.19 0.24 0.73 6.29
1这里的分组(共6组)只是为了进行描述性统计分析. 实证中, 我们对波动率曲面进行了更加细致地分组, 以便于应用LASSO.
图 1展示了从1996年1月到2017年12月期间的隐含波动率提取的前三个PC因子(PC1~PC3)的时间序列图, 以及标普500指数超额收益的时间序列图. 从图中可以看出, 收益率在1998年和2008年出现了大幅下跌, 分别对应于长期资本管理公司(LTCM)的倒闭和2008年的金融危机. 在这两种情景下, 期权隐含波动率的三个因子PC1至PC3都急剧上升, 说明标的股票的波动率也显著增大.
图1 标普500指数收益率与隐含波动率的主成分因子(PC1~PC3)

Full size|PPT slide

3 实证结果

3.1 样本外预测

由于样本外预测更符合实际投资的情形, 因此被广泛应用于预测能力的检验. 为了评估股票收益率的可预测性, 我们参考Campbell and Thompson (2008)以及Goyal and Welch (2008), 通过ROS2统计量来衡量样本外预测能力:
ROS2=1t=nT1(Rt+1MktR^t+1Mkt)2t=nT1(Rt+1MktR¯t+1Mkt)2,
(5)
其中, Rt+1Mkt是真实的股票收益, R^t+1Mkt是预测模型的样本外预测收益, R¯t+1Mkt是以历史平均收益作为预测基准. ROS2通过均方预测误差(MSFE)来衡量预测模型相对于历史平均预测的改进. ROS2>0时, 模型预测的MSFE小于历史平均预测, 说明预测能力更强. 我们通过Clark and West (2007)的调整后MSFE来检验ROS2的统计显著性. 我们将整个样本分为1996年1月至2015年12月的训练期和2016年1月至2017年12月的样本外检验期.
表 2显示了样本外预测结果. 我们注意到PCA-LASSO的ROS2统计上显著且为正, 4.57%. 这表明该模型预测产生的均方预测误差小于历史平均的基准模型. 更重要的是, ROS2的数值较大, 具有较高的经济价值. 正如Campbell and Thompson (2008)所提出的, 鉴于股票市场的月度收益存在很大的不可预测成分, 因此, 月度ROS2值高于0.5% 就可以产生显著的经济价值. 我们把这个分析留在3.4节中. 我们发现PCA-EN也产生了很强的预测能力, 其ROS2为4.56%, 这个值接近于PCA-LASSO的预测结果. 为了进一步说明其中原因, 我们发现等式(4)中的α接近于1, 这意味着EN几乎退化为LASSO. 此外, 如果人为地将α设定为0.5, 此时预测模型变为LASSO和Ridge的等权组合模型(LR). 表 2的结果显示, 结合PCA和LR (PCA-LR)所产生的样本外预测能力有限, ROS2较小, 为1.2%. 因此, 这有助于说明EN的预测能力主要来自于LASSO部分.
表2 样本外预测结果
ROS2(%) MSFE-adj p-value
PCA-LASSO 4.57*** 3.13 0.01
PCA-EN 4.56*** 3.10 0.01
PCA-LR 1.20* 1.79 0.07
注: *, **, ***分别表示10%, 5%, 1% 的统计显著性.后表同
接下来, 图 2展示了LASSO在每次递归预测中PC因子被选用的频率. 上方的直方图显示了所有PC因子的结果. 我们观察到, 选择频率通常随PC因子的解释力而衰减. 前20个PC因子被LASSO选用的频率较高. 这表明相对于其它因子, 前20个PC因子可能包含更丰富的股票收益率的信息. 下方是前20个PC因子的被选用频率直方图. 可以看出PC因子的选择频率与解释力之间的关系并不是严格单调的. 我们发现前两个PC因子并不是LASSO使用最多的因子. 这表明, 能够在很大程度上解释期权隐含波动率动态变化的因子并不一定具备最强的未来股票收益率预测能力, 这与Kelly and Pruitt (2013, 2015)的观点是一致.因此, 相对于人为使用解释力最强的PC因子, 利用LASSO根据预测能力来选择最优因子, 可以更好地提升期权隐含信息对标的股票的预测能力.
图2 PC因子在逐月预测中的被选用频率

Full size|PPT slide

3.2 与其它预测方法的比较

我们的研究结果显示, LASSO通过最优地选择期权隐含波动率的PC因子, 具有较好的样本外预测能力. 我们接下来探讨其它的预测方法是否也能得到较强的预测能力. 第一, 我们利用从波动曲面中提取的前五个PC因子(PC1~PC5)直接预测未来股票收益率. 第二, 利用Bai and Ng (2002)的信息准则(IC)选择最优PC因子. 第三, 我们采用了Rapach, Strauss and Zhou (2010)提出的均值、中位数、削减均值组合方法(分别表示为Mean、Median、Trim mean), 对PC因子进行组合预测. 第四, 我们采用偏最小二乘法(PLS)对PC因子进行信息加总. PLS构造方法参见附录A. 表 3给出了这些可替代方法的样本外预测结果.
表3 不同预测方法收益预测结果的比较
ROS2(%) MSFE-adj p-value ΔROS2(%)
PC1 -1.69 0.68 0.25 6.26
PC2 -3.62 0.65 0.26 8.19
PC3 -2.32 0.87 0.19 6.89
PC4 -1.00 1.07 0.14 5.57
PC5 -0.59 1.13 0.13 5.16
IC 1.55 1.21 0.11 3.57
Mean 1.72*** 2.89 0.01 2.85
Trim mean 1.21*** 1.84 0.04 3.36
Median 1.19** 1.88 0.03 3.38
PLS -0.54 0.85 0.20 5.11
表 3的结果显示, 基于单一的前5个PC因子的样本外ROS2为负, 表明基于单一PC因子的回归模型未能超过历史平均的基准模型. 利用Bai and Ng (2002)信息准则选择最优PC因子可以提高预测效果, ROS2提升为1.55%. 当使用组合预测方法时, 回归模型产生正的、显著的ROS2. 其中, 均值组合的ROS2最高, 为1.72%; 其次是削减均值组合, 为1.21%; 中位数组合相对较小, 为1.19%. 最后, 偏最小二乘法(PLS)ROS2为负, 尽管它比单独使用PC因子要稍微好一些. 因此, 相对于PCA-LASSO, 采用现有文献中的预测方法来研究期权隐含信息对标的股票收益率预测时, 样本外预测能力十分有限. 为了更直观对比, 在表 3最右侧一列, 我们计算了PCA-LASSO的ROS2与其它预测方法ROS2的差值, 记为ΔROS2. 我们可以看出, ΔROS2变化由2.85% 增至8.19%, 说明与现有方法对比, LASSO极大地提高了股票收益率的可预测性.

3.3 与现有预测变量的对比

接下来, 我们将比较PCA-LASSO与现有研究提出的预测变量之间的差异. 首先, 我们考虑Goyal and Welch (2008)的14个经济变量. 详细的变量描述请参见附录B. 其次, 我们使用了8个文献中提出的期权隐含预测指标: An, Ang and Bali et al. (2014)所提出的看涨期权和看跌期权隐含波动率(ΔCIVΔPIV), Xing, Zhang and Zhao (2010)的隐含波动率偏度(Ⅳ Skew), Yan (2011)构造的隐含波动率斜率(Ⅳ slope), CBOE的VIX指数, Bollerslev et al. (2009)的方差风险溢价(VRP), Kelly and Jiang (2014)提出的尾部风险(TR), Bollerslev, Todorov and Xu (2015)的尾部风险溢价(TRP).
表 4给出了这些变量的样本外预测结果. 我们观察到, 在14个经济变量中, 只有期限利差(term spread, TMS)和股票收益波动性(stock return variance, SVAR)能产生正的ROS2, 但它们均在统计上不显著. 对于现有期权隐含指标, VIX, VRP, TR和TRP可以产生正的ROS2, 数值范围从0.42%(VIX)到1.76% (TRP). 在(5)和(10)列中, 我们给出了ΔROS2, 其数值范围为2.83%~6.61%, 这表明PCA-LASSO选取的公共因子相较于其它变量具有较强的预测能力.
表4 与其它预测变量的比较
(1) (2)
ROS2(%)
(3)
MSFE-adj
(4)
p-value
(5)
ΔROS2(%)
(6) (7)
ROS2(%)
(8)
MSFE-adj
(9)
p-value
(10)
ΔROS2(%)
DP -0.05* 1.28 0.10 4.62 DFY -0.04 -0.23 0.59 4.61
DY -0.37* 1.48 0.07 4.94 DFR -0.01 0.31 0.38 4.58
EP -1.88 0.58 0.28 6.45 INFL -0.09 0.00 0.50 4.66
DE -2.04 -1.88 0.97 6.61 ΔCIV -1.53 -0.25 0.40 6.10
BM -1.74 0.50 0.31 6.31 ΔPIV -1.05 -0.01 0.50 5.62
SVAR 0.32 0.95 0.17 4.25 Ⅳ Skew -0.73* -1.28 0.10 5.30
NTIS -0.91 0.23 0.41 5.48 Ⅳ Slope -0.63 -0.68 0.25 5.20
TLB -0.01 1.34 0.09 4.58 VIX 0.42 0.97 0.17 4.15
LTY -1.17 1.17 0.12 5.74 VRP 1.74 1.10 0.14 2.83
LTR -0.08 0.84 0.20 4.65 TR 1.42 0.93 0.18 3.15
TMS 0.06 0.99 0.16 4.51 TRP 1.76* 1.27 0.10 2.81
为了进一步验证PCA-LASSO的良好的预测效果, 我们使用Harvey, Leybourne and Newbold (1998)提出的预测包含性检验(forecast encompassing test). 它是为了检验原假设: 模型1包含了模型2的预测信息, 备择假设为前者不包含后者. 令et+1=(u^1,t+1u^2,t+1)u^1,t+1, 其中u^1,t+1=Rt+1MktR^1,t+1Mkt, u^2,t+1=Rt+1MktR^2,t+1Mkt, R1,t+1MktR2,t+1Mkt分别是模型1和模型2对未来股票市场超额收益的预测. 检验统计量为:
HLN=Tn2Tn1[V^(e¯)1/2]e¯,
(6)
其中, e¯=(1T1n)t=nT1et+1, 和V^(e¯)=(T1n)2t=nT1(et+1e¯)2, HLN遵循t分布, 具有Tn2个自由度. 当HLN统计量大于t分布的临界值时, 拒绝原假设. 我们采用这种方法来检验PCA-LASSO的预测是否包含了其它收益预测变量或预测方法的信息.
表 5显示了预测包含性检验的p值. 我们发现所有的p值都小于10%, 说明采用PCA-LASSO模型的预测包含了其它预测方法和变量的预测信息, 同时也说明PCA-LASSO很好地综合了期权隐含波动率曲面中的有效预测信息.
表5 预测包含性检验
(1)
预测变量
(2)
p-value
(3)
预测变量
(4)
p-value
(5)
预测变量
(6)
p-value
DP 0.00 TMS 0.00 TRP 0.08
DY 0.00 DFY 0.03 PC1 0.00
EP 0.00 DFR 0.00 PC2 0.00
DE 0.02 INFL 0.00 PC3 0.00
BM 0.00 ΔCIV 0.03 PC4 0.00
SVAR 0.03 ΔPIV 0.03 PC5 0.00
NTIS 0.00 Ⅳ Skew 0.00 PLS 0.00
TLB 0.00 Ⅳ Slope 0.00 Mean 0.07
LTY 0.00 VIX 0.00 Median 0.03
LTR 0.00 TR 0.03 Trim Mean 0.00

3.4 资产配置分析

前文的实证结果显示, 应用PCA-LASSO模型提取期权隐含信息可以显著地预测未来股票收益率. 接下来, 我们进一步检验这种预测能力的经济价值. 参考Kandel and Stambaugh (1996)Campbell and Thompson (2008)Ferreira and Santa-Clara (2011)等文献, 我们从资产配置的角度来评估股票收益率预测的经济价值. 考虑一个均值-方差投资者, 他在风险股票和无风险资产之间进行资产配置. 投资者在每个月底重新调整投资组合中风险资产权重(wt)与无风险资产的权重(1wt),
wt=R^t+1Mktγσ^t+12,
(7)
其中, γ是风险厌恶系数, R^t+1Mkt是样本外股票超额收益率的预测值, σ^t+12是股票收益方差的预测值. 我们假设投资者的风险厌恶系数为1、3、5. 投资者投资无风险资产的比例为1wt. 在t+1时刻实现的资产组合回报为:
Rt+1p=wtRt+1Mkt+Rt+1f,
(8)
其中, Rt+1f为无风险资产的收益率. 按照Campbell and Thompson (2008), 我们假设投资者使用一个三年的滚动历史窗口来估计未来股票收益的方差. 此外, 我们限制wt在0和1.5之间, 从而假设投资人不允许做空和最多拥有50% 的杠杆. 为了评估投资组合Rt+1p的表现, 我们计算该组合的确定性等价收益(CER):
CER=μ^P12γσ^p2,
(9)
其中, μ^Pσ^p2代表着投资组合回报的均值和方差. CER增量(Δ)是预测模型产生的CER与历史平均基准模型CER的差值. 我们将这个差值乘以12后, 年化的CER增量可以解释为投资者为了获得预测模型而愿意支付的基金管理费. 此外, 我们计算投资组合的夏普比率(Sharp ratio, SR)来评估投资组合的表现.
表 6显示了PCA-LASSO和PCA-EN的资产配置结果. 我们发现, 两个方法均产生了较大的投资收益. 当面板A中的风险厌恶系数为1时, PCA-LASSO的CER增量(Δ)为6.19%, 这意味着风险厌恶度为1的均值-方差投资者愿意支付619个基点的年度基金管理费用, 从而采用基于PCA-LASSO预测模型的择时策略. 此外, PCA-LASSO构建的投资组合的夏普比率较大, 为0.79. 作为对比, 市场组合的夏普比率为0.26. 因此, 基于PCA-LASSO的市场择时策略比单纯的买入持有策略(buy-and-hold)能产生更大的投资收益. 在面板B和C中, 风险厌恶系数分别为3和5. 结果类似, PCA-LASSO的CER增量(Δ)和夏普比率仍然较大. PCA-EN预测模型的资产配置结果与PCA-LASSO相似, 但其CER增量(Δ)和夏普比率的数值略小于PCA-LASSO.
表6 资产配置结果
面板A: γ=1 面板B: γ=3 面板C: γ=5
Δ(%) SR Δ(%) SR Δ(%) SR
PCA-LASSO 6.19 0.79 4.93 0.72 3.27 0.57
PCA-EN 6.16 0.76 4.49 0.73 3.05 0.55

4 经济解释

本文发现使用PCA-LASSO法可以从期权隐含波动率中提取有效的信息, 并且能较好地预测未来股票市场收益率. 在本节中, 我们将探讨其中的经济机制, 并深入研究提取信息的经济含义.
Merton (1973)在其对ICAPM的开创性研究中指出, 市场投资组合的预期超额收益与其条件方差, 以及超额市场收益与影响投资机会集的状态变量之间的条件协方差有关:
E(RMkt,t|Ωt1)=βVar(RMkt,t|Ωt1)+γCov(RMkt,Xt|Ωt1),
(10)
其中, RMkt,t为市场投资组合的超额收益; Xt是市场状态变量; Var(RMkt,t|Ωt1)Cov(RMkt,Xt|Ωt1)分别是t时期市场超额收益的条件方差和超额市场收益的条件协方差.等式(10)指出, 预期收益补偿投资者承担的市场风险, 以及由于未来经济状态不确定导致的投资机会集变化的风险. Ang, Hodrick and Xing et al. (2006), Chang, Christoffersen and Jacobs (2013)分别使用期权隐含波动率指数和期权隐含偏度作为投资机会集的代理变量. 期权隐含波动率和偏度的增加表明股市的不确定性增加, 它们可能与经济不景气导致的投资机会集恶化有关.
此外, Cochrane (2005)认为, 股票市场收益率的预测可能与宏观经济的不确定性相关联. Rapach, Strauss and Zhou (2010), Allen, Bali and Tang (2012), Drechsler (2013), Jurado, Ludvigson and Ng (2015), Bali, Brown and Tang (2017)提供了实证证据. 因此, 驱动股票价格变化的主要因素是未来经济状态的不确定性, 其可以直接影响未来股票收益, 也可以通过影响投资机会集作用于股票收益.
由于期权是一种前瞻性的合约, 因此其价格反映了购买者对未来经济不确定性的预期. 因此, 我们推测期权隐含信息的预测能力可能来自于其包含了未来经济状况的信息. 为了验证这个假设, 我们采用了10个衡量经济状况的代理指标, 包括Jurado, Ludvigson and Ng (2015)以及Ludvigson and Ng (2007)所提出的宏观经济不确定性(macro uncertainty, MU), 实体经济不确定性(real uncertainty, RU), 金融市场不确定性(financial uncertainty, FU); Aruoba, Diebold and Scotti (2009)提出的商业稳定指数(aruboba-diebold-scotti index, ADSI), 芝加哥经济活跃度指数(Chicago FED national activity index, CFNAI), Chauvet and Piger (2008)提出的经济衰退概率(smoothed probability of recession, SRP), 堪萨斯金融压力指数(Kansas city financial stress index, KCFSI), 工业生产增长率(industrial production growth, IPG), 雇佣支出增长率(payroll growth, PG), 实际GDP增长率(growth rate of real gross domestic product, GDPG). 然后, 我们检验被LASSO选用频率最高的三个因子(MUF1、MUF2、MUF3), 是否包含了未来经济状态的信息. 回归模型为:
ΔYt+1=α+βMUFt+εt+1,
(11)
其中, ΔYt+1代表着经济状况的变化, MUFt为LASSO选用频率最高的三个因子(分别是MUF1、MUF2、MUF3).
表 7汇报了模型(11)的回归结果. 在面板A中, 我们发现MUFt可以显著地预测大部分经济状态变量. RU、MU、FU、SRP、KCFSI的回归斜率为负, 其它指标的回归系数为正. 这表明, PCA-LASSO在预测股票收益时最常用的隐含信息因子(MUF1)包含了未来经济状况的信息; MUF1较高时, 说明当前的经济状态具有较低的不确定性, 以及较低的衰退可能性和金融压力, 同时预示着未来较高的经济活跃度和经济增长. 因此, MUF1很可能反映了市场良好状态的相关信息. 在面板B中, 除了IPG和PRG, MUF2的回归斜率与面板A中报告的结果相似, 这表明MUF2也预测了良好的市场状态. 但是, 它的预测能力有限; 只有GDPG的回归斜率显著.
表7 经济状态关联分析
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
RU MU FU ADSI CFNAI SRP KCFSI IPG PG GDPG
面板 A: MUF1 预测结果
β -0.32*** -0.31** -0.23** 0.29*** 0.24** -0.23** -0.33** 0.2 0.16** 0.26**
[-2.60] [-2.57] [-1.97] [2.80] [2.40] [-2.10] [-2.10] [1.10] [1.96] [2.01]
R2 10.63 9.94 5.65 8.43 6.15 5.82 10.98 6.44 0.52 10.10
面板 B: MUF2 预测结果
β -0.16 -0.13 -0.06 0.15 0.11 -0.16 -0.17 -0.03 -0.07 0.25***
[-1.20] [-1.00] [-0.41] [1.50] [1.10] [-1.60] [-1.10] [-0.28] [-0.68] [3.20]
R2 2.61 1.93 0.34 2.24 1.17 2.43 2.74 0.07 0.63 6.72
面板 C: MUF3 预测结果
β 0.13*** 0.11** 0.16*** -0.06 -0.06 0.16* 0.10 -0.03 0.01 -0.06
[2.80] [2.00] [3.10] [-0.72] [-0.83] [1.70] [1.60] [-0.29] [0.41] [-0.62]
R2 1.65 1.35 2.69 0.38 0.42 2.60 0.98 0.08 0.01 0.37
相比之下, 在面板C显示的结果中, 我们发现MUF3的回归斜率有相反的符号. RU、MU、FU、SRP、KCFSI的系数为正, ADSI、CFNAI、IPG、GDPG则为负. 说明, 较高的MUF3取值反映了未来经济的高不确定性、高衰退可能和金融压力, 以及预示着未来较低的经济活跃度和经济增长. 因此, MUF3可能包含着市场下行的隐含信息. 综上所述, 我们从表 7得出的结果显示, 期权隐含信息与未来经济状况的有关, 因此有助于解释其对股票收益率的预测能力.

5 结论

本文通过主成分分析结合机器学习的方法, 从期权隐含波动率曲面中提取隐含信息, 并检验其对标的股票收益率的预测能力. 我们首先计算期权隐含波动率的月度增量, 从而捕捉波动率曲面的动态变化. 其次, 我们计算这些增量的主成分因子, 来反映波动率曲面的驱动因素. 最后, 我们采用LASSO方法, 结合每个因子对未来股票收益率的预测能力来挑选最优因子. 这种主成分分析结合LASSO的方法有助于捕捉到期权波动率曲面的公共驱动因素, 及其时变性. 实证结果显示, LASSO模型选出的最优因子对标的股票收益率具有较强的预测能力. 并且, 这种方法优于其它因子选择方法、股票预测方法、以及其它股票预测变量的预测能力. 同时, 这种较强的预测能力在资产配置中可以产生较大的经济价值.
我们进一步探讨了期权隐含信息的经济含义. 我们发现LASSO选取的因子与未来的经济状况具有较强的相关性. 其中, 被选用频率排名第一和第二的两个因子所包含的信息与未来良好的市场状态有关, 而排名第三的因子更多地包含了未来经济下行的信息. 本文所提出的新的风险识别和构造方法, 是对风险管理和资产定价领域的重要补充. 本文的研究还存在一些不足之处, 例如目前只采用了比较简单的机器学习方法LASSO, 未来可以考虑PC因子与其它方法的结合, 如随机森林或者神经网络.

附录A 偏最小二乘法(PLS)

偏最小二乘法可以由以下两步回归方法实现. 第一步是时间序列回归, 即使用每一个波动率新息(Δi)对于未来已实现股票收益Rt+1做回归:
Δi,t=π0+πiRt+1+ui,t.
(12)
第一步时序回归(A1)式中πi的系数描述了Δi如何依赖于未来股票收益. 第二步, 在每个月t做横截面回归,
Δi,t=ct+FtPLSπ^i+vi,t,
(13)
其中, π^i是公式(A1)中πi的估计. FtPLS即为使用PLS方法提出的期权隐含波动率指标.

附录B 经济变量定义

以下是Goyal and Welch (2008)提出的14个经济变量的定义:
1. 股利价格比(dividend-price ratio, DP): 标普500指数总股利的对数与股票价格(标普500指数)对数之差. 总股利由过去12个月的股利移动加总得到.
2. 股息率(dividend yield, DY): 总股利的对数与滞后股票价格的对数之差.
3. 盈余价格比(earnings-price ratio, EP): 标普500指数总盈余的对数与股票价格对数之差. 总盈余由过去12个月的盈余移动加总得到.
4. 股利支付率(dividend-payout ratio, DE): 总股利的对数与总盈余的对数之差.
5. 股票波动率方差(stock return variance, SVAR): 标普500指数日度收益率平方和.
6. 账面市值比(book-to-market ratio, BM): 道琼斯工业平均指数的账面价值与市场价值之比. (注: 在后续实证分析中, 我们使用账面市值比的对数形式.)
7. 净权益增加(net equity expansion, NITS): 纽约证交所过去12个月新股发行量的移动加总与年底总市值之比.
8. 短期国债利率(treasury bill rate, TBL): 三个月期国债(二级市场)利率.
9. 长期收益率(long-term yield, LTY): 长期国债利率.
10. 长期回报率(long-term return, LTR): 长期国债的回报率.
11. 期限利差(term spread, TMS): 长期国债利率与国债利率之差.
12. 违约利差(default yield spread, DFY): BAA- 级与AAA- 级公司债券利率之差.
13. 违约回报率差(default return spread, DFR): 长期公司债券利率与长期国债利率之差.
14. 通货膨胀率(inflation, INFL): 由城市居民消费者价格指数(CPI)计算; 我们在回归中使用滞后2个月的通货膨胀率来解决CPI公布的延迟.

附录C 经济状况衡量指标

以下是本文采用的10个经济状况的代理指标:
1. Jurado, Ludvigson and Ng (2015)提出的宏观不确定性(MU). MU在数据丰富的环境中构建, 它刻画了实际经济活动中135个时间序列宏观经济变量的预测不确定性, 如实际产出和收入、就业和工时等.
2. Ludvigson, Ma and Ng (2021)提出的实际经济不确定性(RU), 该指标是在MU基础上, 只采用实际宏观经济变量(而不是名义经济变量)计算的实际经济不确定性指标.
3. Ludvigson, Ma and Ng (2021)提出的金融不确定性(FU). 与MU的构造相似, FU由上市公司的148个财务指标组成, 计算了金融市场的不确定性.
4. Aruboba-Diebold-Scotti指数(ADSI), 由Aruoba, Diebold and Scotti (2009)构建. ADS指数是为了高频跟踪真实商业状况而设计的. 基于不同频率(经季节调整)的经济指标, 运用混频动态因子模型混合高频和低频数据. 数据来自费城联邦储备银行.
5. 芝加哥全国经济活动指数(CFNAI). CFNAI是一个用于评估整体经济活动的月度指数. 它取85个月度经济指标的加权平均值, 其均值为0, 标准差为1. 数据来自芝加哥联邦储备银行.
6. Chauvet and Piger (2008)提出的平滑衰退概率(SRP). 平滑衰退概率利用马可夫机制转换动态因子模型, 使用四项月度经济数据构建. 数据来自圣路易斯联邦储备银行.
7. 堪萨斯城金融压力指数(KCFSI), 由Hakkio and Keeton (2009)提出. KCFSI为正数表示金融压力高于长期平均水平, 为负值表示金融压力低于长期平均水平. 数据来自堪萨斯城联邦储备银行.
8. 工业生产增长(IPG). 数据来自圣路易斯联邦储备银行.
9. 雇佣支出增长率(PG). 该指标计算了企业在雇佣员工上花费的增长率, 其变化侧面反映了宏观经济潜在的失业情况. 数据来自圣路易斯联邦储备银行.
10. 实际国内生产总值(GDP)增长率. 由于GDP是季度数据, 我们首先计算季度GDP增长率, 再利用线性插值法转换为月度频率数据. 季度GDP数据来自圣路易斯联邦储备银行.

References

陈坚, 张轶凡, 洪集民, 期权隐含尾部风险及其对股票收益率的预测[J]. 管理科学学报, 2019, 22 (10): 72- 81.
Chen J , Zhang Y , Hong J , Option Implied Tail Risk and Predictability of Stock Return[J]. Journal of Management Science in China, 2019, 22 (10): 72- 81.
Allen L , Bali T G , Tang Y , Does Systemic Risk in the Financial Sector Predict Future Economic Downturns?[J]. Review of Financial Studies, 2012, 25 (10): 3000- 3036.
An B J , Ang A , Bali T G , Cakici N , The Joint Cross-section of Stocks and Options[J]. The Journal of Finance, 2014, 69 (5): 2279- 2337.
Ang A , Hodrick R , Xing Y , Zhang X , The Cross-section of Volatility and Expected Returns[J]. Journal of Finance, 2006, 61, 259- 299.
Aruoba S B , Diebold F X , Scotti C , Real-time Measurement of Business Conditions[J]. Journal of Business & Economic Statistics, 2009, 27 (4): 417- 427.
Bai J , Ng S , Determining the Number of Factors in Approximate Factor Models[J]. Econometrica, 2002, 70 (1): 191- 221.
Baker M , Wurgler J , Investor Sentiment and the Cross-section of Stock Returns[J]. The Journal of Finance, 2006, 61 (4): 1645- 1680.
Bali T G , Brown S J , Tang Y , Is Economic Uncertainty Priced in the Cross-section of Stock Returns?[J]. Journal of Financial Economics, 2017, 126 (3): 471- 489.
Bollerslev T , Tauchen G , Zhou H , Expected Stock Returns and Variance Risk Premia[J]. The Review of Financial Studies, 2009, 22 (11): 4463- 4492.
Bollerslev T , Todorov V , Xu L , Tail Risk Premia and Return Predictability[J]. Journal of Financial Economics, 2015, 118 (1): 113- 134.
Campbell J Y , Thompson S B , Predicting Excess Stock Returns Out of Sample: Can Anything Beat the Historical Average?[J]. Review of Financial Studies, 2008, 21 (4): 1509- 1531.
Chang B Y , Christoffersen P , Jacobs K , Market Skewness Risk and the Cross Section of Stock Returns[J]. Journal of Financial Economics, 2013, 107, 46- 68.
Chauvet M , Piger J , A Comparison of the Real-time Performance of Business Cycle Dating Methods[J]. Journal of Business & Economic Statistics, 2008, 26 (1): 42- 49.
Chen D , Guo B , Zhou G , Firm Fundamentals and the cross Section of Implied Volatility Shapes[J]. Journal of Financial Markets, 2023, 63, 100771.
Clark T E , West K D , Approximately Normal Tests for Equal Predictive Accuracy in Nested Models[J]. Journal of Econometrics, 2007, 138 (1): 291- 311.
Cochrane J H , Financial Markets and the Real Economy[J]. Foundations and Trends® in Finance, 2005, 1 (1): 1- 101.
Drechsler I , Uncertainty, Time-varying Fear, and Asset Prices[J]. The Journal of Finance, 2013, 68 (5): 1843- 1889.
Ferreira M A , Santa-Clara P , Forecasting Stock Market Returns: The Sum of the Parts is More than the Whole[J]. Journal of Financial Economics, 2011, 100 (3): 514- 537.
Gao G , Gao P , Song Z , Do Hedge Funds Exploit Rare Disaster Concerns?[J]. Review of Financial Studies, 2018, 31, 2650- 2692.
Goyal A , Welch I , A Comprehensive Look at the Empirical Performance of Equity Premium Prediction[J]. The Review of Financial Studies, 2008, 21 (4): 1455- 1508.
Guan Y, Dy J, (2009). Sparse Probabilistic Principal Component Analysis[C]// Proceedings of the Twelth International Conference on Artificial Intelligence and Statistics. PMLR: 185–192.
Hakkio C S , Keeton W R , Financial Stress: What is it, How Can it be Measured, and Why Does it Matter?[J]. Economic Review, 2009, 94 (2): 5- 50.
Han Y, Liu F, Tang X, (2020). The Information Content of the Implied Volatility Surface: Can Option Prices Predict Jumps?[R]. Working Paper.
Harvey D I , Leybourne S J , Newbold P , Tests for Forecast Encompassing[J]. Journal of Business & Economic Statistics, 1998, 16 (2): 254- 259.
Jurado K , Ludvigson S C , Ng S , Measuring Uncertainty[J]. American Economic Review, 2015, 105 (3): 1177- 1216.
Kandel S , Stambaugh R F , On the Predictability of Stock Returns: An Asset-allocation Perspective[J]. The Journal of Finance, 1996, 51 (2): 385- 424.
Kelly B , Jiang H , Tail Risk and Asset Prices[J]. The Review of Financial Studies, 2014, 27 (10): 2841- 2871.
Kelly B , Pruitt S , Market Expectations in the Cross-section of Present Values[J]. The Journal of Finance, 2013, 68 (5): 1721- 1756.
Kelly B , Pruitt S , The Three-pass Regression Filter: A New Approach to Forecasting Using Many Predictors[J]. Journal of Econometrics, 2015, 186 (2): 294- 316.
Ludvigson S C , Ma S , Ng S , Uncertainty and Business Cycles: Exogenous Impulse or Endogenous Response?[J]. American Economic Journal: Macroeconomics, 2021, 13 (4): 369- 410.
Ludvigson S C , Ng S , The Empirical Risk-return Relation: A Factor Analysis Approach[J]. Journal of Financial Economics, 2007, 83 (1): 171- 222.
Merton R , An Intertemporal Capital Asset Pricing Model[J]. Econometrica, 1973, 41, 867- 887.
Neely C J , Rapach D E , Tu J , Zhou G , Forecasting the Equity Risk Premium: The Role of Technical Indicators[J]. Management Science, 2014, 60 (7): 1772- 1791.
Rapach D, Zhou G, (2019). Sparse Macro Factors[R]. SSRN Working Paper.
Rapach D E , Strauss J K , Zhou G , Out-of-Sample Equity Premium Prediction: Combination Forecasts and Links to the Real Economy[J]. The Review of Financial Studies, 2010, 23 (2): 821- 862.
James H Stock , Mark w. Watson , 1 A Comparison of Linear and Nonlinear Univariate Models for Forecasting Macroeconomic Time Series[J]. Cointigration, Causality, and forecating: A Festschrift in Honour of Clive W. J. Granger, 1999, 1- 44.
Stock J H , Watson M W , Forecasting Using Principal Components from a Large Number of Predictors[J]. Journal of the American Statistical Association, 2002, 97 (460): 1167- 1179.
Tibshirani R , Regression Shrinkage and Selection via the Lasso[J]. Journal of the Royal Statistical Society: Series B (Methodological), 1996, 58 (1): 267- 288.
Xing Y , Zhang X , Zhao R , What Does the Individual Option Volatility Smirk Tell Us about Future Equity Returns?[J]. Journal of Financial and Quantitative Analysis, 2010, 45 (3): 641- 662.
Yan S , Jump Risk, Stock Returns, and Slope of Implied Volatility Smile[J]. Journal of Financial Economics, 2011, 99 (1): 216- 233.
Zou H , Hastie T , Regularization and Variable Selection via the Elastic Net[J]. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2005, 67 (2): 301- 320.
Zou H , Hastie T , Tibshirani R , Sparse Principal Component Analysis[J]. Journal of Computational and Graphical Statistics, 2006, 15 (2): 265- 286.

Funding

Development Project of Ministry of Education Foundation on Humanities and Social Sciences(23YJA790006)
Development Project of Ministry of Education Foundation on Humanities and Social Sciences(22YJA790079)
National Natural Science Foundation of China(72003062)

RIGHTS & PERMISSIONS

All rights reserved, without authorization
PDF(336 KB)

2115

Accesses

0

Citation

Detail

Sections
Recommended

/