基于Transformer和关键特征的可解释端到端投资组合策略

张永, 黎嘉豪, 刘悦, 张卫国

计量经济学报 ›› 2024, Vol. 4 ›› Issue (5) : 1381-1407.

PDF(1020 KB)
PDF(1020 KB)
计量经济学报 ›› 2024, Vol. 4 ›› Issue (5) : 1381-1407. DOI: 10.12012/CJoE2024-0162
论文

基于Transformer和关键特征的可解释端到端投资组合策略

    张永1(), 黎嘉豪1(), 刘悦1(), 张卫国2,*()
作者信息 +

Interpretable End-to-end Portfolio Selection Strategy Based on Transformer and Key Features

    Yong ZHANG1(), Jiahao LI1(), Yue LIU1(), Weiguo ZHANG2,*()
Author information +
文章历史 +

摘要

基于深度学习的端到端投资组合策略具有较高的决策性能, 但其黑箱操作使得决策机制缺乏可解释性. 本文使用深度学习、强化学习及知识蒸馏方法, 构建了兼具决策能力和可解释性的端到端投资组合策略. 首先, 利用改进Transformer模型缓解其内置的二次复杂性问题, 并据此提出长序列表征提取器. 其次, 通过跨资产注意力网络和强化学习算法, 构建一个非线性的“黑箱”模型, 用于金融资产的动态配置. 然后, 通过计算模型输出相对于资产特征的梯度, 计算在特征域上的显著性向量, 从而识别出影响较大的关键特征. 最后, 在关键特征上提取一个线性回归模型, 进而得到了简单而具有经济学解释意义的端到端投资组合策略. 实证结果显示, 这种基于Transformer和关键特征的可解释端到端投资组合策略可以获得较好的收益与风险表现, 兼具深度学习决策性能和解释性. 本文的研究为深度学习在金融领域的应用提供了一种兼具高效决策能力与可解释性的投资组合策略.

Abstract

The end-to-end portfolio selection strategy based on deep learning exhibits high decision-making performance, but its black-box nature hinders interpretability of the decision mechanism. In this paper, we propose a comprehensive end-to-end portfolio selection strategy that combines decision-making capability with interpretability using deep learning, reinforcement learning, and knowledge distillation method. Firstly, by leveraging an improved Transformer to alleviate its quadratic complexity issue, a long sequence representations extractor is proposed. Then, through the employment of a cross-assets attention network and reinforcement learning algorithm, a non-linear "black-box" model is constructed to facilitate dynamic allocation in financial assets. Next, by calculating the gradients of model's outputs with respect to the asset features, we compute significance vectors in the feature space to identify key influential features. Finally, a linear regression model is applied to the identified key features, resulting in a straightforward and economically interpretable end-to-end portfolio selection strategy. Empirical results demonstrate that this interpretable end-to-end portfolio selection strategy based on Transformer and key features achieves favorable return and risk performance, with both decision-making power of deep learning and interpretability. This study provides a portfolio selection strategy that combines efficient decision-making capability and interpretability, contributing to the application of deep learning in the financial domain.

关键词

Transformer / 强化学习 / 知识蒸馏 / 线性模型 / 可解释端到端投资组合策

Key words

Transformer / reinforcement learning / knowledge distillation / linear model / interpretable end-to-end portfolio selection strategy

引用本文

导出引用
张永 , 黎嘉豪 , 刘悦 , 张卫国. 基于Transformer和关键特征的可解释端到端投资组合策略. 计量经济学报, 2024, 4(5): 1381-1407 https://doi.org/10.12012/CJoE2024-0162
Yong ZHANG , Jiahao LI , Yue LIU , Weiguo ZHANG. Interpretable End-to-end Portfolio Selection Strategy Based on Transformer and Key Features. China Journal of Econometrics, 2024, 4(5): 1381-1407 https://doi.org/10.12012/CJoE2024-0162

1 引言

Markowitz Markowits (1952)提出的均值-方差(mean-variance, MV) 模型开创了现代投资组合理论的先河, 其以投资组合模型的期望收益和方差来度量收益和风险的思想被学术界和业界广泛采用. 但传统均值-方差模型要求资产收益服从某一已知的概率分布, 而这在现实投资环境中往往难以实现. 随着人工智能技术的发展, 以长短期记忆(long short-term memory, LSTM) 网络为代表的深度学习技术凭借强大的复杂关系建模能力(王祖德等, 2023), 在自然语言处理、语音识别和图像分类等多个领域取得了突破性进展. 与此同时, 各种深度学习模型被广泛地应用于经济金融预测与决策领域, 以捕捉时间序列的非线性特征(马超群等, 2021; 陈晓红等, 2022; 张学勇和李沛然, 2023; Yoo et al., 2021; Tian et al., 2022).
基于深度学习的投资组合研究主要包括两阶段和端到端两种模式. 在均值-方差模型框架下, 两阶段投资组合先利用深度学习模型预测投资组合收益分布, 再根据预测结果用MV模型优化投资组合(Ma et al., 2021; Du, 2022; 李宗铭等, 2021). 然而两阶段投资组合的最大问题在于可能导致误差的传递和放大, 即预测部分的误差会传递到组合优化的结果中(Michaud, 1989; Uysal et al., 2023). 为应对两阶段投资组合存在的问题, 端到端投资组合将预测和优化任务结合到一起, 通过直接优化给出投资决策, 很大程度上解决了误差传递这一问题. 现有端到端投资组合策略主要通过构建深度强化学习(deep reinforcement learning, DRL) 模型实现. Jiang et al. (2017)提出了一个名为一致独立评估器(ensemble of identical independent evaluators, EIIE) 的拓扑结构, 并采用了确定性策略梯度方法(deterministic policy gradient, DPG) 来动态优化加密货币投资组合. 随后, Liang et al. (2018)通过对比DPG以及最新的两种算法(deep deterministic policy gradient, DDPG; proximal policy optimization, PPO) 发现传统的策略梯度(policy gradient, PG) 方法性能更好. 随后, 众多学者基于PG方法开展更深入的投资组合策略研究: Cong et al. (2021)利用Transformer提出了一个名为AlphaPortfolio的强化学习投资组合管理框架并取得了出色的投资结果; Aboussalah et al. (2022)在投资组合管理任务上测试了8种基于策略的强化学习算法; Zhang et al. (2022)设计了一个名为投资组合策略网络(portfolio policy network, PPN) 的成本敏感投资组合策略; Niu et al. (2022)提出了MetaTrader, 它将DRL与模仿学习(imitation learning, IL) 相结合, 以有效适应各种金融市场条件; Li et al. (2023)在加密货币的高频交易背景下提出了基于改进Transformer的长序列表征提取器(long sequence representations extractor, LSRE)和跨资产注意力网络(cross-assets attention network, CAAN).
可见, 在端到端投资组合问题上, 基于深度强化学习方法的投资组合策略显示出较强的资产配置和风险管理能力. 作为目前最先进的深度学习模型, Vaswani et al.(2017)可以有效地处理时间序列数据. Transformer的核心是自注意力机制, 它可以捕捉输入序列中任意两个位置之间的依赖关系, 并赋予不同位置不同的权重. 这样, Transformer可以充分利用时间序列的全局信息, 并适应不同的时域和频域. Transformer还克服了传统递归神经网络(Hopfield, 1982; Hochreiter and Schmidhuber, 1997)和时序卷积神经网络(Bai et al., 2018) 梯度消失、梯度爆炸和全局信息提取不佳等缺陷. 目前, Transformer已经在许多时序任务上取得最先进的性能表现, 如机器翻译、语音识别等. Transformer显示出的强表征学习能力有望解决基于深度学习的端到端投资组合研究中长序列和多变量依赖建模的问题.
此外, 现有文献显示, 当前基于深度学习的端到端投资组合研究更多关注收益最大化而非模型可解释性(Guan and Liu, 2021; Hendershott et al., 2021). 这类复杂的“黑箱”模型由于缺乏决策透明度, 难以被投资者接受和理解(Fu et al., 2021, 2022). 与此同时, 负责任的人工智能正受到各个领域的广泛关注. 它强调算法的公平性、可解释性和透明度(孔祥维等, 2021; De Cremer, 2020; Zhang and Xu, 2023), 为社会带来正面影响(Wearn et al., 2019). 因此, 近年来国内外研究学者逐渐聚焦于可解释性方法及其应用. Arrieta et al. (2020)从设计透明模型和事后解释两个方面对已有的方法进行总结. Samek et al. (2021)专注于研究事后解释, 为深度学习可解释方法提供了理论基础. 特征归因解释方法探讨输入特征对模型输出的重要性, 是一种基于结果解释的事后解释方法. 基于梯度的解释方法能够识别输入要素的无穷小变化对模型预测结果的影响, 成为特征归因的主要研究方法, 相关代表性研究成果有反向传播方法(backpropagation) (Simonyan et al., 2014), 反卷积方法(deconvolutional network) (Zeiler and Fergus, 2014), 导向反向传播方法(guided backpropagation) (Springenberg et al., 2014) 及平滑梯度方法(SmoothGrad) (Smilkov et al., 2017). 这些方法在神经元饱和时梯度为零, 无法有效地表征特征重要性. 为此, Sundararajan et al. (2017)提出了一种基于积分梯度(integrated gradients) 的方法来处理梯度饱和的情形. 后续的改进工作主要包括积分黑塞(integrated Hessians) (Janizek et al., 2021), 引导的积分梯度(guided integrated gradients) (Kapishnikov et al., 2021), 基于边界的积分梯度(boundary-based integrated) (Wang et al., 2022) 及重要方向梯度积分(important direction gradient integration) (Yang et al., 2023). 与此同时, 深度学习可解释性的研究进展使其在医疗诊断(Tang et al., 2019; Wang et al., 2020; Pintelas et al., 2021; EI-Sappagh et al., 2021)、推荐系统(Hu et al., 2018; Cao et al., 2019; Ye et al., 2021) 及智能金融(Sachan et al., 2020; Bussmann et al., 2020)等重要决策问题中发挥重要的应用价值.
综上, 如何在保持Transformer决策能力的前提下, 提高其对投资决策者的可解释性, 成为当前研究的重要方向. 本文拟通过知识蒸馏技术, 从深度学习模型中提取输入特征与决策之间的线性关系, 构建一个兼具决策能力和解释性的端到端投资组合策略. 该策略旨在提供一种架构, 兼容深度学习的建模优势, 同时提升模型的透明度, 以促进人工智能技术在经济金融领域的应用.
本文的主要贡献如下:
1) 首先利用改进Transformer模型缓解其内置二次复杂性问题, 构建长序列表征提取器, 并通过跨资产注意力网络和强化学习算法, 构建端到端投资组合策略;
2) 然后基于显著性特征梯度计算识别出对端到端投资组合策略具有重要影响的关键特征, 并使用线性回归方法构建基于知识蒸馏的可解释端到端投资组合策略;
3) 最后基于国内外市场数据对提出的可解释端到端投资组合策略表现进行回溯测试, 并与相关深度学习模型驱动的策略进行对比, 结果表明本文提出的策略在收益、风险等方面取得了较好的表现.
本文后续的结构安排如下: 第2节给出问题描述; 第3节给出基于改进Transformer和强化学习的端到端投资组合模型构建过程; 第4节基于显著性向量计算, 对端到端投资组合模型依赖的关键特征进行识别, 进而通过线性回归方程构建基于知识蒸馏的可解释端到端投资组合策略; 第5节通过实证结果验证了基于知识蒸馏和关键特征的可解释端到端投资组合策略相较于基于复杂深度学习模型策略在可解释性和收益、风险等方面表现的优越性; 第6节总结了本文的研究内容和主要贡献.

2 问题描述

本文考虑一个市场中包含m个资产, 交易期为n的端到端投资组合问题. 在每个交易期t结束时, 使用一个m维的非负相对价格向量yt=(yt,1,,yt,m)R+m来表示m个资产的价值表现, 其中元素yt,i等于资产i在第t期收盘价Ct,i除以开盘价Ot,i, 即yt,i=Ct,i/Ot,i.
在第t期开始前, 基于市场历史信息和深度学习方法构建一个投资组合向量bt=(bt,1,,bt,m)Rm, 其中元素bt,i表示在第t期开始时投资于资产i的财富比例. 投资组合向量满足单纯形约束btΔm, 其中bt,i0i=1mbt,i=1. 这一约束表明资产组合是完全自融资的, 即没有外来的资金注入或撤出, 资产的资金必须通过出售旧资产来筹集, 且不允许做空.
因此, 在第t期结束时, 投资组合向量的当期收益定义为btyt=i=1mbt,iyt,i. 基于此, 连续投资n期获得的最终财富为:
Sn=S0t=1nbtyt=S0t=1ni=1mbt,iyt,i,
(1)
其中投资组合向量的初始值通常设置为1, 即S0=1.
投资组合是一个动态决策问题, 需要根据市场变化实时调整投资组合向量. 在深度强化学习背景下, 可以将序列投资组合问题建模为一个马尔可夫决策过程(Markov decision process, MDP), 利用神经网络(第3节) 构建的策略网络模拟该MDP并利用强化学习算法来学习该策略网络. 记资产特征输入是一个实时的三维市场环境状态张量Xt=(Xt,1,Xt,2,,Xt,m)Rm×w×f, 其中Xt,i=(xtw+1,i,xtw+2,i,,xt,i)Rw×f反映了资产近期的状态, xt,i=(xt,i1,xt,i2,,xt,if)Rf反映了资产每一期的所有状态(特征). 为了消除不同特征量纲引起的影响, 增加模型的数值稳定性, 对资产特征进行标准化处理. 对于每个资产i, 提取其过去w期的历史状态数据Xt,i. 然后对Xt,i中的每个元素xt,ij进行标准化:
zt,ij=xt,ijμijσij,
(2)
其中μijσij分别是特征j在过去时间窗口w期中的均值和标准差. 这样可以消除不同特征量纲引起的影响, 增加模型的数值稳定性. 经过标准化后, 可以将得到标准化的市场环境状态张量Zt=(Zt,1,Zt,2,,Zt,m)Rm×w×f作为模型输入.
具体来说, 序列投资过程可以建模为交易智能体与金融市场环境的交互过程, 该交互过程中时刻t的MDP四元组<S, A, P, R>表示如下:
1) 环境状态空间(S): stS可以表示为当前的市场状态和智能体在上一期的持仓状态, 即当前可观测的各资产历史特征(如开盘和收盘价格) (st=Zt1).
2) 智能体动作空间(A): 在每个交易期t, atA表示交易智能体根据当前金融市场环境状态st给出的投资组合向量bt, 即at=bt=π(st), 其中π为策略映射函数.
3) 状态转移概率函数(P): 作为对每个动作at=bt的响应, 金融市场环境的状态从st转移到st+1的概率为P(st+1|st;at).
4) 奖励函数(R): 在环境状态st下, 交易智能体采取行动at=bt且环境状态从st转移到st+1后, 金融市场环境对交易智能体的及时奖励值为rt=R(st,at,st+1)=log(btyt)λbtbt1, 其中λ为权重参数.
智能体的目标是通过与环境交互, 学习一个投资策略π, 以期望最大化长期收益:
J(π)=Eτπ[t=1Tγt1rt],
(3)
这里γ(0,1]是折现因子, τ指代一个T期的连续投资轨迹.

3 基于Transformer和强化学习的端到端投资组合模型构建

本节基于改进Transformer深度学习网络进行投资组合构建并使用强化学习方法对网络进优化以获得最优投资组合策略, 其模型如图 1所示. 其中, 长序列表征提取器(long sequence representations extractor, LSRE) 减轻了原始Transformer编码器在时间和内存两方面的二次复杂性; 跨资产注意力网络(cross-asset attention network, CAAN) 提取了资产间交互关系; 基于DPG的强化学习方法为最优投资组合策略的求解提供优化框架.
图1 基于Transformer和强化学习的端到端投资组合模型

Full size|PPT slide

3.1 长序列表征提取器

图 2所示, LSRE的主要思想是在原始Transformer编码器之上引入一个小的隐空间(latent space), 形成输入必须通过的注意力瓶颈, 这种改进Transformer模型有效地解决了其二次复杂性问题(Li et al., 2023). LSRE由两部分组成: 1) 交叉注意机制映射模块, 其输入数据为ZRw×Rf和隐空间zRM×RD (w, f, M<wD<f分别为历史窗口大小, 资产特征维度, 隐单元数量和隐单元维度); 2) 原始Transformer编码器(Cong et al., 2021) 将隐空间映射到下一个隐空间.
图2 长序列表征提取器示意图

Full size|PPT slide

具体而言, 对于t时刻的资产i, LSRE的交叉注意力层输入Zt,iRw×Rf及隐单元zt,iRM×RD (为简化表示, 后续的部分变量省略了时间维度和资产维度的下标), 输出:
Q=fQ(z);K=fK(Z);V=fV(Z),
(4)
XQK=softmax(QKd),
(5)
Attn(Q,K,V)=XQKV=fO(XQKV),
(6)
其中, fQ:RDRDc, fK,fV:RfRDc, fO:RDcRD分别为将输入映射到查询、键、值以及交叉注意力层输出的线性映射, d为交叉注意力层维度Dc, XQKVRM×RD为交叉注意力层最终输出. 紧跟着交叉注意力层的是两次残差连接和一个单层的前馈全连接层:
XQKV=XQKV+z,
(7)
z=XQKV+MLP(XQKV),
(8)
LSRE的第二部分为原始Transformer编码器, 负责不同隐空间z之间的投影. 相似地, 给定输入zRM×RD, LSRE的自注意力层输出:
Q=fQ(z);K=fK(z);V=fV(z),
(9)
XQK=softmax(QKd),
(10)
Attn(Q,K,V)=XQKV=fO(XQKV),
(11)
其中, fQ,fK,fV:RDRDs, fO:RDsRD分别为将输入映射到查询、键、值以及自注意力层输出的线性映射, d为自注意力层维度Ds, XQKVRM×RD为自注意力层最终输出. 相似地, 紧跟着自注意力层的同样是两次残差连接和一个单层的前馈全连接层.
最后, 在经过L层原始Transformer编码器的投影后, 取zRM×RD隐单元数量维度的最后一层作为表征向量ht,iRD输出.

3.2 跨资产注意力网络

虽然LSRE可以对时间序列进行建模, 但它单独处理每只资产, 这为提取资产之间的相互关系带来了挑战. 为了解决这个问题, 本文进一步引入了一个建立在自注意力机制基础上的跨资产注意力网络. 具体而言, 给定资产it时刻的表征ht,i, 应用线性变化可以得到查询向量qi, 键向量ki, 和值向量vi. 此处的关键是通过查询向量qi对键向量kj进行查询, 本文建模了资产j与资产i的相互关系:
βij=qikjd,
(12)
其中, d为隐单元维度D, 进一步, 应用softmax将相互关系βi,j归一化为其和等于1的一组权重. 每个权重与其相应值向量vj相乘以得到i资产t时系刻的注意力向量at,i:
at,i=j=1mSATT(qi,kj)vj,
(13)
其中SATT是βij的归一化函数:
SATT(qi,kj)=exp(βij)j=1mexp(βij).
(14)
为了给每个资产进行最终的评分, 本文使用线性层将注意力向量转换为资产评分sct+1. 与以往研究直接通过softmax一步输出投资组合向量不同, CAAN对所有资产进行排名, 并设定最大投资资产数G(G1), 最终可以得到资产i下一期的投资比例:
bt+1,i={exp(sct+1,i)jVexp(sct+1,j),iV,0,iV,
(15)
其中集合V代表G个最高分资产在资产评分向量sct+1=(sct+1,1,sct+1,2,,sct+1,m)中的索引. 至此, 得到了下一期的投资组合向量bt+1=(bt+1,1,bt+1,2,,bt+1,m).
至此, 记以上由LSRE和CAAN构建的策略网络为πθ, 其中θ为策略网络π所含参数集合, 则从输入特征到投资组合向量的映射关系可表示为bt+1=πθ(Zt).

3.3 基于强化学习的端到端投资组合优化

参考相关文献Jiang et al. (2017), 策略网络πθ整体通过强化学习方法(DPG) 训练. 具体来说, 环境状态为输入, 通过深度神经网络对其进行特征提取, 输出投资组合决策这一动作. 模型通过与市场环境交互不断调整参数, 以实现最大化投资收益. 这种基于深度强化学习的端到端投资组合模型利用深度学习技术提取数据特征, 同时通过强化学习进行动态优化, 其目标是学习一个最优策略πθ, 以最大化长期投资回报.
具体而言, 给定输入资产历史状态对应的状态张量, 端到端投资组合模型πθ决定未来动作bt=π(st;θ). 由第2节可知金融市场环境对第t期动作的奖励可以通过log(btyt)λbtbt1进行衡量. 因此, 可以通过优化一组轨迹D上的平均累计奖励来赋予模型经济意义, 此时θJ(π)可以被近似计算为:
θJ(π)=θEτπ[t=1Tγt1rt]1|D|τDt=1Tθlog(π(st;θ)yt)λ(π(st;θ)π(st1;θ)),
(16)
其中|D|是收集的轨迹数量, λ为权重参数. 记模型的学习率为η, 进一步利用梯度上升θθ+ηθJ(π), 实现对深度学习模型参数的优化.

4 可解释端到端投资组合策略

第3节基于Transformer编码器和强化学习优化的端到端投资组合决策完全依赖内部的线性和非线性变化过程, 而这些变化过程具有黑箱属性, 无法阐明推理和原因, 需要进一步明确其决策逻辑. 因此, 本节基于知识蒸馏思想和关键特征构建可解释端到端投资组合模型, 使其决策具有可解释性和透明度.

4.1 基于显著性向量计算的关键特征识别

第3节基于Transformer构建了历史数据驱动的资产评分模型, 在评分的基础上根据(15) 构建投资组合权重. 为了识别对投资比例具有重要影响的关键特征并理解投资组合决策逻辑, 本节借鉴关于显著性的工作(Simonyan et al., 2013), 并基于显著性向量计算来解决这个问题.
首先, 对于给定的资产i, 通过计算投资比例bt+1,i相对于Zt,iRw×f的每个元素zq的梯度, 来量化资产特征对投资比例的影响程度(为简化表示, 后续的部分变量省略了时间维度和资产维度的下标). 因此, 由模型π可知资产投资比例关于资产特征zq的梯度计算公式为:
δzq(Z)=limΔzq0π(Z)π(zq+Δzq,Z¬zq)zq(zq+Δzq)=π(Z)zq,
(17)
其中, Z¬zq表示除了zq之外的所有元素, Δzq是一个微小的变化量, 以计算资产投资比例对资产特征的偏导数, π(Z)=b表示端到端投资组合策略输出资产的投资比例1. 通过这种方式, 可以得到一个在时间域和特征域上的显著性矩阵δ(Z)Rw×f, 其中每个元素δzq(Z)表示zq对投资比例的贡献. 直观地说, δzq(Z)衡量的是投资比例对输入特征zq变化的敏感度. 梯度绝对值越大, 说明资产投资比例对zq的变化越敏感, 影响越高.
1在实证研究章节, 梯度的计算使用了PyTorch框架的torch.autograd.grad函数.
其次, 为了更全面地分析模型对不同资产特征的偏好和敏感度, 对所有资产进行相同的显著性计算, 得到了一个在资产域、时间域、和特征域上的显著性张量δRm×w×f. 为消除资产和时间窗口的差异, 对显著性张量的前两个维度进行平均, 得到一个在特征域上的显著性向量δ¯Rf. 这样, 可以得到一个全局的特征重要性指标, 并用它来分析模型对不同特征的偏好和敏感度.
通过显著性向量δ¯, 可以找出对资产投资比例最重要的特征. 这有助于了解投资组合决策模型依赖的特征, 以及这些特征是否符合经济学直觉. 例如, 当模型严重依赖于特定的财务指标(如每股收益), 可以研究该指标是否是未来股票表现的可靠指标. 此外, 还可以比较不同特征的梯度, 判断哪些特征对模型的决策最重要.

4.2 基于知识蒸馏和关键特征的可解释端到端投资组合策略

机器学习中的"知识蒸馏'' (knowledge distillation) 技术旨在将一个或多个大型的深度神经网络(教师模型) 中学习到的知识"蒸馏''到一个轻量级的模型(学生模型) 中, 使得轻量模型可以模仿大模型行为的同时保持简单和高效(Hinton et al., 2015). 需要注意的是, 文中利用"知识蒸馏''技术获得的学生模型仅用作对教师模型的线性可解释性分析, 并不作为实用模型进行部署并独立给出投资组合策略.
受此启发, 本节设计了基于关键特征和线性回归的可解释端到端投资组合策略, 以便从基于Tranformer的端到端投资组合模型中提取有效且可解释的投资决策逻辑. 这种策略从深度学习模型中提取了最重要的信息, 并将其转化为更易于解释的模型, 兼具决策性能和透明度. 因此, 可将其看作是对原始黑箱模型的一种"蒸馏'', 为投资决策提供了一个兼具决策能力和可解释性的方案.
具体而言, 在交易期t期末, 根据显著性向量δt, 识别出对资产投资比例bt+1贡献最大的前k个特征, 假设这k个特征代表了可解释端到端投资组合策略在决策时重视的影响因素, 记特征索引集合为I={index_1,index_2,,index_k}.
为了构建一个兼具深度学习决策性能和可解释性的端到端投资组合策略, 首先考虑一组数据点:
(zt,1index_1,zt,1index_2,,zt,1index_k,bt+1,1),(zt,2index_1,zt,2index_2,,zt,2index_k,bt+1,2),(zt,mindex_1,zt,mindex_2,,zt,mindex_k,bt+1,m),
其中zt,iindex_j表示第t期第i个资产第index_j个特征. 然后使用线性回归模型对这些数据点建立模型:
f(z)=β0+β1zt,iindex_1+β2zt,iindex_2++βkzt,iindex_k,
(18)
其中, β0,β1,,βk是回归模型的参数. 通过优化算法, 估计出可解释端到端投资组合策略的最优参数β^0,β^1,,β^k.
再次, 根据获得模型参数及当期保留的特征数据, 来决策可解释端到端投资组合策略下期的资产投资比例:
b^t+1,i=β^0+β^1zt,iindex_1+β^2zt,iindex_2++β^kzt,iindex_k.
(19)
最后对所有资产的投资比例b^t+1,i进行归一化处理, 以获得满足第2节约束条件下的投资比例bt+1.
与基于Transformer的深度学习模型相比, 线性模型的参数具有明确的可解释性, 权重β^i直观地反映了不同特征对资产投资比例的影响贡献, 充分融合了深度学习的强大建模能力和线性回归模型的易解释性, 既具备良好的投资决策性能, 也兼具了对决策逻辑的解释力.

5 实证研究

5.1 数据

为验证本文提出的可解释端到端投资组合决策有效性, 本节收集和整理了多个国家和地区的金融市场历史数据验证资产决策策略性能, 收集的四个数据集覆盖了2010年至2023年期间的全球主要金融市场, 包括中国内地和香港的股票市场, 以及美国的期货和股票市场. 表 1展示了实验数据的基本统计信息.
表1 实验数据集基本统计信息
数据集 市场 国家/地区 总资产数 时间跨度 总期数 特征数
SSE 股票 中国 30 5/7/2010--26/6/2023 678: 406/136/136 93
HSI 股票 中国香港 53 5/7/2010--26/6/2023 678: 406/136/136 93
CMEG 期货 美国 25 5/7/2010--26/6/2023 678: 406/136/136 93
Nasdaq-100 股票 美国 80 5/7/2010--26/6/2023 678: 406/136/136 93
为了进行训练、验证和测试, 按照时间顺序将每个数据集划分为训练集、验证集和测试集, 比例为0.6/0.2/0.2. 在训练过程中, 在训练集上训练深度强化学习模型, 在验证集上保存最优模型, 最后在测试集上评估模型性能.
具体而言, SSE数据集由上证50指数的成份股组成2, 该数据集提供了中国主要股票的代表性样本. 经过数据完整性筛选后有30只股票, 构建了最终的上证50指数(SSE) 数据集. 同样, HSI数据集由香港恒生指数的成份股组成, 该指数涵盖了80只最著名的香港股票3. 经过数据筛选后, 53只股票被保留下来, 形成恒生指数(HSI) 数据集. CMEG数据集提供了在芝加哥商品交易所集团交易的所有六大类资产(农业、能源、股票指数、外汇、利率和金属) 的25种期货合约的不同样本4. Nasdaq-100数据集由美国纳斯达克100指数的成份股组成, 该指数涵盖了100只最大和最活跃的非金融类股票5. 经过数据完整性筛选后有80只股票, 构建了最终的美国纳斯达克100指数(Nasdaq-100) 数据集. 通过纳入这些主要指数和多元化交易所中具有代表性和流动性的资产, 本研究覆盖了中美股票市场主要板块和美国期货市场主要行业的表现. 数据集的成分信息详见附录A.
2上证50指数的成份股见 http://www.sse.com.cn, 访问日期为2023年7月30日.
3恒生指数成份股见 https://www.hsi.com.hk, 访问日期: 2023年7月30日.
4芝加哥商品交易所集团提供的期货合约见 https://www.cmegroup.com, 访问日期: 2023年7月30日.
5美国纳斯达克100指数的成份股见 https://www.nasdaq.com, 访问日期: 2024年4月20日.
所有数据集的时间范围均为2010年7月5日至2023年6月26日, 共计678个交易周. 对于每个资产, 本文从其历史交易数据中提取了共93个技术特征, 形成7大类特征向量, 这些特征反映了市场的价格动态、波动性和交易活跃度等方面的信息. 特征向量的具体分类见第5.5.1节.

5.2 衡量指标

为全面评估不同策略的投资决策表现, 本节从收益和风险两个方面选取了6个指标. 这些指标在经济金融领域被广泛采用. 具体而言, 采用的评价指标包括收益、风险和现实指标.

5.2.1 收益指标

1)累积财富 (cumulative wealth, CW): 计算投资期结束时n期的总财富, 反映策略的综合收益能力:
CW=S0t=1nbtxt=S0t=1ni=1mbt,ixt,i,
(20)
其中S0=1是初始投资额, bt是第t期的投资组合向量, yt是第t期的资产相对价格向量.
2)年化收益率 (annualized percentage yield, APY): 将CW指标基于投资期长度进行年化, 便于跨不同时期进行比较:
APY=CWy1,
(21)
其中y是投资期的年数.
3)夏普比率 (Sharpe ratio, SR): 使用资产组合超过无风险利率的超额收益率除以波动率计算风险调整后的收益, 反映每单位风险获得的超额收益.
SR=APYRfσn,
(22)
其中Rf=0.04是年化无风险利率, σn是资产组合日度收益率的年化标准差.

5.2.2 风险指标

1) 波动率 (volatility risk, VR): 计算资产组合日度收益率的年化标准差σn, 反映收益波动风险.
2) 最大回撤 (maximum drawdown, MDD): 度量投资期内资产组合从峰值到谷值的最大跌幅, 计算如下:
MDD=max0tn(max0ktSkStmax0ktSk).
(23)

5.2.3 现实指标

考虑交易费用的累积财富 (transaction costs-adjusted cumulative wealth, TCW): 基于调仓幅度, 对原始CW指标(式(20)) 进行交易费用调整:
TCW=S0t=1n[(btxt)×(1c2×btb^t11)],
(24)
其中c(0,1)为比例交易费用费用率; 1-范数btb^t11计算相邻两期间资产配置向量权重变化比例, 其反映调仓幅度; b^t1=(bt1,1yt1,1bt1yt1,,bt1,myt1,mbt1yt1)为考虑上期资产收益调整后的投资组合向量. 为不失一般性, 设b^0的所有元素为0.

5.3 对比策略

表 2介绍了本文的对比策略, 这些策略基于经典投资理论、在线学习和深度学习等不同方法构建, 可以作为评估本文提出可解释端到端投资组合策略有效性.
表2 本文对比策略及描述
对比策略 描述
基准策略 Market 市场策略, 即投资期初平均持有资产组合所有资产至投资期末
UCRP (Kelly, 1956; Cover, 1991) 均匀定常再调整策略, 即在每个调整期将资金均匀分配到每个资产
动量策略 UP (Cover, 1991) 泛证券投资组合策略, 利用所有定常再调整策略的加权平均确定下期投资组合比例
EG (Helmbold et al., 1998) 指数梯度投资组合策略, 基于实时价格信息的相对熵距离确定下期投资组合比例
SCRP (Gaivoronski et al., 2000) 连续定常再调整策略, 基于实时最优定常再调整策略确定下期投资组合比例
反转策略 ANTI1 (Borodin et al., 2003) 基于窗口统计相关性的自适应投资组合策略
ANTI2 (Borodin et al., 2003) 基于窗口统计相关性的自适应投资组合策略
PAMR (Li et al., 2012) 基于资产单期回归特性和被动主动学习的投资组合策略
CWMR-Var (Li et al., 2013) 基于资产单期回归特性和置信权重算法的投资组合策略
CWMR-Stdev (Li et al., 2013) 基于资产单期回归特性和置信权重算法的投资组合策略
OLMAR-S (Li et al., 2015) 基于资产多期回归特性和被动主动学习的投资组合策略
OLMAR-E (Li et al., 2015) 基于资产多期回归特性和被动主动学习的投资组合策略
RMR (Huang et al., 2016) 基于资产多期鲁棒回归特性和被动主动学习的投资组合策略
元学习策略 SP (Singer, 1997) 基于市场非平稳性的转换投资组合策略
WAAS (Zhang and Yang, 2017) 基于弱集成算法和最优股票意见的投资组合策略
CW-OGD (Zhang et al., 2021) 基于在线梯度下降算法和组合权重的投资组合策略
本文策略 Teacher-Model 本文基于改进Transformer模型实现的端到端投资组合策略, 简记为教师模型
Student-Model 本文基于知识蒸馏和关键特征实现的可解释端到端投资组合策略, 简记为学生模型
对于绝大部分对比策略, 本文参考了投资组合领域的权威代码库OLPS (Li et al., 2016) 进行复现, 以确保结果的可靠性. 而对于代码库中未包含的策略, 本文通过与策略提出者联系的方式获得其代码, 并进行复现, 以保证结果的一致性. 所有对比策略都进行了认真仔细的复现, 以确保参数和设定均符合原文献或者代码描述.

5.4 实验设定

对于大部分模型超参数, 本文沿用了前人的原始设置(Li et al., 2023), 其中模型层数L设置为1, 隐单元数量M为8, 隐单元维度D设置为16, 自注意力层维度Ds设置为16, 交叉注意力层维度Dc设置为32. 丢弃率设置为0.1, 并且不对输入特征进行嵌入操作.
在模型训练阶段, 本文利用LAMB优化器(You et al., 2019) 对模型进行优化, 这是一个专门为基于Transformer模型设计的自适应时变优化器, 可以根据模型参数的时变特征自适应地调整每个参数的学习率, 从而提高训练效率. 模型学习率η设置为1×103, 优化目标权重参数λ设置为5×104. 模型总训练轮数为103. 连续投资期长度T设置为128期. 历史窗口大小w设置为50期, 预设最大投资资产数G设置为m/2.
在关键特征识别过程中, 设置保留特征数k0.7f, 并基于Lasso回归线性模型. 为了全面评估关键特征数对结果的影响, 第5.5.6节进行了关于保留特征数的敏感性分析.

5.5 实验结果

5.5.1 可解释性分析结果

为了揭示关键特征的重要性, 本节采用统计和热力图可视化的方法对测试集n个交易期特征系数向量进行了探索性分析, 揭示特征在不同交易期的重要性变化.
表 3报告了在四个数据集中, 线性回归模型中各特征对应的回归系数β在不同交易期中的统计分析结果. β系数表示了特征和资产投资比例之间的线性关系的强度和方向. β绝对值系数越大, 表示特征和资产投资比例的影响越大; β系数为正, 表示自变量和因变量正相关; β系数为负, 表示自变量和因变量负相关. 可以看出, 在SSE和HSI数据集, 动量特征和量价特征对资产选择有正向的影响, 但在HSI数据集中, 量价特征标准差较大, 其影响程度随交易期波动较大. 在CMEG数据集, 市场特征的回归系数平均值和标准差均较小, 反映期货市场的特征重要性在不同交易期之间变化相对稳定. 在Nasdaq-100数据集, 动量特征和量价特征对资产选择有正向且显著的影响, 波动特征对资产选择有负向的影响.
表3 各数据集回归方程β系数统计表
重叠特征 动量特征 量价特征 周期特征 价格特征 波动特征 模式特征
SSE 平均值 0.0014 0.0035 0.0092 0.0015 0.0000 0.0034 0.0019
标准差 0.0027 0.0115 0.0279 0.0014 0.0008 0.0032 0.0035
最小值 0.0099 0.0448 0.0806 0.0054 0.0043 0.0125 0.0120
最大值 0.0066 0.0337 0.1284 0.0048 0.0041 0.0111 0.0075
HSI 平均值 0.0009 0.0033 0.0214 0.0001 0.0020 0.0007 0.0011
标准差 0.0033 0.0089 0.0533 0.0042 0.0054 0.0068 0.0044
最小值 0.0156 0.0208 0.0699 0.0241 0.0270 0.0210 0.0179
最大值 0.0116 0.0311 0.1887 0.0124 0.0273 0.0152 0.0147
CMEG 平均值 0.0028 0.0006 0.0106 0.0005 0.0020 0.0017 0.0029
标准差 0.0119 0.0259 0.0716 0.0095 0.0125 0.0172 0.0149
最小值 0.0552 0.0660 0.2593 0.0297 0.0461 0.0523 0.0666
最大值 0.0481 0.0826 0.2227 0.0338 0.0440 0.0663 0.0625
Nasdaq-100 平均值 0.0004 0.0005 0.0037 0.0026 0.0005 0.0018 0.0011
标准差 0.0016 0.0093 0.0278 0.0045 0.0056 0.0121 0.0020
最小值 0.0049 0.0237 0.0656 0.0096 0.0120 0.0358 0.0060
最大值 0.0031 0.0219 0.0681 0.0154 0.0188 0.0352 0.0062
为了进一步判断特征重要性的动态变化, 本文绘制了特征系数的热力图(图 3). 图 3分别展示了SSE、HSI、CMEG和Nasdaq-100四个数据集中, 线性回归模型特征系数在不同交易期的热力图. 颜色越深表示特征回归系数绝对值越大.从SSE和HSI数据集的热力图可以看出, 动量特征和量价特征的总体颜色较深, 说明它们整体影响较大. 此外, 其余特征颜色很浅, 且两个热力图相似, 侧面说明SSE和HSI市场的相似性. 同为股票市场, Nasdaq-100热力图显示除类似性质即动量特征和量价特征的总体颜色较深, 但波动更大, 此外Nasdaq-100市场作为成熟金融市场, 对资产的波动特征更为敏感. 相较于股票市场, 期货CMEG市场热力图可以看出, 除量价特征外, 其余特征颜色较浅且比较均匀, 没有非常突出的特征, 表明期货选择受多方面因素共同影响, 各特征在不同时期对期货资产的解释能力相对平衡且稳定, 这与期货市场受行业和商品供求等宏观因素影响的特点相符.
图3 特征系数时间动态热力图

Full size|PPT slide

综上, 热力图直观展示了不同市场和资产类型下, 特征重要性的差异和时变性. 股票市场个股容易受个别特征驱动, 而期货市场影响因素较为复合, 这为量化模型的设计提供了参考, 虽然个别特征的重要性会随着时间发生变化, 但也存在一些对决策影响稳定的关键特征. 对学生模型的可解释分析揭示了不同市场下资产配置背后的驱动机制.

5.5.2 收益指标结果

表 4报告了不同数据集上各策略的收益指标结果. 收益指标包括累积财富、年化收益率和夏普比率. 累积财富是投资期结束时的总财富, 反映策略在整个投资期内的综合收益能力; 年化收益率将累积财富指标按投资年限进行年化, 便于不同时期进行比较; 夏普比率采用资产组合超额回报率除以波动率来衡量策略的风险调整收益, 反映每单位风险获得的超额收益.
表4 不同数据集上各策略的收益指标比较
SSE HSI CMEG Nasdaq-100
CW APY SR CW APY SR CW APY SR CW APY SR
Market 1.08 0.03 0.05 0.93 0.03 0.37 1.15 0.05 0.09 1.31 0.11 0.35
UCRP 1.15 0.05 0.08 0.97 0.01 0.28 1.21 0.08 0.30 1.36 0.12 0.42
UP 1.14 0.05 0.08 0.97 0.01 0.29 1.22 0.08 0.30 1.35 0.12 0.42
EG 1.14 0.05 0.07 0.97 0.01 0.29 1.21 0.08 0.28 1.35 0.12 0.42
SCRP 0.51 0.23 0.56 0.52 0.22 0.48 0.48 0.24 0.55 1.46 0.16 0.22
ANTI1 1.22 0.08 0.16 0.96 0.01 0.11 1.17 0.06 0.08 1.35 0.12 0.26
ANTI2 1.37 0.13 0.34 0.93 0.03 0.11 1.49 0.17 0.38 0.89 0.04 0.19
PAMR 0.79 0.09 0.39 0.92 0.03 0.16 1.07 0.03 0.04 1.55 0.18 0.45
CWMR-Var 0.76 0.10 0.45 0.98 0.01 0.10 1.15 0.06 0.04 1.44 0.15 0.34
CWMR-Stdev 0.75 0.10 0.46 0.97 0.01 0.11 1.16 0.06 0.05 1.46 0.15 0.36
OLMAR-S 0.72 0.12 0.38 0.66 0.14 0.34 1.12 0.04 0.01 1.36 0.12 0.21
OLMAR-E 0.43 0.28 0.77 0.47 0.25 0.53 0.77 0.10 0.31 1.16 0.06 0.04
RMR 0.81 0.08 0.29 0.69 0.13 0.31 1.11 0.04 0.00 1.18 0.07 0.07
SP 1.15 0.05 0.08 0.97 0.01 0.28 1.21 0.08 0.30 1.36 0.12 0.42
WAAS 1.14 0.05 0.07 0.97 0.01 0.29 1.21 0.08 0.28 1.39 0.13 0.47
CWOGD 1.06 0.02 0.07 0.94 0.02 0.28 1.30 0.11 0.28 1.13 0.05 0.03
Teacher-Model 2.29 0.37 1.31 1.12 0.05 0.03 1.50 0.17 0.88 2.38 0.39 1.10
Student-Model 1.94 0.29 1.17 1.06 0.02 0.10 1.44 0.15 0.86 1.55 0.18 0.78
注: 表中粗体表示该列最大值, 下划线表示第二大值.
表 4可以看出, 本文策略在四个数据集上都显著优于其他策略, 表现出了更高的累积财富、年化收益率和夏普比率, 说明了本文所提出的投资组合策略在不同金融市场上具有显著的优越性和稳健性. 在所有数据集上, 相比于教师模型, 学生模型仅有轻微的下降, 分别为8%、3%、2%和21% 的年化收益率下降. 即使如此, 它仍然优于其他所有的策略, 包括市场策略和传统的投资组合策略. 总体而言, 学生模型在提高可解释性的基础上, 同时兼顾了深度学习的建模优势. 它能够在保持可解释性的前提下, 产生稳定的超额收益.
为进一步验证上述分析结果, 本文绘制了各策略在测试期内的逐期累积财富曲线, 每个折线图的横轴表示交易期, 纵轴表示累积财富的数值. 从图 4可以更直观地看出不同策略在不同时间域的收益表现差异.
图4 不同数据集上各策略的逐期累积财富比较

Full size|PPT slide

具体而言, 本文策略在绝大多数情况下都显著优于对比策略, 能获得更高的累积财富. 这与表 4中的结果一致, 说明了本文所提出策略在不同市场上具有显著的优势; 此外, 学生模型在四个数据集上都能很好地跟上教师模型, 说明学生模型在不同市场上具有较强的竞争力和鲁棒性. 逐期累积财富图进一步表明本文策略可以在保持可解释性同时产生稳定超额收益.

5.5.3 风险指标结果

风险指标包括波动率和最大回撤. 波动率表示资产组合每期收益的波动程度, 越小越好; 最大回撤表示资产组合在一段时间内遭受的最大财富损失, 越小越好. 表 5报告了不同数据集上各策略的波动率和最大回撤比较.
表5 不同数据集上各策略的风险指标比较
SSE HSI CMEG Nasdaq-100
VR MDD VR MDD VR MDD VR MDD
Market 0.18 0.29 0.18 0.36 0.16 0.24 0.20 0.28
UCRP 0.17 0.23 0.18 0.36 0.13 0.15 0.20 0.26
UP 0.17 0.23 0.18 0.36 0.13 0.15 0.20 0.26
EG 0.17 0.23 0.18 0.36 0.13 0.15 0.20 0.26
SCRP 0.48 0.64 0.55 0.63 0.52 0.70 0.52 0.48
ANTI1 0.24 0.24 0.49 0.65 0.28 0.37 0.32 0.31
ANTI2 0.26 0.23 0.62 0.72 0.33 0.46 0.42 0.53
PAMR 0.32 0.56 0.46 0.69 0.36 0.52 0.32 0.27
CWMR-Var 0.31 0.56 0.47 0.72 0.37 0.51 0.32 0.27
CWMR-Stdev 0.31 0.56 0.47 0.72 0.37 0.51 0.32 0.27
OLMAR-S 0.41 0.58 0.54 0.81 0.46 0.60 0.40 0.39
OLMAR-E 0.41 0.67 0.55 0.81 0.44 0.64 0.46 0.32
RMR 0.40 0.55 0.56 0.79 0.44 0.57 0.39 0.38
SP 0.17 0.23 0.18 0.36 0.13 0.15 0.20 0.26
WAAS 0.17 0.23 0.18 0.35 0.13 0.16 0.20 0.26
CW-OGD 0.24 0.33 0.23 0.37 0.24 0.29 0.24 0.34
Teacher-Model 0.25 0.18 0.20 0.29 0.15 0.15 0.32 0.22
Student-Model 0.21 0.16 0.17 0.29 0.13 0.15 0.18 0.16
表 5可以看出, 传统的投资组合策略如泛证券投资组合策略、指数梯度投资组合策略等在四个数据集上的风险指标都很低, 波动率和最大回撤都在0.10以下. 反映这些策略总体上采取较为保守的策略, 收益和风险水平相对平衡. 相比之下, 本文策略均表现出其较大的波动率, 波动率多在0.20以上. 这符合追求收益伴随着风险的常识. 另一方面, 本文使用累积财富作为优化目标, 而非风险调整收益, 一定程度解释了它们风险指标数值偏高的原因. 值得注意的是, 相比其余对比策略, 本文策略几乎总能实现更优的最大回撤表现. 此外, 相比教师模型, 学生模型在绝大多数数据集上的风险水平都实现了一定的下降. 这表明知识蒸馏弥补了深度学习单纯依靠数据学习的弱点, 降低了深度学习模型的不确定性, 有利于提升投资组合的稳健性.

5.5.4 现实指标结果

交易费用是现实投资中不可忽视的因素, 它包括买入和卖出资产所产生的手续费和交易费用. 在现实中, 跨期投资组合向量差异较大时可能导致较高的交易费用, 从而对投资的综合收益产生影响. 为了更真实地验证策略的表现, 本节考虑交易费用因素的影响, 引入了考虑交易费用的累积财富指标, 该指标基于原始累积财富指标进行调整, 测度了调仓幅度对投资绩效的影响. 图 5报告了不同策略的累积财富随交易费用率变化的曲线.
图5 考虑交易费用时不同数据集上各策略的累积财富比较

Full size|PPT slide

从图中可以看出, 虽然所有策略的累积财富都随着交易费用率的增加而减少, 但是不同策略的累积财富下降幅度不同. 随着交易费用率的增加, 传统投资组合策略由于保守的资产配置策略, 受交易费用的影响较小, 在高交易费用率下相对稳定. 相比之下, 尽管已将调仓幅度纳入本文策略优化目标中, 但其仍受交易费用影响较大, 这可能与本文策略以最大化累积财富作为主要优化目标有关. 尽管如此, 本文提出的教师模型和学生模型仍然优于大部分对比策略, 表现出较高的累积财富水平, 说明了本文策略具有较强的鲁棒性. 考虑到现实投资交易费用通常更低, 本文策略适用于现实投资场景, 能在考虑交易费用的情况下仍然具有较好的投资绩效.

5.5.5 消融实验

为探索教师模型各个模块对模型整体表现的影响, 本文对模型进行了模块层面的消融实验. 具体而言, 本文分别移除了教师模型的长序列表征提取器(记为Teacher-Model)和跨资产注意力网络(记为Teacher-Model), 并进行消融实验. 表 6报告了关键指标下的相应结果.
表6 在关键指标上的教师模型消融实验
SSE HSI CMEG Nasdaq-100
CW SR MDD CW SR MDD CW SR MDD CW SR MDD
Teacher-Model 2.29 1.31 0.18 1.12 0.03 0.29 1.50 0.88 0.15 2.38 1.10 0.22
Teacher-Model 0.43 1.14 0.62 1.00 0.21 0.29 1.49 0.48 0.21 1.00 0.12 0.36
Teacher-Model 1.12 0.01 0.27 0.74 0.51 0.38 0.99 0.26 0.27 1.71 0.48 0.28
注: 表中粗体表示该列最大值, 下划线表示第二大值.
从表中可以看出, 相比于教师模型, 消融模型在大部分指标上都只能取得次优表现. 结果表明长序列表征提取器和跨资产注意力网络对教师模型的表现都起着重要作用, 移除这两个组件中的任何一个都会导致性能显著下降. 结果是显然的, 因为长序列表征提取器负责处理不同资产的时间序列, 而跨资产注意力网络通过考虑资产间的交互关系进行投资组合决策, 两个组件分别在模型的不同阶段各自起着重要的作用.

5.5.6 敏感性分析

为进一步证明模型的鲁棒性, 本文选取了教师模型的两个关键参数进行敏感性分析, 包括长序列表征提取器中的隐单元维度D及跨资产注意力网络中的预设最大投资资产数G, 表 78报告了关键指标下的相应结果.
表7 关于参数隐单元维度D的教师模型敏感性分析
SSE HSI CMEG Nasdaq-100
CW SR MDD CW SR MDD CW SR MDD CW SR MDD
Teacher-Model (D=16) 2.29 1.31 0.18 1.12 0.03 0.29 1.50 0.88 0.15 2.38 1.10 0.22
Teacher-Model (D=32) 2.33 1.15 0.21 1.58 0.62 0.26 1.85 0.83 0.22 1.90 0.50 0.27
Teacher-Model (D=64) 2.57 1.59 0.18 1.34 0.52 0.22 1.62 0.77 0.15 1.47 0.27 0.31
Teacher-Model (D=128) 1.79 0.80 0.25 1.31 0.36 0.31 2.45 2.29 0.07 1.97 0.61 0.31
注: 表中阴影行代表本文参数结果.
表8 关于参数预设最大投资资产数G的教师模型敏感性分析
SSE HSI CMEG Nasdaq-100
CW SR MDD CW SR MDD CW SR MDD CW SR MDD
Teacher-Model (G=m/10) 2.30 1.31 0.18 1.11 0.01 0.30 1.47 0.78 0.16 2.42 1.13 0.22
Teacher-Model (G=m/2) 2.29 1.31 0.18 1.12 0.03 0.29 1.50 0.88 0.15 2.38 1.10 0.22
Teacher-Model (G=m) 2.29 1.31 0.18 1.12 0.03 0.29 1.50 0.86 0.15 2.39 1.11 0.22
注: 表中阴影行代表本文参数结果.
通过敏感性分析可以看出, 不同的隐单元维度D和预设最大投资资产数G对模型性能有一定的影响. 尽管本文对超参数的选择主要基于前人经验, 但总体模型展现出了良好的适应性和稳健性, 在四个市场上均表现稳定. 通过在验证集进行参数寻优可能会获得更好的样本外表现, 但这超出了本文的讨论范围.
为进一步探究关键特征比例对学生模型的影响, 本文进行了学生模型的关键特征分析, 以探究在可解释端到端投资组合模型中, 如仅使用重要程度较高的特征, 能否产生更好的效果. 图 6报告了相应结果.
图6 在收益指标上的学生模型关键特征分析

Full size|PPT slide

通过关键特征分析可以看出, 除Nasdaq-100数据集以外, 所有数据集都存在一个介于40% 至50% 之间的关键特征比例阈值. 特别地, 在HSI数据集上, 当仅使用40% 的关键特征时, 学生模型能取得最优的表现. 这一结果强调了在学生模型构建过程中进行特征选择的重要性, 以及在实际应用中对关键特征进行优先考虑的必要性.

6 总结

本文首先基于改进Transformer和强化学习构建了一个数据驱动的端到端投资组合模型, 用于进行动态资产配置. 然后, 通过显著性向量计算识别对资产配置决策具有较大影响的关键特征, 进而基于知识蒸馏技术和线性回归方程从复杂深度学习模型中提取可解释的线性决策模型. 提取的线性模型反映投资组合决策和资产特征之间的线性关系. 实验结果表明, 与基于复杂深度学习模型的策略及经典投资组合策略相比, 本文提出的可解释端到端投资组合策略在保证决策性能的同时, 提高了模型的决策透明度, 使得关键特征与决策间关系更易理解. 本文提供了一种新的思路, 能够为可解释端到端决策问题的相关研究提供参考, 有助于促进人工智能技术在经济金融领域的应用.

附录

A 数据集组成成分

本附录详细列出了研究中使用的四个数据集各自的组成成分, 包括数据集样本的具体信息. 这些资产涉及全球各大股票和期货市场的代表性样本. 列出数据集的具体组成成分, 可使读者全面了解数据集的构成, 并协助研究的重复验证.

A.1 SSE数据集组成成分

表9 SSE数据集公司缩写名称与证券代码对照表
公司缩写名称 证券代码 公司缩写名称 证券代码
包钢股份 600010.SS 贵州茅台 600519.SS
中国石化 600028.SS 海尔智家 600690.SS
中信证券 600030.SS 联想控股 600745.SS
三一重工 600031.SS 杏花村汾酒 600809.SS
保利发展 600048.SS 伊利股份 600887.SS
联通 600050.SS 三峡集团 600900.SS
特变电工 600089.SS 神华能源 601088.SS
上汽集团 600104.SS 兴业银行 601166.SS
中国稀土 600111.SS 中国平安 601318.SS
复星医药 600196.SS 中国中铁 601390.SS
恒瑞医药 600276.SS 工商银行 601398.SS
万华化学 600309.SS 中国人寿 601628.SS
南方科技 600406.SS 中国石油 601857.SS
漳州片仔癀 600436.SS 紫金矿业 601899.SS
通威股份 600438.SS 中远海运 601919.SS

A.2 HSI数据集组成成分

表10 HSI数据集公司缩写名称与证券代码对照表
公司缩写名称 证券代码 公司缩写名称 证券代码
长和 0001.HK 信义玻璃 0868.HK
中电 0002.HK 中海油 0883.HK
中华煤气 0003.HK 建行 0939.HK
汇丰 0005.HK 移动 0941.HK
电能实业 0006.HK 中芯国际 0981.HK
恒生银行 0011.HK 联想 0992.HK
恒基地产 0012.HK 长江基建 1038.HK
新鸿基地产 0016.HK 恒安国际 1044.HK
新世界 0017.HK 神华能源 1088.HK
银河娱乐 0027.HK 石药 1093.HK
港铁 0066.HK 华润置地 1109.HK
恒隆地产 0101.HK 石药股份 1177.HK
吉利汽车 0175.HK 比亚迪 1211.HK
阿里健康 0241.HK 工行 1398.HK
中信泰富 0267.HK 碧桂园 2007.HK
华润啤酒 0291.HK 安踏 2020.HK
东方海外 0316.HK 顺络电子 2313.HK
康师傅 0322.HK 蒙牛 2319.HK
中石化 0386.HK 李宁 2331.HK
港交所 0388.HK 舜宇光学 2382.HK
创科实业 0669.HK 中银香港 2388.HK
中海外 0688.HK 中国人寿 2628.HK
腾讯 0700.HK 恩华能源 2688.HK
联通 0762.HK 紫金矿业 2899.HK
领展房产信托 0823.HK 招商银行 3968.HK
华润电力 0836.HK 中行 3988.HK
中石油 0857.HK

A.3 CMEG数据集组成成分

表11 CMEG数据集期货名称、类别与交易代码对照表
期货名称 期货类别 交易代码
玉米期货 农产品期货 ZC=F
豆粕期货 农产品期货 ZS=F
小麦期货 农产品期货 ZW=F
棉花期货 农产品期货 CT=F
原油期货 能源期货 CL=F
布伦特原油期货 能源期货 BZ=F
天然气期货 能源期货 NG=F
无铅汽油期货 能源期货 RB=F
采暖油期货 能源期货 HO=F
标普500股指期货 股指期货 ES=F
纳斯达克100股指期货 股指期货 NQ=F
道琼斯工业平均指数期货 股指期货 YM=F
欧元兑美元期货 外汇期货 6E=F
日元兑美元期货 外汇期货 6J=F
英镑兑美元期货 外汇期货 6B=F
澳元兑美元期货 外汇期货 6A=F
瑞郎兑美元期货 外汇期货 6S=F
墨西哥比索兑美元期货 外汇期货 6M=F
新西兰元兑美元期货 外汇期货 6N=F
2年期美国国债期货 利率期货 ZT=F
5年期美国国债期货 利率期货 ZF=F
10年期美国国债期货 利率期货 ZN=F
黄金期货 金属期货 GC=F
白银期货 金属期货 SI=F
铜期货 金属期货 HG=F

A.4 Nasdaq-100数据集组成成分

表12 Nasdaq-100数据集公司缩写名称与证券代码对照表
公司缩写名称 证券代码 公司缩写名称 证券代码
苹果 AAPL 英特尔公司 INTC
Adobe ADBE 阿斯麦公司 INTU
亚德诺半导体 ADI 直觉外科公司 ISRG
自动数据处理公司 ADP 克里格胡椒博士公司 KDP
欧特克公司 ADSK 科磊公司 KLAC
美国电力公司 AEP 德国林德公司 LIN
应用材料公司 AMAT 泛林集团 LRCX
美国超微公司 AMD 露露乐檬 LULU
安进 AMGN 万豪国际 MAR
亚马逊 AMZN 微芯科技公司 MCHP
安西斯公司 ANSS 亿滋国际公司 MDLZ
阿斯麦公司 ASML 美卡多公司 MELI
博通公司 AVGO 怪物饮料 MNST
阿斯利康公司 AZN 美满电子科技公司 MRVL
渤健公司 BIIB 微软公司 MSFT
普利斯林公司 BKNG 美光科技公司 MU
贝克尔休斯公司 BKR 奈飞公司 NFLX
可口可乐企业 CCEP 英伟达公司 NVDA
铿腾电子 CDNS 奥多明尼昂货运公司 ODFL
特许通讯公司 CHTR 安森美半导体 ON
康卡斯特公司 CMCSA 奥莱利汽车公司 ORLY
开市客 COST 沛齐公司 PAYX
科帕特 CPRT 帕卡公司 PCAR
思科系统公司 CSCO 百事可乐公司 PEP
科斯塔 CSGP 高通公司 QCOM
CSX运输 CSX 再生元制药公司 REGN
信达思 CTAS 儒博实业 ROP
高知特信息技术公司 CTSH 罗斯百货公司 ROST
美元树 DLTR 星巴克公司 SBUX
德康医疗 DXCM 天狼星卫星广播公司 SIRI
艺电公司 EA 新思科技 SNPS
爱克斯龙 EXC T-Mobile美国公司 TMUS
快扣 FAST 特斯拉 TSLA
飞塔信息公司 FTNT 两方互动软件公司 TTWO
吉利德科学公司 GILD 德州仪器公司 TXN
谷歌 GOOG 威瑞斯克分析公司 VRSK
谷歌A GOOGL 福泰制药 VRTX
霍尼韦尔国际公司 HON 沃博联 WBA
IDEXX实验室 IDXX 华纳兄弟探索公司 WBD
因美纳公司 ILMN 卓越能源 XEL

参考文献

陈晓红, 龚思远, 贺怡帆, 曹文治, 刘厚盾, 基于CNN与LSTM多组合策略的中国碳市场价格预测[J]. 计量经济学报, 2022, 2 (2): 237- 256.
Chen X H , Gong S Y , He Y F , Cao W Z , Liu H D , Carbon Price Forecasting in Chinese Carbon Trading Market Based on Multi-Strategy CNN-LSTM[J]. China Journal of Econometrics, 2022, 2 (2): 237- 256.
孔祥维, 唐鑫泽, 王子明, 人工智能决策可解释性的研究综述[J]. 系统工程理论与实践, 2021, 41 (2): 524- 536.
Kong X W , Tang X Z , Wang Z M , A Survey of Explainable Artificial Intelligence Decision[J]. Systems Engineering—Theory & Practice, 2021, 41 (2): 524- 536.
李宗铭, 房勇, 基于LSTM神经网络的行业资产配置模型[J]. 系统工程理论与实践, 2021, 41 (8): 2045- 2055.
Li Z M , Fang Y , Industry Asset Allocation Model based on LSTM Neural Network[J]. Systems Engineering—Theory & Practice, 2021, 41 (8): 2045- 2055.
马超群, 杨竟澜, 任奕帅, 谢志斌, 基于H-LSTM模型的沪深300指数价格预测研究[J]. 计量经济学报, 2021, 1 (2): 437- 451.
Ma C Q , Yang J L , Ren Y S , Xie Z B , The Prediction of Shanghai and Shenzhen 300 Index Based on H-LSTM Model[J]. China Journal of Econometrics, 2021, 1 (2): 437- 451.
王祖德, 陈彩华, 李敏, 不确定性环境下在线实时定价的深度强化学习策略[J]. 管理工程学报, 2023, 37 (1): 117- 124.
Wang Z D , Chen C H , Li M , Online Real-time Dynamic Pricing using Deep Reinforcement Learning Policy under Uncertainty[J]. Journal of Industrial Engineering and Engineering Management, 2023, 37 (1): 117- 124.
张学勇, 李沛然, 基于集成神经网络模型的知情交易股票价格异象研究[J]. 计量经济学报, 2023, 3 (3): 683- 706.
Zhang X Y , Li P R , The "Informed Trading Anomaly" in China's A-Share Market—Research Based on Ensemble Neural Network[J]. China Journal of Econometrics, 2023, 3 (3): 683- 706.
Aboussalah A M , Xu Z , Lee C G , What is the Value of the Cross-sectional Approach to Deep Reinforcement Learning?[J]. Quantitative Finance, 2022, 22 (6): 1091- 1111.
Arrieta A B , Díaz-Rodríguez N , Del Ser J , Bennetot A , Tabik S , et al. Explainable Artificial Intelligence (XAI): Concepts, Taxonomies, Opportunities and Challenges toward Responsible AI[J]. Information Fusion, 2020, 58, 82- 115.
Bai S, Kolter J Z, Koltun V, (2018). An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling[J]. arXiv preprint arXiv: 1803.01271.
Borodin A, El-Yaniv R, Gogan V, (2003). Can We Learn to Beat the Best Stock[R]. Advances in Neural Information Processing Systems, 16.
Bussmann N , Giudici P , Marinelli D , Papenbrock J , Explainable AI in Fintech Risk Management[J]. Frontiers in Artificial Intelligence, 2020, 3, 26.
Gao J, Wang X, Wang Y, Xie X, (2019). Explainable Recommendation through Attentive Multi-view Learning[C]//Proceedings of the AAAI Conference on Artificial Intelligence: 3622–3629.
Cong L W, Tang K, Wang J, Zhang Y, (2021). AlphaPortfolio: Direct Construction Through Deep Reinforcement Learning and Interpretable AI[J]. Available at SSRN: 3554486.
Cover T M , Universal Portfolios[J]. Mathematical Finance, 1991, 1 (1): 1- 29.
De Cremer D, (2020). What Does Building a Fair AI Really Entail[R]. Harvard Business Review.
Du J , Mean-variance Portfolio Pptimization with Deep Learning Based-forecasts for Cointegrated Stocks[J]. Expert Systems with Applications, 2022, 201, 117005.
EI-Sappagh S , Alonso J M , Islam S M R , Sultan A M , Kwak K S , A Multiplayer Multimodal Detection and Prediction Model based on Explainable Artificial Intelligence for Alzheimer's Disease[J]. Scientific Reports, 2021, 11 (1): 2660.
Fu R , Huang Y , Singh P V , Crowds, Lending, Machine, and Bias[J]. Information Systems Research, 2021, 32 (1): 72- 92.
Fu R , Aseri M , Singh P V , Srinivasan K , "Un" Fair Machine Learning Algorithms[J]. Management Science, 2022, 68 (6): 4173- 4195.
Gaivoronski A A , Stella F , Stochastic Nonstationary Optimization for Finding Universal Portfolios[J]. Annals of Operations Research, 2000, 100, 165- 188.
Guan M, Liu X Y, (2021). Explainable Deep Reinforcement Learning for Portfolio Management: An Empirical Approach[C]//Proceedings of the Second ACM International Conference on AI in Finance, 1–9.
Helmbold D P , Schapire R E , Singer Y , Warmuth M K , On-line Portfolio Selection Using Multiplicative Updates[J]. Mathematical Finance, 1998, 8 (4): 325- 347.
Hendershott T , Zhang X , Zhao J L , Zheng Z , FinTech as a Game Changer: Overview of Research Frontiers[J]. Information Systems Research, 2021, 32 (1): 1- 17.
Hinton G, Vinyals O, Dean J, (2015). Distilling the Knowledge in a Neural Network[J]. arXiv preprint arXiv: 1503.02531.
Hochreiter S , Schmidhuber J , Long Short-term Memory[J]. Neural Computation, 1997, 9 (8): 1735- 1780.
Hopfield J J, (1982). Neural Networks and Physical Systems with Emergent Collective Computational Abilities[C]//Proceedings of the National Academy of Sciences, 79(8): 2554–2558.
Hu L, Jian S, Cao L, Chen Q, (2018). Interpretable Recommendation via Attraction Modeling: Learning Multilevel Attractiveness over Multimodal Movie Contents[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence: 3400–3406.
Huang D , Zhou J , Hoi S C H , Zhou S , Robust Median Reversion Strategy for Online Portfolio Selection[J]. IEEE Transactions on Knowledge and Data Engineering, 2016, 28 (9): 2480- 2493.
Janizek J D , Sturmfels P , Lee S I , Explaining Explanations: Axiomatic Feature Interactions for Deep Networks[J]. The Journal of Machine Learning Research, 2021, 22 (1): 4687- 4740.
Jiang Z, Xu D, Liang J, (2017). A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem[J]. arXiv preprint arXiv: 1706.10059.
Kapishnikov A, Venugopalan S, Avci B, Wedin B, Terry M, et al. (2021). Guided Integrated Gradients: An Adaptive Path Method for Removing Noise[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition: 5050–5058.
Kelly J L , A New Interpretation of Information Rate[J]. The Bell System Technical Journal, 1956, 35 (4): 917- 926.
Li B , Zhao P , Hoi S C H , Gopalkrishnan V , PAMR: Passive Aggressive Mean Reversion Strategy for Portfolio Selection[J]. Machine Learning, 2012, 87, 221- 258.
Li B , Hoi S C H , Zhao P , Gopalkrishnan V , Confidence Weighted Mean Meversion Strategy for Online Portfolio Selection[J]. ACM Transactions on Knowledge Discovery from Data, 2013, 7 (1): 1- 38.
Li B , Hoi S C H , Sahoo D , Zhao P , Liu Z Y , Moving Average Reversion Strategy for On-line Portfolio Selection[J]. Artificial Intelligence, 2015, 222, 104- 123.
Li B , Sahoo D , Hoi S C H , OLPS: A Toolbox for On-line Portfolio Selection[J]. Journal of Machine Learning Research, 2016, 17 (35): 1- 5.
Li J , Zhang Y , Yang X , Chen L , Online Portfolio Management via Deep Reinforcement Learning with High-frequency Data[J]. Information Processing and Management, 2023, 60 (3): 103247.
Liang Z, Chen H, Zhu J, Jiang K, Li Y, (2018). Adversarial Deep Reinforcement Learning in Portfolio Management[J]. arXiv preprint arXiv: 1808.09940.
Ma Y , Han R , Wang W , Portfolio Optimization with Return Prediction Using Deep Learning and Machine Learning[J]. Expert Systems with Applications, 2021, 165, 113973.
Markowits H M , Portfolio Selection[J]. Journal of Finance, 1952, 7 (1): 71- 91.
Michaud R O , The Markowitz Optimization Enigma: Is 'optimized' Optimal?[J]. Financial Analysts Journal, 1989, 45 (1): 31- 42.
Niu H, Li S, Li J, (2022). MetaTrader: An Reinforcement Learning Approach Integrating Diverse Policies for Portfolio Optimization[C]//Proceedings of the 31st ACM International Conference on Information & Knowledge Management: 1573–1583.
Pintelas E , Liaskos M , Livieris I E , Kotsiantis S , Pintelas P , A Novel Explainable Image Classification Framework: Case Study on Skin Cancer and Plant Disease Prediction[J]. Neural Computing and Applications, 2021, 33 (22): 15171- 15189.
Sachan S , Yang J B , Xu D L , Benavides D E , Li Y , An Explainable AI Decision-support-system to Automate Loan Underwriting[J]. Expert Systems with Applications, 2020, 144, 113100.
Samek W , Montavon G , Lapuschkin S , Anders C J , Müller K R , Explaining Deep Neural Networks and Beyond: A Review of Methods and Applications[J]. Proceedings of the IEEE, 2021, 109 (3): 247- 278.
Simonyan K, Vedaldi A, Zisserman, (2013). Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps[J]. arXiv preprint arXiv: 1312.6034.
Simonyan K, Vedaldi A, Zisserman A, (2014). Deep inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps[J]. arXiv preprint arXiv: 1312.6034.
Singer Y , Switching Portfolios[J]. International Journal of Neural Systems, 1997, 8 (4): 445- 455.
Smilkov D, Thorat N, Kim B, Viégas F, Wattenberg M, (2017). Smoothgrad: Removing Noise by Adding Noise[J]. arXiv preprint arXiv: 1706.03825.
Springenberg J T, Dosovitskiy A, Brox T, Riedmiller M, (2014). Striving for Simplicity: The all Convolutional Net[J]. arXiv preprint arXiv: 1412.6806.
Sundararajan M, Taly A, Yan Q, (2017). Axiomatic Attribution for Deep Networks[C]//International Conference on Machine Learning. PMLR: 3319–3328.
Tang Z , Chuang K V , DeCarli C , Jin L W , Beckett L , et al. Interpretable Classification of Alzheimer's Disease Pathologies with a Convolutional Neural Network Pipeline[J]. Nature Communications, 2019, 10 (1): 2173.
Tian H , Zheng X , Zhao K , Liu M W , Zeng D D , Inductive Representation Learning on Dynamic Stock Co-Movement Graphs for Stock Predictions[J]. INFORMS Journal on Computing, 2022, 34 (4): 1940- 1957.
Uysal A S , Li X , Mulvey J M , End-to-end Risk Budgeting Portfolio Optimization with Neural Networks[J]. Annals of Operations Research, 2023, 1- 30.
Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, et al. (2017). Attention is All You Need[R]. Advances in Neural Information Processing Systems, 30.
Wang Z F, Fredrikson M, Datta A, (2022). Robust Models Are More Interpretable Because Attributions Look Normal[C]//International Conference on Machine Learning: 22625–22651.
Wang L , Nie R , Yu Z , Xin R , Zheng C , et al. An Interpretable Deep Learning Architecture of Capsule Networks for Identifying Cell-type Gene Expression Programs from Single-cell RNA-sequencing data[J]. Nature Machine Intelligence, 2020, 2 (11): 693- 703.
Wearn O R , Freeman R , Jacoby D M P , Responsible AI for Conservation[J]. Nature Machine Intelligence, 2019, 1 (2): 72- 73.
Yang R, Wang B, Bilgic M, (2023). IDGI: A Framework to Eliminate Explanation Noise from Integrated Gradients[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 23725–23734.
Ye L , Yang Y , Zeng J X , An Interpretable Mechanism for Personalized Recommendation based on Cross Feature[J]. Journal of Intelligent and Fuzzy Systems, 2021, 40 (5): 9787- 9798.
Yoo J, Soun Y, Park Y C, Kang U, (2021). Accurate Multivariate Stock Movement Prediction via Data-axis Transformer with Multi-level Contexts[C]//Proceedings of the 27th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining: 2037–2045.
You Y, Li J, Reddi S, Hseu J, Kumar S, et al. (2019). Large Batch Optimization for Deep Learning: Training BERT in 76 Minutes[J]. arXiv preprint arXiv: 1904.00962.
Zeiler M D, Fergus R, (2014). Visualizing and Understanding Convolutional Networks[C]//European Conference on Computer Vision: 818–833.
Zhang N , Xu H , Fairness of Ratemaking for Catastrophe Insurance: Lessons from Machine Learning[J]. Information Systems Research, 2023, 35 (2): 469- 488.
Zhang Y , Yang X , Online Portfolio Selection Strategy Based on Combining Experts' Advice[J]. Computational Economics, 2017, 50, 141- 159.
Zhang Y , Lin H , Yang X , Long W , Combining Expert Weights for Online Portfolio Selection Based on the Gradient Descent Algorithm[J]. Knowledge-Based Systems, 2021, 234, 107533.
Zhang Y , Zhao P , Wu Q , Li B , Huang J , et al. Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2022, 34 (1): 236- 248.

基金

国家自然科学基金(72371080)
广东省基础与应用基础研究基金(2024A1515012670)
广东省基础与应用基础研究基金(2023A1515012840)
广州市基础与应用基础研究专题项目(2024A04J6602)

版权

版权所有,未经授权。
PDF(1020 KB)

1567

Accesses

0

Citation

Detail

段落导航
相关文章

/