
基于Transformer和关键特征的可解释端到端投资组合策略
Interpretable End-to-end Portfolio Selection Strategy Based on Transformer and Key Features
基于深度学习的端到端投资组合策略具有较高的决策性能, 但其黑箱操作使得决策机制缺乏可解释性. 本文使用深度学习、强化学习及知识蒸馏方法, 构建了兼具决策能力和可解释性的端到端投资组合策略. 首先, 利用改进Transformer模型缓解其内置的二次复杂性问题, 并据此提出长序列表征提取器. 其次, 通过跨资产注意力网络和强化学习算法, 构建一个非线性的“黑箱”模型, 用于金融资产的动态配置. 然后, 通过计算模型输出相对于资产特征的梯度, 计算在特征域上的显著性向量, 从而识别出影响较大的关键特征. 最后, 在关键特征上提取一个线性回归模型, 进而得到了简单而具有经济学解释意义的端到端投资组合策略. 实证结果显示, 这种基于Transformer和关键特征的可解释端到端投资组合策略可以获得较好的收益与风险表现, 兼具深度学习决策性能和解释性. 本文的研究为深度学习在金融领域的应用提供了一种兼具高效决策能力与可解释性的投资组合策略.
The end-to-end portfolio selection strategy based on deep learning exhibits high decision-making performance, but its black-box nature hinders interpretability of the decision mechanism. In this paper, we propose a comprehensive end-to-end portfolio selection strategy that combines decision-making capability with interpretability using deep learning, reinforcement learning, and knowledge distillation method. Firstly, by leveraging an improved Transformer to alleviate its quadratic complexity issue, a long sequence representations extractor is proposed. Then, through the employment of a cross-assets attention network and reinforcement learning algorithm, a non-linear "black-box" model is constructed to facilitate dynamic allocation in financial assets. Next, by calculating the gradients of model's outputs with respect to the asset features, we compute significance vectors in the feature space to identify key influential features. Finally, a linear regression model is applied to the identified key features, resulting in a straightforward and economically interpretable end-to-end portfolio selection strategy. Empirical results demonstrate that this interpretable end-to-end portfolio selection strategy based on Transformer and key features achieves favorable return and risk performance, with both decision-making power of deep learning and interpretability. This study provides a portfolio selection strategy that combines efficient decision-making capability and interpretability, contributing to the application of deep learning in the financial domain.
Transformer / 强化学习 / 知识蒸馏 / 线性模型 / 可解释端到端投资组合策 {{custom_keyword}} /
Transformer / reinforcement learning / knowledge distillation / linear model / interpretable end-to-end portfolio selection strategy {{custom_keyword}} /
表1 实验数据集基本统计信息 |
数据集 | 市场 | 国家/地区 | 总资产数 | 时间跨度 | 总期数 | 特征数 |
SSE | 股票 | 中国 | 30 | 5/7/2010--26/6/2023 | 678: 406/136/136 | 93 |
HSI | 股票 | 中国香港 | 53 | 5/7/2010--26/6/2023 | 678: 406/136/136 | 93 |
CMEG | 期货 | 美国 | 25 | 5/7/2010--26/6/2023 | 678: 406/136/136 | 93 |
Nasdaq-100 | 股票 | 美国 | 80 | 5/7/2010--26/6/2023 | 678: 406/136/136 | 93 |
表2 本文对比策略及描述 |
对比策略 | 描述 | |
基准策略 | Market | 市场策略, 即投资期初平均持有资产组合所有资产至投资期末 |
UCRP (Kelly, 1956; Cover, 1991) | 均匀定常再调整策略, 即在每个调整期将资金均匀分配到每个资产 | |
动量策略 | UP (Cover, 1991) | 泛证券投资组合策略, 利用所有定常再调整策略的加权平均确定下期投资组合比例 |
EG (Helmbold et al., 1998) | 指数梯度投资组合策略, 基于实时价格信息的相对熵距离确定下期投资组合比例 | |
SCRP (Gaivoronski et al., 2000) | 连续定常再调整策略, 基于实时最优定常再调整策略确定下期投资组合比例 | |
反转策略 | ANTI | 基于窗口统计相关性的自适应投资组合策略 |
ANTI | 基于窗口统计相关性的自适应投资组合策略 | |
PAMR (Li et al., 2012) | 基于资产单期回归特性和被动主动学习的投资组合策略 | |
CWMR-Var (Li et al., 2013) | 基于资产单期回归特性和置信权重算法的投资组合策略 | |
CWMR-Stdev (Li et al., 2013) | 基于资产单期回归特性和置信权重算法的投资组合策略 | |
OLMAR-S (Li et al., 2015) | 基于资产多期回归特性和被动主动学习的投资组合策略 | |
OLMAR-E (Li et al., 2015) | 基于资产多期回归特性和被动主动学习的投资组合策略 | |
RMR (Huang et al., 2016) | 基于资产多期鲁棒回归特性和被动主动学习的投资组合策略 | |
元学习策略 | SP (Singer, 1997) | 基于市场非平稳性的转换投资组合策略 |
WAAS (Zhang and Yang, 2017) | 基于弱集成算法和最优股票意见的投资组合策略 | |
CW-OGD (Zhang et al., 2021) | 基于在线梯度下降算法和组合权重的投资组合策略 | |
本文策略 | Teacher-Model | 本文基于改进Transformer模型实现的端到端投资组合策略, 简记为教师模型 |
Student-Model | 本文基于知识蒸馏和关键特征实现的可解释端到端投资组合策略, 简记为学生模型 |
表3 各数据集回归方程 |
重叠特征 | 动量特征 | 量价特征 | 周期特征 | 价格特征 | 波动特征 | 模式特征 | ||
SSE | 平均值 | 0.0035 | 0.0092 | |||||
标准差 | 0.0027 | 0.0115 | 0.0279 | 0.0014 | 0.0008 | 0.0032 | 0.0035 | |
最小值 | ||||||||
最大值 | 0.0066 | 0.0337 | 0.1284 | 0.0048 | 0.0041 | 0.0111 | 0.0075 | |
HSI | 平均值 | 0.0033 | 0.0214 | |||||
标准差 | 0.0033 | 0.0089 | 0.0533 | 0.0042 | 0.0054 | 0.0068 | 0.0044 | |
最小值 | ||||||||
最大值 | 0.0116 | 0.0311 | 0.1887 | 0.0124 | 0.0273 | 0.0152 | 0.0147 | |
CMEG | 平均值 | 0.0106 | 0.0017 | |||||
标准差 | 0.0119 | 0.0259 | 0.0716 | 0.0095 | 0.0125 | 0.0172 | 0.0149 | |
最小值 | ||||||||
最大值 | 0.0481 | 0.0826 | 0.2227 | 0.0338 | 0.0440 | 0.0663 | 0.0625 | |
Nasdaq-100 | 平均值 | 0.0004 | 0.0005 | 0.0037 | 0.0026 | 0.0011 | ||
标准差 | 0.0016 | 0.0093 | 0.0278 | 0.0045 | 0.0056 | 0.0121 | 0.0020 | |
最小值 | ||||||||
最大值 | 0.0031 | 0.0219 | 0.0681 | 0.0154 | 0.0188 | 0.0352 | 0.0062 |
表4 不同数据集上各策略的收益指标比较 |
SSE | HSI | CMEG | Nasdaq-100 | ||||||||||||
CW | APY | SR | CW | APY | SR | CW | APY | SR | CW | APY | SR | ||||
Market | 1.08 | 0.03 | 0.93 | 1.15 | 0.05 | 0.09 | 1.31 | 0.11 | 0.35 | ||||||
UCRP | 1.15 | 0.05 | 0.08 | 0.97 | 1.21 | 0.08 | 0.30 | 1.36 | 0.12 | 0.42 | |||||
UP | 1.14 | 0.05 | 0.08 | 0.97 | 1.22 | 0.08 | 0.30 | 1.35 | 0.12 | 0.42 | |||||
EG | 1.14 | 0.05 | 0.07 | 0.97 | 1.21 | 0.08 | 0.28 | 1.35 | 0.12 | 0.42 | |||||
SCRP | 0.51 | 0.52 | 0.48 | 1.46 | 0.16 | 0.22 | |||||||||
ANTI | 1.22 | 0.08 | 0.16 | 0.96 | 1.17 | 0.06 | 0.08 | 1.35 | 0.12 | 0.26 | |||||
ANTI | 1.37 | 0.13 | 0.34 | 0.93 | 1.49 | 0.17 | 0.38 | 0.89 | |||||||
PAMR | 0.79 | 0.92 | 1.07 | 0.03 | 1.55 | 0.18 | 0.45 | ||||||||
CWMR-Var | 0.76 | 0.98 | 1.15 | 0.06 | 0.04 | 1.44 | 0.15 | 0.34 | |||||||
CWMR-Stdev | 0.75 | 0.97 | 1.16 | 0.06 | 0.05 | 1.46 | 0.15 | 0.36 | |||||||
OLMAR-S | 0.72 | 0.66 | 1.12 | 0.04 | 0.01 | 1.36 | 0.12 | 0.21 | |||||||
OLMAR-E | 0.43 | 0.47 | 0.77 | 1.16 | 0.06 | 0.04 | |||||||||
RMR | 0.81 | 0.69 | 1.11 | 0.04 | 0.00 | 1.18 | 0.07 | 0.07 | |||||||
SP | 1.15 | 0.05 | 0.08 | 0.97 | 1.21 | 0.08 | 0.30 | 1.36 | 0.12 | 0.42 | |||||
WAAS | 1.14 | 0.05 | 0.07 | 0.97 | 1.21 | 0.08 | 0.28 | 1.39 | 0.13 | 0.47 | |||||
CW | 1.06 | 0.02 | 0.94 | 1.30 | 0.11 | 0.28 | 1.13 | 0.05 | 0.03 | ||||||
Teacher-Model | 2.29 | 0.37 | 1.31 | 1.12 | 0.05 | 0.03 | 1.50 | 0.17 | 0.88 | 2.38 | 0.39 | 1.10 | |||
Student-Model | 1.94 | 0.29 | 1.17 | 1.06 | 0.02 | 1.44 | 0.15 | 0.86 | 1.55 | 0.18 | 0.78 |
注: 表中粗体表示该列最大值, 下划线表示第二大值. |
表5 不同数据集上各策略的风险指标比较 |
SSE | HSI | CMEG | Nasdaq-100 | |||||
VR | MDD | VR | MDD | VR | MDD | VR | MDD | |
Market | 0.18 | 0.29 | 0.18 | 0.36 | 0.16 | 0.24 | 0.20 | 0.28 |
UCRP | 0.17 | 0.23 | 0.18 | 0.36 | 0.13 | 0.15 | 0.20 | 0.26 |
UP | 0.17 | 0.23 | 0.18 | 0.36 | 0.13 | 0.15 | 0.20 | 0.26 |
EG | 0.17 | 0.23 | 0.18 | 0.36 | 0.13 | 0.15 | 0.20 | 0.26 |
SCRP | 0.48 | 0.64 | 0.55 | 0.63 | 0.52 | 0.70 | 0.52 | 0.48 |
ANTI | 0.24 | 0.24 | 0.49 | 0.65 | 0.28 | 0.37 | 0.32 | 0.31 |
ANTI | 0.26 | 0.23 | 0.62 | 0.72 | 0.33 | 0.46 | 0.42 | 0.53 |
PAMR | 0.32 | 0.56 | 0.46 | 0.69 | 0.36 | 0.52 | 0.32 | 0.27 |
CWMR-Var | 0.31 | 0.56 | 0.47 | 0.72 | 0.37 | 0.51 | 0.32 | 0.27 |
CWMR-Stdev | 0.31 | 0.56 | 0.47 | 0.72 | 0.37 | 0.51 | 0.32 | 0.27 |
OLMAR-S | 0.41 | 0.58 | 0.54 | 0.81 | 0.46 | 0.60 | 0.40 | 0.39 |
OLMAR-E | 0.41 | 0.67 | 0.55 | 0.81 | 0.44 | 0.64 | 0.46 | 0.32 |
RMR | 0.40 | 0.55 | 0.56 | 0.79 | 0.44 | 0.57 | 0.39 | 0.38 |
SP | 0.17 | 0.23 | 0.18 | 0.36 | 0.13 | 0.15 | 0.20 | 0.26 |
WAAS | 0.17 | 0.23 | 0.18 | 0.35 | 0.13 | 0.16 | 0.20 | 0.26 |
CW-OGD | 0.24 | 0.33 | 0.23 | 0.37 | 0.24 | 0.29 | 0.24 | 0.34 |
Teacher-Model | 0.25 | 0.18 | 0.20 | 0.29 | 0.15 | 0.15 | 0.32 | 0.22 |
Student-Model | 0.21 | 0.16 | 0.17 | 0.29 | 0.13 | 0.15 | 0.18 | 0.16 |
表6 在关键指标上的教师模型消融实验 |
SSE | HSI | CMEG | Nasdaq-100 | ||||||||||||
CW | SR | MDD | CW | SR | MDD | CW | SR | MDD | CW | SR | MDD | ||||
Teacher-Model | 2.29 | 1.31 | 0.18 | 1.12 | 0.03 | 0.29 | 1.50 | 0.88 | 0.15 | 2.38 | 1.10 | 0.22 | |||
Teacher-Model | 0.43 | 0.62 | 1.00 | 0.29 | 1.49 | 0.48 | 0.21 | 1.00 | 0.36 | ||||||
Teacher-Model | 1.12 | 0.01 | 0.27 | 0.74 | 0.38 | 0.99 | 0.27 | 1.71 | 0.48 | 0.28 |
注: 表中粗体表示该列最大值, 下划线表示第二大值. |
表7 关于参数隐单元维度 |
SSE | HSI | CMEG | Nasdaq-100 | ||||||||||||
CW | SR | MDD | CW | SR | MDD | CW | SR | MDD | CW | SR | MDD | ||||
Teacher-Model ( | 2.29 | 1.31 | 0.18 | 1.12 | 0.03 | 0.29 | 1.50 | 0.88 | 0.15 | 2.38 | 1.10 | 0.22 | |||
Teacher-Model ( | 2.33 | 1.15 | 0.21 | 1.58 | 0.62 | 0.26 | 1.85 | 0.83 | 0.22 | 1.90 | 0.50 | 0.27 | |||
Teacher-Model ( | 2.57 | 1.59 | 0.18 | 1.34 | 0.52 | 0.22 | 1.62 | 0.77 | 0.15 | 1.47 | 0.27 | 0.31 | |||
Teacher-Model ( | 1.79 | 0.80 | 0.25 | 1.31 | 0.36 | 0.31 | 2.45 | 2.29 | 0.07 | 1.97 | 0.61 | 0.31 |
注: 表中阴影行代表本文参数结果. |
表8 关于参数预设最大投资资产数 |
SSE | HSI | CMEG | Nasdaq-100 | ||||||||||||
CW | SR | MDD | CW | SR | MDD | CW | SR | MDD | CW | SR | MDD | ||||
Teacher-Model ( | 2.30 | 1.31 | 0.18 | 1.11 | 0.01 | 0.30 | 1.47 | 0.78 | 0.16 | 2.42 | 1.13 | 0.22 | |||
Teacher-Model ( | 2.29 | 1.31 | 0.18 | 1.12 | 0.03 | 0.29 | 1.50 | 0.88 | 0.15 | 2.38 | 1.10 | 0.22 | |||
Teacher-Model ( | 2.29 | 1.31 | 0.18 | 1.12 | 0.03 | 0.29 | 1.50 | 0.86 | 0.15 | 2.39 | 1.11 | 0.22 |
注: 表中阴影行代表本文参数结果. |
表9 SSE数据集公司缩写名称与证券代码对照表 |
公司缩写名称 | 证券代码 | 公司缩写名称 | 证券代码 | |
包钢股份 | 600010.SS | 贵州茅台 | 600519.SS | |
中国石化 | 600028.SS | 海尔智家 | 600690.SS | |
中信证券 | 600030.SS | 联想控股 | 600745.SS | |
三一重工 | 600031.SS | 杏花村汾酒 | 600809.SS | |
保利发展 | 600048.SS | 伊利股份 | 600887.SS | |
联通 | 600050.SS | 三峡集团 | 600900.SS | |
特变电工 | 600089.SS | 神华能源 | 601088.SS | |
上汽集团 | 600104.SS | 兴业银行 | 601166.SS | |
中国稀土 | 600111.SS | 中国平安 | 601318.SS | |
复星医药 | 600196.SS | 中国中铁 | 601390.SS | |
恒瑞医药 | 600276.SS | 工商银行 | 601398.SS | |
万华化学 | 600309.SS | 中国人寿 | 601628.SS | |
南方科技 | 600406.SS | 中国石油 | 601857.SS | |
漳州片仔癀 | 600436.SS | 紫金矿业 | 601899.SS | |
通威股份 | 600438.SS | 中远海运 | 601919.SS |
表10 HSI数据集公司缩写名称与证券代码对照表 |
公司缩写名称 | 证券代码 | 公司缩写名称 | 证券代码 | |
长和 | 0001.HK | 信义玻璃 | 0868.HK | |
中电 | 0002.HK | 中海油 | 0883.HK | |
中华煤气 | 0003.HK | 建行 | 0939.HK | |
汇丰 | 0005.HK | 移动 | 0941.HK | |
电能实业 | 0006.HK | 中芯国际 | 0981.HK | |
恒生银行 | 0011.HK | 联想 | 0992.HK | |
恒基地产 | 0012.HK | 长江基建 | 1038.HK | |
新鸿基地产 | 0016.HK | 恒安国际 | 1044.HK | |
新世界 | 0017.HK | 神华能源 | 1088.HK | |
银河娱乐 | 0027.HK | 石药 | 1093.HK | |
港铁 | 0066.HK | 华润置地 | 1109.HK | |
恒隆地产 | 0101.HK | 石药股份 | 1177.HK | |
吉利汽车 | 0175.HK | 比亚迪 | 1211.HK | |
阿里健康 | 0241.HK | 工行 | 1398.HK | |
中信泰富 | 0267.HK | 碧桂园 | 2007.HK | |
华润啤酒 | 0291.HK | 安踏 | 2020.HK | |
东方海外 | 0316.HK | 顺络电子 | 2313.HK | |
康师傅 | 0322.HK | 蒙牛 | 2319.HK | |
中石化 | 0386.HK | 李宁 | 2331.HK | |
港交所 | 0388.HK | 舜宇光学 | 2382.HK | |
创科实业 | 0669.HK | 中银香港 | 2388.HK | |
中海外 | 0688.HK | 中国人寿 | 2628.HK | |
腾讯 | 0700.HK | 恩华能源 | 2688.HK | |
联通 | 0762.HK | 紫金矿业 | 2899.HK | |
领展房产信托 | 0823.HK | 招商银行 | 3968.HK | |
华润电力 | 0836.HK | 中行 | 3988.HK | |
中石油 | 0857.HK |
表11 CMEG数据集期货名称、类别与交易代码对照表 |
期货名称 | 期货类别 | 交易代码 |
玉米期货 | 农产品期货 | ZC=F |
豆粕期货 | 农产品期货 | ZS=F |
小麦期货 | 农产品期货 | ZW=F |
棉花期货 | 农产品期货 | CT=F |
原油期货 | 能源期货 | CL=F |
布伦特原油期货 | 能源期货 | BZ=F |
天然气期货 | 能源期货 | NG=F |
无铅汽油期货 | 能源期货 | RB=F |
采暖油期货 | 能源期货 | HO=F |
标普500股指期货 | 股指期货 | ES=F |
纳斯达克100股指期货 | 股指期货 | NQ=F |
道琼斯工业平均指数期货 | 股指期货 | YM=F |
欧元兑美元期货 | 外汇期货 | 6E=F |
日元兑美元期货 | 外汇期货 | 6J=F |
英镑兑美元期货 | 外汇期货 | 6B=F |
澳元兑美元期货 | 外汇期货 | 6A=F |
瑞郎兑美元期货 | 外汇期货 | 6S=F |
墨西哥比索兑美元期货 | 外汇期货 | 6M=F |
新西兰元兑美元期货 | 外汇期货 | 6N=F |
2年期美国国债期货 | 利率期货 | ZT=F |
5年期美国国债期货 | 利率期货 | ZF=F |
10年期美国国债期货 | 利率期货 | ZN=F |
黄金期货 | 金属期货 | GC=F |
白银期货 | 金属期货 | SI=F |
铜期货 | 金属期货 | HG=F |
表12 Nasdaq-100数据集公司缩写名称与证券代码对照表 |
公司缩写名称 | 证券代码 | 公司缩写名称 | 证券代码 | |
苹果 | AAPL | 英特尔公司 | INTC | |
Adobe | ADBE | 阿斯麦公司 | INTU | |
亚德诺半导体 | ADI | 直觉外科公司 | ISRG | |
自动数据处理公司 | ADP | 克里格胡椒博士公司 | KDP | |
欧特克公司 | ADSK | 科磊公司 | KLAC | |
美国电力公司 | AEP | 德国林德公司 | LIN | |
应用材料公司 | AMAT | 泛林集团 | LRCX | |
美国超微公司 | AMD | 露露乐檬 | LULU | |
安进 | AMGN | 万豪国际 | MAR | |
亚马逊 | AMZN | 微芯科技公司 | MCHP | |
安西斯公司 | ANSS | 亿滋国际公司 | MDLZ | |
阿斯麦公司 | ASML | 美卡多公司 | MELI | |
博通公司 | AVGO | 怪物饮料 | MNST | |
阿斯利康公司 | AZN | 美满电子科技公司 | MRVL | |
渤健公司 | BIIB | 微软公司 | MSFT | |
普利斯林公司 | BKNG | 美光科技公司 | MU | |
贝克尔休斯公司 | BKR | 奈飞公司 | NFLX | |
可口可乐企业 | CCEP | 英伟达公司 | NVDA | |
铿腾电子 | CDNS | 奥多明尼昂货运公司 | ODFL | |
特许通讯公司 | CHTR | 安森美半导体 | ON | |
康卡斯特公司 | CMCSA | 奥莱利汽车公司 | ORLY | |
开市客 | COST | 沛齐公司 | PAYX | |
科帕特 | CPRT | 帕卡公司 | PCAR | |
思科系统公司 | CSCO | 百事可乐公司 | PEP | |
科斯塔 | CSGP | 高通公司 | QCOM | |
CSX运输 | CSX | 再生元制药公司 | REGN | |
信达思 | CTAS | 儒博实业 | ROP | |
高知特信息技术公司 | CTSH | 罗斯百货公司 | ROST | |
美元树 | DLTR | 星巴克公司 | SBUX | |
德康医疗 | DXCM | 天狼星卫星广播公司 | SIRI | |
艺电公司 | EA | 新思科技 | SNPS | |
爱克斯龙 | EXC | T-Mobile美国公司 | TMUS | |
快扣 | FAST | 特斯拉 | TSLA | |
飞塔信息公司 | FTNT | 两方互动软件公司 | TTWO | |
吉利德科学公司 | GILD | 德州仪器公司 | TXN | |
谷歌 | GOOG | 威瑞斯克分析公司 | VRSK | |
谷歌A | GOOGL | 福泰制药 | VRTX | |
霍尼韦尔国际公司 | HON | 沃博联 | WBA | |
IDEXX实验室 | IDXX | 华纳兄弟探索公司 | WBD | |
因美纳公司 | ILMN | 卓越能源 | XEL |
陈晓红, 龚思远, 贺怡帆, 曹文治, 刘厚盾, 基于CNN与LSTM多组合策略的中国碳市场价格预测[J]. 计量经济学报, 2022, 2 (2): 237- 256.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
孔祥维, 唐鑫泽, 王子明, 人工智能决策可解释性的研究综述[J]. 系统工程理论与实践, 2021, 41 (2): 524- 536.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
李宗铭, 房勇, 基于LSTM神经网络的行业资产配置模型[J]. 系统工程理论与实践, 2021, 41 (8): 2045- 2055.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
马超群, 杨竟澜, 任奕帅, 谢志斌, 基于H-LSTM模型的沪深300指数价格预测研究[J]. 计量经济学报, 2021, 1 (2): 437- 451.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
王祖德, 陈彩华, 李敏, 不确定性环境下在线实时定价的深度强化学习策略[J]. 管理工程学报, 2023, 37 (1): 117- 124.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
张学勇, 李沛然, 基于集成神经网络模型的知情交易股票价格异象研究[J]. 计量经济学报, 2023, 3 (3): 683- 706.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Bai S, Kolter J Z, Koltun V, (2018). An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling[J]. arXiv preprint arXiv: 1803.01271.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Borodin A, El-Yaniv R, Gogan V, (2003). Can We Learn to Beat the Best Stock[R]. Advances in Neural Information Processing Systems, 16.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Gao J, Wang X, Wang Y, Xie X, (2019). Explainable Recommendation through Attentive Multi-view Learning[C]//Proceedings of the AAAI Conference on Artificial Intelligence: 3622–3629.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Cong L W, Tang K, Wang J, Zhang Y, (2021). AlphaPortfolio: Direct Construction Through Deep Reinforcement Learning and Interpretable AI[J]. Available at SSRN: 3554486.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
De Cremer D, (2020). What Does Building a Fair AI Really Entail[R]. Harvard Business Review.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Guan M, Liu X Y, (2021). Explainable Deep Reinforcement Learning for Portfolio Management: An Empirical Approach[C]//Proceedings of the Second ACM International Conference on AI in Finance, 1–9.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Hinton G, Vinyals O, Dean J, (2015). Distilling the Knowledge in a Neural Network[J]. arXiv preprint arXiv: 1503.02531.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Hopfield J J, (1982). Neural Networks and Physical Systems with Emergent Collective Computational Abilities[C]//Proceedings of the National Academy of Sciences, 79(8): 2554–2558.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Hu L, Jian S, Cao L, Chen Q, (2018). Interpretable Recommendation via Attraction Modeling: Learning Multilevel Attractiveness over Multimodal Movie Contents[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence: 3400–3406.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Jiang Z, Xu D, Liang J, (2017). A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem[J]. arXiv preprint arXiv: 1706.10059.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Kapishnikov A, Venugopalan S, Avci B, Wedin B, Terry M, et al. (2021). Guided Integrated Gradients: An Adaptive Path Method for Removing Noise[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition: 5050–5058.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Liang Z, Chen H, Zhu J, Jiang K, Li Y, (2018). Adversarial Deep Reinforcement Learning in Portfolio Management[J]. arXiv preprint arXiv: 1808.09940.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Niu H, Li S, Li J, (2022). MetaTrader: An Reinforcement Learning Approach Integrating Diverse Policies for Portfolio Optimization[C]//Proceedings of the 31st ACM International Conference on Information & Knowledge Management: 1573–1583.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Simonyan K, Vedaldi A, Zisserman, (2013). Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps[J]. arXiv preprint arXiv: 1312.6034.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Simonyan K, Vedaldi A, Zisserman A, (2014). Deep inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps[J]. arXiv preprint arXiv: 1312.6034.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Smilkov D, Thorat N, Kim B, Viégas F, Wattenberg M, (2017). Smoothgrad: Removing Noise by Adding Noise[J]. arXiv preprint arXiv: 1706.03825.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Springenberg J T, Dosovitskiy A, Brox T, Riedmiller M, (2014). Striving for Simplicity: The all Convolutional Net[J]. arXiv preprint arXiv: 1412.6806.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Sundararajan M, Taly A, Yan Q, (2017). Axiomatic Attribution for Deep Networks[C]//International Conference on Machine Learning. PMLR: 3319–3328.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, et al. (2017). Attention is All You Need[R]. Advances in Neural Information Processing Systems, 30.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Wang Z F, Fredrikson M, Datta A, (2022). Robust Models Are More Interpretable Because Attributions Look Normal[C]//International Conference on Machine Learning: 22625–22651.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Yang R, Wang B, Bilgic M, (2023). IDGI: A Framework to Eliminate Explanation Noise from Integrated Gradients[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 23725–23734.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Yoo J, Soun Y, Park Y C, Kang U, (2021). Accurate Multivariate Stock Movement Prediction via Data-axis Transformer with Multi-level Contexts[C]//Proceedings of the 27th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining: 2037–2045.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
You Y, Li J, Reddi S, Hseu J, Kumar S, et al. (2019). Large Batch Optimization for Deep Learning: Training BERT in 76 Minutes[J]. arXiv preprint arXiv: 1904.00962.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Zeiler M D, Fergus R, (2014). Visualizing and Understanding Convolutional Networks[C]//European Conference on Computer Vision: 818–833.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
〈 |
|
〉 |