
在大数据框架下基于吉布斯抽样的随机搜索方法在金融风险特征提取中的应用
袁先智, 狄岚, 李祥林, 郭铁信, 李波, QIANGuoqi, 张千友, 严诚幸, 刘海洋, 吴桐, 曾途, 周云鹏
计量经济学报 ›› 2021, Vol. 1 ›› Issue (2) : 377-408.
在大数据框架下基于吉布斯抽样的随机搜索方法在金融风险特征提取中的应用
The Framework for the Extraction of Risk Factors by using Stochastic Search Method based on Gibbs Sampling Algorithm in Fintech
本文的目的是在大数据框架下,系统地陈述了如何利用吉布斯抽样(Gibbs sampling)方法作为工具,以样本误差容忍度为标准的大数据关联特征因子提取的推断原理为基础,在金融衍生品场景下对关联风险特征进行有效提取的思维和路径.具体来讲,采用马尔可夫链蒙特卡罗(MCMC)框架下的吉布斯抽样(Gibbs sampling)算法为工具,通过"OR值"(odds ratio)(也称为"比值比"或"优势比")为验证标准,在大数据(包含传统的结构化和非结构化数据)一般框架下对高度关联特征因子提取推断的原理下,系统性地陈述了如何从海量数据中提取与金融衍生品价格或者风险关联度高的风险特征因子的随机搜索方法.为了能够比较全面地展示如何利用吉布斯抽样方法通过随机搜索算法来实现对金融衍生品风险特征的提取,在本文中,我们对三种金融产品的关联特征提取进行了比较全面和系统的讨论,他们是:1)对支持"基金中的基金"(fund of funds,简称"FOF")组建的影响基金业绩关联特征的挖掘;2)对影响大宗商品期货螺纹钢价格趋势变化的关联特征指标的挖掘;3)对影响大宗商品期货铜价格趋势分析的关联特征刻画的提取.本文的分析和实证结果表明,我们在大数据框架下建立的特征提取方法除了能够有效地筛选出刻画影响基金业绩的关联特征外,也够提取出影响螺纹钢期货和铜期货价格趋势变化的关联特征,这为业界对FOF的组建与管理,对应金融衍生品价格变化走势,特别是大宗期货交易和风险管理方面提供了一种新的分析维度和风险特征因子应用方向.另外,本文讨论的从大数据的视角筛选金融衍生品风险特征因子的方法,也与过去传统的计量分析方法不同,是金融科技在大数据金融方面分析和应用的创新点.
The purpose of this paper is to systematically state how to use the Gibbs sampling method as a tool, based on the inference principle of big data association feature factors to conduct the extraction of related risk characteristics in the context of financial derivatives. Specifically, using stochastic search method based on Gibbs sampling algorithm under the framework of Markov chain Monte Carlo (MCMC), incorporating the "odd ratio" as criteria, taking FOF, commodity futures as examples, this report systematically discusses how to extract related risk factors for financial derivatives based on big data (including traditional and non-structure data) approach as shown by using so-called stochastic research method. Furthermore, we like to point out the way to identify the risk factors based on big data method established in this paper is quite now and should be useful for the financial service in the practice of Fintech.
大数据 / 吉布斯抽样 / 随机搜索 / 马尔可夫链蒙特卡罗 / 金融科技 / 关联风险特征 / 基金中的基金 / 大宗商品期货 / 价格趋势 / 特征因子方法 / 大数据特征推断框架 {{custom_keyword}} /
big data / Gibbs sampling / stochastic search / Markov chain Monte Carlo / fintech / risk characteristics / FOF / commodity futures / price trend / risk factor method / the framework for the extraction of risk characteristics {{custom_keyword}} /
表1 ROC分类标准 |
级别 | Ⅰ | Ⅱ-a | Ⅱ-b | Ⅲ-a | Ⅲ-b | 未达标 |
FPR=0.1 | TPR>0.9 | 0.8<TPR<0.9 | 0.8<TPR<0.9 | TPR<0.8 | TPR<0.8 | TPR<0.8 |
FPR=0.2 | TPR>0.9 | TPR>0.9 | 0.8<TPR<0.9 | TPR>0.9 | 0.8<TPR<0.9 | TPR<0.8 |
表2 模型的测试集表现 |
模型编号 | 建模方法 | 特征集 | TPR (FPR=0.1) | TPR (FPR=0.2) |
1 | 二分类逻辑回归 | 标签化处理的初始特征集 | 0.529 | 0.706 |
2 | 二分类逻辑回归 | 标签化处理的筛选特征 | 0.684 | 0.789 |
3 | 二分类逻辑回归 | 归一化处理的筛选特征 | 0.857 | 0.904 |
4 | 三分类逻辑回归 | 归一化处理的筛选特征 | 0.842 | 0.894 |
表3 逻辑回归概率阈值划定 |
模型编号 | 模型 | 数据集 | 概率阈值 |
1 | 二分类逻辑回归 | 标签化(全特征) | 0.108 |
2 | 二分类逻辑回归 | 标签化(筛选特征) | 0.117 |
3 | 二分类逻辑回归 | 原始数据(筛选特征) | 0.07 |
4 | 三分类逻辑回归 | 原始数据(筛选特征) | 0.107 |
表4 26个基础特征指标及分类 |
一级编号 | 指标维度 | 指标来源 | 二级编号 | 描述维度 | 三级编号 | 指标名称 |
(一) | 宏观经济因素 | 顾秋阳, 周有林, 华秀萍, 王瑞(2019) | 1 | GDP指数 | 1 | 当季度GDP |
2 | 当季度GDP同比增长率 | |||||
郑尊信, 徐晓光(2009) | 2 | 货币政策与货币环境 | 3 | 流通中现金(M0)供应量同比增长率 | ||
Frankel (1984) | 4 | 货币(M1)供应量同比增长率 | ||||
5 | 货币和准货币(M2)供应量同比增长率 | |||||
顾秋阳, 周有林, 华秀萍, 王瑞(2019) | 3 | 采购经理人指数 | 6 | 非制造业采购经理指数 | ||
7 | 制造业采购经理指数 | |||||
4 | 人民币兑美元汇率 | 8 | 人民币兑美元中间价 | |||
5 | 商品房销售面积 | 9 | 房地产竣工面积 | |||
10 | 房地产开发投资完成额 | |||||
11 | 房地产施工面积 | |||||
12 | 房地产新开工施工面积 | |||||
(二) | 市场供需关系 | 伍景琼, 蒲云, 伍锦群(2012) | 6 | 海运费 | 13 | 波罗的海干散货指数(BDI) |
14 | 好望角型运费指数(BCI) | |||||
铁矿石供需 | 15 | 铁矿石进口数量当月值(澳大利亚) | ||||
16 | 铁矿石进口数量当月值(巴西) | |||||
17 | 铁矿石进口数量当月值(合计) | |||||
18 | 铁矿石进口数量当月值(南非) | |||||
19 | 铁矿石进口数量当月值(印度) | |||||
胡建兰, 高瑜(2019) | 7 | 钢铁库存 | 20 | 螺纹钢库存 | ||
陈海鹏, 卢旭旺, 申铉京, 杨英卓(2017) | 8 | 铁矿石期货结算价 | 21 | 大商所铁矿石指数合约价格 | ||
9 | 焦煤期货结算价 | 22 | 大商所焦煤指数合约价格 | |||
23 | 郑商所动力煤指数合约价格 | |||||
(三) | 金融以及其他 | Bodie, Rosansky (1980) | 10 | 股票指数 | 24 | 沪深300指数 |
金剑峰(2019) | 25 | 180基建 | ||||
金涛(2014) | 26 | 沪深300金融地产指数 |
表5 2015年1月至2018年6月训练集的测试结果 |
测试结果 | 数据频率 | 训练集时间段 | 测试集时间段 | 测试集样本数 | 测试样本正确数 | 预测正确率 | ||
测试1 | 季度 | 2015年 | 2018年 | 2018年 | 2019年 | 4 | 2 | 50.00% |
月度 | 1月 | 6月 | 7月 | 6月 | 12 | 8 | 66.67% |
表6 2017年1月至2018年6月训练集的测试结果 |
测试结果 | 数据频率 | 训练集时间段 | 测试集时间段 | 测试集样本数 | 测试样本正确数 | 预测正确率 | ||
测试2 | 季度 | 2017年 | 2018年 | 2018年 | 2019年 | 4 | 3 | 75.00% |
月度 | 1月 | 6月 | 7月 | 6月 | 12 | 10 | 83.33% |
表7 强关联特征及其关联显著性 |
编号 | 特征名称 | 各时间窗内关联显著性 | ||
2011–2017 | 2012–2018 | 2013–2019 | ||
1 | 前1个月沪铜价格涨跌幅 | 100.00% | 98.50% | 99.75% |
2 | 前1个月ICSG: 期间库存变化: 当月值_lag1 | 99.25% | 86.00% | 17.50% |
3 | 前1个月铜材产量同比增长率 | 89.25% | 53.25% | 17.00% |
4 | 前1个月精炼铜产量同比增长率 | 54.25% | 55.50% | 86.50% |
5 | 前6个月精炼铜产量(矿产)平均同比增长率 | 53.75% | 39.75% | 93.25% |
6 | 前1个月精炼铜(再生)同比增长率 | 64.25% | 32.00% | 96.00% |
7 | 前1个月彩电产量同比增长率 | 56.50% | 98.25% | 52.75% |
8 | 前3个月冷柜产量平均同比增长率 | 51.00% | 57.25% | 90.00% |
9 | 前1个月房地产竣工面积同比增长率 | 99.50% | 80.25% | 37.75% |
10 | 前1个月新增固定资产同比增长率 | 31.00% | 93.25% | 32.00% |
11 | 前1个月商务活动指数平均值 | 14.75% | 11.25% | 11.50% |
12 | 前1个月PMI | 13.00% | 12.50% | 9.75% |
13 | 前1个月CPI平均增长率 | 12.50% | 10.50% | 13.00% |
14 | 前12个月GDP计值同比增长率 | 11.25% | 13.50% | 11.00% |
表8 沪铜价格趋势关联特征强弱关系及预测正确率 |
编号 | 特征名称 | 关联强弱 |
1 | 前1个月沪铜价格涨跌幅 | 2.1117 |
2 | 前1个月ICSG: 期间库存变化: 当月值_lag1 | |
3 | 前1个月铜材产量同比增长率 | |
4 | 前1个月精炼铜产量同比增长率 | |
5 | 前6个月精炼铜产量(矿产)平均同比增长率 | 0.0353 |
6 | 前1个月精炼铜(再生)同比增长率 | 0.0838 |
7 | 前1个月彩电产量同比增长率 | 0.0024 |
8 | 前3个月冷柜产量平均同比增长率 | 0.0493 |
9 | 前1个月房地产竣工面积同比增长率 | 0.0588 |
10 | 前1个月新增固定资产同比增长率 | 0.152 |
11 | 前1个月商务活动指数平均值 | |
12 | 前1个月PMI | |
13 | 前1个月CPI平均增长率 | 0.0563 |
14 | 前12个月GDP累计值同比增长率 | 0.0096 |
15 | 常数项 | |
预测正确率(测试集数据) | 95.83% |
表附表 1 基金初始特征指标明细 |
维度 | 指标来源 | 一级编号 | 一级指标 | 二级编号 | 二级指标 | 三级编号 | 三级指标 |
基金自身维度 | Ippolito (1993), Wermers (2000), Brennan, Hughes (1991), Elton, Gruber, Blake (1995), Chen, Hong, Huang, Kubik (2004), Sharpe (1966), Golec (1996), 梁珊, 王正刚, 郭葆春(2016), 陆蓉, 陈百助, 徐龙炳, 谢新厚(2007), 李志冰, 刘晓宇(2019), 肖峻, 石劲(2011), 刘京军, 苏楚林(2016) | 1 | 基金财务指标 | 1 | 业绩指标 | 1 | 平均收益 |
2 | 最大回撤 | ||||||
2 | 基金规模 | 3 | 基金资产净值 | ||||
3 | 投资结构 | 4 | 股票市值占比 | ||||
5 | 其他资产市值占比 | ||||||
6 | 投资集中度 | ||||||
7 | 前 | ||||||
4 | 基金风险 | 8 | 是否分级基金 | ||||
9 | 基金风险等级 | ||||||
5 | 费用类 | 10 | 管理费率 | ||||
11 | 托管费率 | ||||||
12 | 销售服务费 | ||||||
13 | 费率优惠 | ||||||
14 | 是否收取浮动管理费 | ||||||
2 | 基金其他关联指标 | 6 | 其他关联特征类 | 15 | 基金类型 | ||
16 | 是否初始基金 | ||||||
7 | 基金声誉 | 17 | 成立年限 | ||||
8 | 个人特质 | 18 | 基金经理国籍 | ||||
19 | 基金经理性别 | ||||||
20 | 基金经理学历 | ||||||
基金经理维度 | Barber, Odean (2001), 赵秀娟, 汪寿阳(2010), 高鹤, 李文, 高峰(2014), 肖继辉, 彭文平(2012) | 3 | 基金经理个人特征 | 9 | 职业特质 | 21 | 基金经理平均工作年限 |
22 | 基金经理最大工作年限 | ||||||
23 | 基金经理人数 | ||||||
24 | 基金经理管理基金数量 | ||||||
25 | 基金经理是否有变更 | ||||||
26 | 任职过基金公司数量 | ||||||
27 | 任职天数 | ||||||
4 | 基金经理个人业绩 | 10 | 业绩指标 | 28 | 几何平均年化收益率 | ||
29 | 超越基准几何平均年化收益率 | ||||||
30 | 注册资本(万元) | ||||||
11 | 基金公司经营规模 | 31 | 基金只数 | ||||
32 | 全部基金市值 | ||||||
33 | 股票型占比 | ||||||
34 | 混合型占比 | ||||||
35 | 特殊占比 | ||||||
基金公司维度 | Pollet, Wilson (2008), Elton, Gruber, Blake (1995), 毛磊, 王宗军, 王玲玲(2012), 曾德明, 龙淼, 龚红(2006) | 5 | 基金公司经营指标 | 12 | 基金公司财务指标 | 36 | 资产负债率 |
37 | 资产净利润率 | ||||||
38 | 净资产收益率 | ||||||
39 | 营业利润率 | ||||||
13 | 基金公司经营能力 | 40 | Wind五星基金占比(%) | ||||
41 | 获奖情况 | ||||||
42 | 基金经理人数 | ||||||
43 | 团队稳定性 | ||||||
44 | 基金经理成熟度 | ||||||
6 | 基金公司基本信息 | 14 | 基金公司基本信息 | 45 | 成立日 | ||
46 | 机构类型 | ||||||
47 | 机构派系 | ||||||
48 | 基本信息 | ||||||
49 | 公司性质 | ||||||
7 | 基金公司董监高信息 | 15 | 股权结构 | 50 | 独立董事占比 | ||
51 | 股权集中度 | ||||||
52 | 男/女比例 | ||||||
53 | 董监人数比 | ||||||
54 | 董投人数比 | ||||||
16 | 董监高 | 55 | 董监高平均任期 | ||||
17 | 其他信息 | 56 | 总经理是否为法人 | ||||
57 | 总/副总经理是否为董事会成员 | ||||||
58 | 是否有外籍主要成员 |
表附表 2 基金相关特征筛选结果 |
相关性 | 序号 | 特征名称 | odds ratio比值比 | |
较差 | 较好 | |||
强相关 | 1 | 浮动管理费 | 3.044 | 1.306 |
2 | 基金分类 | 1.983 | 0.85 | |
3 | 平均收益 | 1.733 | 0.79 | |
4 | 基金公司基金只数 | 1.599 | 0.451 | |
5 | 成立年限 | 1.51 | 0.605 | |
6 | 风险评级 | 1.512 | 1.023 | |
7 | 基金经理学历 | 1.358 | 0.719 | |
8 | 托管费率 | 1.426 | 0.676 | |
9 | 任职过的基金公司数量 | 1.141 | 0.723 | |
10 | 几何平均年化收益率 | 0.617 | 1.819 | |
11 | 净资产收益率 | 0.588 | 1.243 | |
12 | 股票市值占比 | 0.589 | 1.45 | |
13 | 获奖情况 | 0.615 | 1.477 | |
14 | 基金类型 | 0.396 | 2.425 | |
15 | 基金经理人数 | 0.544 | 1.526 | |
16 | 最大回撤 | 0.244 | 5.109 | |
一般相关 | 17 | 基金经理性别 | 1.28 | 0.836 |
18 | 营业利润率 | 1.174 | 0.914 | |
19 | 董监高平均任期 | 0.854 | 1.51 | |
20 | 基金经理最大工作年限 | 1.132 | 1.072 | |
21 | 费率优惠 | 1.084 | 1.346 | |
22 | 混合型占比 | 0.778 | 1.489 | |
23 | 基本信息 | 0.69 | 0.804 | |
24 | 基金经理成熟度 | 0.75 | 1.15 | |
25 | 团队稳定性 | 0.658 | 1.15 | |
弱相关 | 26 | 资产净利润率 | 1.09 | 1.124 |
27 | 总经理/副总经理是否为董事会成员 | 1.069 | 1.031 | |
28 | 董监人数比 | 0.977 | 0.867 | |
29 | 男/女比例 | 1.175 | 0.9 | |
30 | 股票型占比 | 0.997 | 1.055 | |
31 | 基金经理国籍 | 1 | 1 | |
32 | 基金经理管理基金数量 | 0.978 | 0.836 | |
33 | 董投人数比 | 0.942 | 1.141 | |
34 | 独立董事占比 | 0.899 | 1.099 | |
35 | 是否初始基金 | 0.832 | 0.964 | |
36 | 公司性质 | 0.883 | 1.123 |
表附表 3 螺纹钢59个初始特征指标及分类 |
序号 | 指标名称 | 所属分类 |
1 | 流通中现金(M0)供应量同比增长率 | 宏观经济因素 |
2 | 非制造业采购经理人指数 | 宏观经济因素 |
3 | 制造业采购经理指数 | 宏观经济因素 |
4 | 人民币兑美元中间价 | 宏观经济因素 |
5 | 货币和准货币(M2)供应量同比增长率 | 宏观经济因素 |
6 | 当季度GDP | 宏观经济因素 |
7 | 当季度GDP同比增长率 | 宏观经济因素 |
8 | 货币(M1)供应量同比增长率 | 宏观经济因素 |
9 | 电力、热力的生产和供应业增加值_同比增长 | 宏观经济因素 |
10 | 煤炭开采和洗选业增加值_同比增长 | 宏观经济因素 |
11 | 燃气生产和供应业增加值_同比增长 | 宏观经济因素 |
12 | 石油和天然气开采业增加值_同比增长 | 宏观经济因素 |
13 | 石油加工、炼焦及核燃料加工业增加值_同比增长 | 宏观经济因素 |
14 | 黑色金属矿采选业固定资产投资完成额累计同比增长率 | 宏观经济因素 |
15 | 黑色金属矿采选业固定资产投资完成额累计同比增长率 | 宏观经济因素 |
16 | 黑色金属矿采选业增加值_同比增长 | 宏观经济因素 |
17 | 黑色金属冶炼及压延加工业增加值_同比增长 | 宏观经济因素 |
18 | 固定资产投资完成额累计同比增长率 | 宏观经济因素 |
19 | 固定资产投资完成额累计同比增长率 | 宏观经济因素 |
20 | 非金属矿采选业增加值_同比增长 | 宏观经济因素 |
21 | 非金属矿物制品业增加值_同比增长 | 宏观经济因素 |
22 | 金属制品业增加值_同比增长 | 宏观经济因素 |
23 | 开采辅助活动增加值_同比增长 | 宏观经济因素 |
24 | 通用设备制造业增加值_同比增长 | 宏观经济因素 |
25 | 有色金属矿采选业增加值_同比增长 | 宏观经济因素 |
26 | 有色金属冶炼及压延加工业增加值_同比增长 | 宏观经济因素 |
27 | 波罗的海干散货指数(BDI) | 市场供需关系 |
28 | 好望角型运费指数(BCI) | 市场供需关系 |
29 | 铁矿石进口数量当月值(澳大利亚) | 市场供需关系 |
30 | 铁矿石进口数量当月值(巴西) | 市场供需关系 |
31 | 铁矿石进口数量当月值(合计) | 市场供需关系 |
32 | 铁矿石进口数量当月值(南非) | 市场供需关系 |
33 | 铁矿石进口数量当月值(印度) | 市场供需关系 |
34 | 螺纹钢库存 | 市场供需关系 |
35 | 房地产竣工面积 | 市场供需关系 |
36 | 房地产开发投资完成额 | 市场供需关系 |
37 | 房地产施工面积 | 市场供需关系 |
38 | 房地产新开工施工面积 | 市场供需关系 |
39 | 房地产开发投资完成额累计同比增长率 | 市场供需关系 |
40 | 大商所铁矿石指数合约价格 | 市场供需关系 |
41 | 大商所焦煤指数合约价格 | 市场供需关系 |
42 | 郑商所动力煤指数合约价格 | 市场供需关系 |
43 | 焦炭及半焦炭出口数量当月值 | 市场供需关系 |
44 | 焦炭及半焦炭进口数量当月值 | 市场供需关系 |
45 | 炼焦煤出口数量当月值 | 市场供需关系 |
46 | 炼焦煤进口数量当月值 | 市场供需关系 |
47 | 黑色金属矿采选业用电量当月值 | 市场供需关系 |
48 | 黑色金属冶炼及压延加工业用电量当月值 | 市场供需关系 |
49 | 钢材产量当月值 | 市场供需关系 |
50 | 钢材出口数量当月值 | 市场供需关系 |
51 | 钢筋出口数量当月值 | 市场供需关系 |
52 | 基础设施建设投资累计同比增长率 | 市场供需关系 |
53 | 基础设施建设投资累计同比增长率 | 市场供需关系 |
54 | 热轧螺纹钢出口数量当月值 | 市场供需关系 |
55 | 热轧螺纹钢进口数量当月值 | 市场供需关系 |
56 | 上期所螺纹钢指数合约价格 | 市场供需关系 |
57 | 沪深300指数 | 金融以及其他 |
58 | 180基建 | 金融以及其他 |
59 | 沪深300金融地产指数 | 金融以及其他 |
表附表 4 螺纹钢期货指数合约关联显著性特征列表(季度) |
序号 | 关联类型 | 特征名称 | 滞后阶数 | 关联显著性 | odds ratio |
1 | 核心关联特征 | 铁矿石进口数量当月值(印度) | 2 | 0.4250 | 1.4548 |
2 | 房地产施工面积 | 3 | 0.4300 | 1.2079 | |
3 | 钢材出口数量当月值 | 2 | 0.4300 | 1.1591 | |
4 | 上期所螺纹钢库存量 | 2 | 0.4300 | 1.1531 | |
5 | 开采辅助活动增加值_同比增长 | 3 | 0.4225 | 1.1216 | |
6 | 电力、热力的生产和供应业增加值_同比增长 | 1 | 0.4125 | 1.1166 | |
7 | 基础设施建设投资累计同比增长率 | 3 | 0.4600 | 0.8978 | |
8 | 炼焦煤出口数量当月值 | 3 | 0.4525 | 0.8806 | |
9 | 铁矿石进口数量当月值(合计) | 2 | 0.4125 | 0.8664 | |
10 | 铁矿石进口数量当月值(巴西) | 2 | 0.4300 | 0.8486 | |
11 | 房地产开发投资完成额 | 2 | 0.4175 | 0.7581 | |
12 | 房地产新开工施工面积 | 2 | 0.4450 | 0.6796 | |
13 | 焦炭及半焦炭出口数量当月值 | 1 | 0.4350 | 0.6771 | |
14 | 黑色金属矿采选业固定资产投资完成额累计同比增长率 | 1 | 0.4450 | 0.6753 | |
15 | 固定资产投资完成额累计同比增长率 | 1 | 0.4175 | 0.6180 | |
16 | 高度关联特征 | 钢筋出口数量当月值 | 4 | 0.4325 | 1.0959 |
17 | 热轧螺纹钢出口数量当月值 | 4 | 0.4250 | 1.0936 | |
18 | 燃气生产和供应业增加值_同比增长 | 3 | 0.4450 | 1.0921 | |
19 | 黑色金属冶炼及压延加工业增加值_同比增长 | 3 | 0.4575 | 1.0541 | |
20 | 钢材产量当月值 | 2 | 0.4725 | 1.0474 | |
21 | 有色金属冶炼及压延加工业增加值_同比增长 | 2 | 0.4275 | 1.0399 | |
22 | 热轧螺纹钢进口数量当月值 | 4 | 0.4275 | 1.0290 | |
23 | 房地产开发投资完成额累计同比增长率 | 2 | 0.4300 | 1.0169 | |
24 | 有色金属矿采选业增加值_同比增长 | 3 | 0.4325 | 1.0096 | |
25 | 大商所焦煤指数合约价格 | 3 | 0.4650 | 1.0019 | |
26 | 大商所铁矿石指数合约价格 | 3 | 0.4425 | 1.0006 | |
27 | 180基建 | 2 | 0.4350 | 1.0001 | |
28 | 石油和天然气开采业增加值_同比增长 | 4 | 0.4200 | 0.9993 | |
29 | 炼焦煤进口数量当月值 | 4 | 0.4250 | 0.9971 | |
30 | 郑商所动力煤指数合约价格 | 2 | 0.4375 | 0.9970 | |
31 | 固定资产投资完成额累计同比增长率 | 3 | 0.4325 | 0.9941 | |
32 | 黑色金属矿采选业用电量当月值 | 4 | 0.4400 | 0.9901 | |
33 | 金属制品业增加值_同比增长 | 1 | 0.4150 | 0.9851 | |
34 | 黑色金属矿采选业增加值_同比增长 | 3 | 0.4225 | 0.9849 | |
35 | 非金属矿采选业增加值_同比增长 | 2 | 0.4500 | 0.9822 | |
36 | 商务活动指数 | 2 | 0.4375 | 0.9821 | |
37 | 制造业采购经理指数 | 4 | 0.4200 | 0.9790 | |
38 | 通用设备制造业增加值_同比增长 | 4 | 0.4300 | 0.9789 | |
39 | 波罗的海干散货指数(BDI) | 1 | 0.4625 | 0.9718 | |
40 | 非金属矿物制品业增加值_同比增长 | 3 | 0.4575 | 0.9710 | |
41 | 焦炭及半焦炭进口数量当月值 | 1 | 0.4250 | 0.9695 | |
42 | 货币(M1)供应量同比增长率 | 2 | 0.4300 | 0.9339 | |
43 | 铁矿石进口数量当月值(南非) | 2 | 0.4125 | 0.9231 | |
44 | 黑色金属冶炼及压延加工业用电量当月值 | 3 | 0.4175 | 0.9110 |
表附表 5 螺纹钢期货指数合约关联显著性特征列表(月度) |
序号 | odds ratio | 特征名称 | 滞后阶数 | 关联显著性 | 关联类型 |
1 | 焦炭及半焦炭出口数量当月值 | 3 | 0.4375 | 1.5595 | 核心关联特征 |
2 | 石油加工、炼焦及核燃料加工业增加值_同比增长 | 1 | 0.4150 | 1.5149 | |
3 | 钢材产量当月值 | 1 | 0.4050 | 1.4035 | |
4 | 房地产新开工施工面积 | 6 | 0.3950 | 1.2720 | |
5 | 石油和天然气开采业增加值_同比增长 | 1 | 0.4000 | 1.1984 | |
6 | 开采辅助活动增加值_同比增长 | 12 | 0.3975 | 1.1752 | |
7 | 钢材出口数量当月值 | 6 | 0.3950 | 1.1746 | |
8 | 热轧螺纹钢出口数量当月值 | 12 | 0.3975 | 0.8974 | |
9 | 当季度GDP同比增长率 | 1 | 0.3925 | 0.8849 | |
10 | 流通中现金(M0)供应量同比增长率 | 12 | 0.3875 | 0.8804 | |
11 | 上期所螺纹钢库存量 | 6 | 0.4125 | 0.8755 | |
12 | 人民币兑美元中间价 | 3 | 0.4000 | 0.8488 | |
13 | 大商所焦煤指数合约价格 | 3 | 0.3775 | 0.8390 | |
14 | 180基建 | 3 | 0.3950 | 0.8357 | |
15 | 沪深300金融地产指数 | 3 | 0.3900 | 0.8347 | |
16 | 大商所铁矿石指数合约价格 | 1 | 0.3900 | 0.8333 | |
17 | 郑商所动力煤指数合约价格 | 3 | 0.4175 | 0.8264 | |
18 | 房地产竣工面积 | 1 | 0.4050 | 0.8093 | |
19 | 黑色金属冶炼及压延加工业增加值_同比增长 | 3 | 0.4150 | 0.8066 | |
20 | 钢筋出口数量当月值 | 1 | 0.3875 | 0.7231 | |
21 | 基础设施建设投资累计同比增长率 | 1 | 0.4325 | 0.7184 | |
22 | 房地产施工面积 | 3 | 0.4000 | 0.5598 | |
23 | 炼焦煤出口数量当月值 | 1 | 0.4225 | 0.4569 | |
24 | 燃气生产和供应业增加值_同比增长 | 6 | 0.4150 | 1.0918 | 高度关联特征 |
25 | 煤炭开采和洗选业增加值_同比增长 | 3 | 0.4175 | 1.0549 | |
26 | 非金属矿采选业增加值_同比增长 | 6 | 0.4375 | 1.0438 | |
27 | 有色金属矿采选业增加值_同比增长 | 12 | 0.4075 | 1.0418 | |
28 | 非制造业采购经理人指数 | 1 | 0.4375 | 1.0204 | |
29 | 金属制品业增加值_同比增长 | 6 | 0.4000 | 1.0087 | |
30 | 货币(M1)供应量同比增长率 | 3 | 0.4050 | 1.0067 | |
31 | 房地产开发投资完成额 | 12 | 0.4325 | 0.9993 | |
32 | 当季度GDP | 12 | 0.4175 | 0.9976 | |
33 | 黑色金属矿采选业固定资产投资完成额累计同比增长率 | 12 | 0.3950 | 0.9863 | |
34 | 黑色金属冶炼及压延加工业用电量当月值 | 12 | 0.3975 | 0.9810 | |
35 | 非金属矿物制品业增加值_同比增长 | 12 | 0.4025 | 0.9732 | |
36 | 有色金属冶炼及压延加工业增加值_同比增长 | 1 | 0.4075 | 0.9692 | |
37 | 通用设备制造业增加值_同比增长 | 3 | 0.4175 | 0.9629 | |
38 | 黑色金属矿采选业增加值_同比增长 | 1 | 0.4200 | 0.9591 | |
39 | 电力、热力的生产和供应业增加值_同比增长 | 12 | 0.3825 | 0.9553 | |
40 | 上期所螺纹钢指数合约价格 | 12 | 0.4550 | 0.9552 | |
41 | 沪深300指数 | 12 | 0.4375 | 0.9534 | |
42 | 货币和准货币(M2)供应量同比增长率 | 6 | 0.4250 | 0.9505 | |
43 | 制造业采购经理指数 | 6 | 0.4175 | 0.9436 | |
44 | 波罗的海干散货指数(BDI) | 12 | 0.4550 | 0.9269 |
部慧, 李艺, 汪寿阳, 国际基金持仓与大豆商品期货价格关系的实证研究[J]. 管理评论, 2008, 20 (5): 3- 8.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
部慧, 中国铜期货市场期货价格期限结构研究[J]. 系统工程学报, 2016, 31 (2): 192- 201.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
蔡慧, 华仁海, 中国商品期货指数与GDP指数的关系研究[J]. 金融理论与实践, 2007, (8): 3- 6.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
陈海鹏, 卢旭旺, 申铉京, 杨英卓, 基于多元线性回归的螺纹钢价格分析及预测模型[J]. 计算机科学, 2017, 44 (S2): 61- 64.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
董珊珊, 冯芸, 基于FCVAR模型研究SHFE和LME铜期货和现货市场价格发现功能[J]. 现代管理科学, 2015, (11): 67- 69.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
董晓娟, 安海岗, 董志良, 有色金属国际期货市场价格联动效应演化分析——以铜、铝、锌为例[J]. 复杂系统与复杂性科学, 2018, 15 (4): 50- 59.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
高鹤, 李旻文, 高峰, 基金经理风险偏好、投资风格与基金业绩——基于性别个人特征的视角[J]. 投资研究, 2014, (5): 82- 96.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
高辉, 赵进文, 期货价格收益率与波动性的实证研究——以中国上海与英国伦敦为例[J]. 财经问题研究, 2007, (2): 54- 66.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
顾秋阳, 周有林, 华秀萍, 王瑞, 我国螺纹钢期货价格波动的机理研究——基于SVAR模型的实证分析[J]. 价格理论与实践, 2019, (7): 95- 98.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
郭树华, 王华, 高祖博, 王俐娴, 金属期货市场价格联动及其波动关系研究——以SHFE和LME的铜铝为例[J]. 国际金融研究, 2010, (4): 79- 88.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
韩立岩, 尹力博, 投机行为还是实际需求?——国际大宗商品价格影响因素的广义视角分析[J]. 经济研究, 2012, 47 (12): 83- 96.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
胡东滨, 张展英, 基于DCC-GARCH模型的金属期货市场与外汇、货币市场的动态相关性研究[J]. 数理统计与管理, 2012, 31 (5): 906- 914.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
胡建兰, 高瑜, 基于灰色模型的钢铁价格影响因素研究[J]. 价值工程, 2019, 38 (32): 71- 72.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
黄健柏, 刘凯, 郭尧琦, 沪铜期货市场价格发现的动态贡献——基于状态空间模型的实证研究[J]. 技术经济与管理研究, 2014, (2): 69- 74.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
金剑峰, 钢铁类股票与螺纹钢期货的互动关系研究[J]. 科技经济市场, 2019, (7): 83- 85.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
金涛, 螺纹钢期货和沪深300股指期货的价格联动性研究[J]. 会计之友, 2014, (8): 21- 24.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
李洁, 杨莉, 上海和伦敦金属期货市场价格联动性研究——以铜铝锌期货市场为例[J]. 价格理论与实践, 2017, (8): 100- 103.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
李志冰, 刘晓宇, 基金业绩归因与投资者行为[J]. 金融研究, 2019, (2): 188- 206.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
梁珊, 王正刚, 郭葆春, 基金规模与业绩关系的再检验——基于DGTW方法的业绩评价[J]. 投资研究, 2016, 35 (3): 151- 158.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
刘京军, 苏楚林, 传染的资金: 基于网络结构的基金资金流量及业绩影响研究[J]. 管理世界, 2016, (1): 54- 65.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
刘立霞, 马军海, 基于LS-SVM的石油期货价格预测研究[J]. 计算机工程与应用, 2008, (32): 230- 231.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
刘轶芳, 迟国泰, 余方平, 孙韶红, 王玉刚, 基于GARCH-EWMA的期货价格预测模型[J]. 哈尔滨工业大学学报, 2006, (9): 1572- 1575.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
陆蓉, 陈百助, 徐龙炳, 谢新厚, 基金业绩与投资者的选择——中国开放式基金赎回异常现象的研究[J]. 经济研究, 2007, (6): 39- 50.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
毛磊, 王宗军, 王玲玲, 机构投资者持股偏好、筛选策略与企业社会绩效[J]. 管理科学, 2012, 25 (3): 21- 33.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
王苏生, 王丽, 李志超, 向静, 基于卡尔曼滤波的期货价格仿射期限结构模型[J]. 系统工程学报, 2010, 25 (3): 346- 353.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
王天思, 大数据中的因果关系及其哲学内涵[J]. 中国社会科学, 2016, (5): 22- 42.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
伍景琼, 蒲云, 伍锦群, 钢铁企业进口铁矿石价格影响因素强度及对策研究[J]. 经济问题探索, 2012, (3): 93- 97.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
肖继辉, 彭文平, 基金经理特征与投资能力、投资风格的关系[J]. 管理评论, 2012, 24 (7): 40- 48.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
肖峻, 石劲, 基金业绩与资金流量: 我国基金市场存在"赎回异象"吗?[J]. 经济研究, 2011, 46 (1): 112- 125.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
袁先智, 刘海洋, 周云鹏, 严诚幸, 冯驰, 等. 基金关联特征提取的大数据随机搜索算法及应用[J]. 管理科学, 2020, 33 (6): 41- 53.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
袁先智, 周云鹏, 刘海洋, 严诚幸, 曾途(2019). 大数据框架下对大宗商品期货(铜)价格趋势分析的关联特征刻划研究[R].
BBD Working Paper. Yuan X Z, Liu H Y, Zhou Y P, Yan C X, Ceng T, (2019). A Study of Risk Characteristics for Commodity (Cooper) Futures Price Trend Under The Big Data Framework[R]. BBD Working Paper.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
袁先智, 周云鹏, 刘海洋, 严诚幸, 钱国骐, 在金融科技中基于人工智能算法的风险特征因子筛选框架的建立和在期货价格趋势预测相关的特征因子刻画的应用[J]. 安徽工程大学学报, 2020, 35 (4): 1- 13.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
袁知柱, 王泽燊, 郝文瀚, 机构投资者持股与企业应计盈余管理和真实盈余管理行为选择[J]. 管理科学, 2014, 27 (5): 104- 119.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
曾德明, 龙淼, 龚红, 机构投资者持股对公司绩效的影响研究[J]. 软科学, 2006, (1): 37- 39.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
张保银, 陈俊, 基于动态VECM的我国铜期货的价格发现功能研究[J]. 天津大学学报(社会科学版), 2012, 14 (6): 492- 496.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
张屹山, 方毅, 黄琨, 中国期货市场功能及国际影响的实证研究[J]. 管理世界, 2006, (4): 28- 34.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
赵秀娟, 程刚, 汪寿阳, 基金经理的运气是否比能力更重要?[J]. 系统工程理论与实践, 2011, 31 (5): 834- 840.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
赵秀娟, 汪寿阳, 基金经理在多大程度上影响了基金业绩?——业绩与个人特征的实证检验[J]. 管理评论, 2010, 22 (1): 3- 12.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
郑尊信, 徐晓光, 基差、随机冲击与不对称相关结构下的期货套期保值——来自亚洲股指期货市场的证据[J]. 数量经济技术经济研究, 2009, 26 (3): 91- 105.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
周伟, 王强强, 贵金属与其他金属期货间的价格交叉影响及其传导效应[J]. 商业研究, 2016, (2): 81- 86.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
朱晋, 市场因素影响商品期货价格的多元模型分析[J]. 数量经济技术经济研究, 2004, (1): 75- 79.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Agrawal R, Imieliński T, Swami A, (1993). Mining Association Rules Between Sets of Items in Large Databases[C]//Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data: 207-216.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
〈 |
|
〉 |