本文着重介绍了基于面板数据的处置效应估计的计量方法最新进展.首先,简要介绍了面板数据的项目评估或经济政策评价的现代计量分析的基本模型及其性质和应用.其次,主要关注估计面板数据的平均和分位数处置效应的最新方法和模型.最后,从理论、方法和实证方面探讨了基于面板数据的经济政策评价的计量经济学和统计学未来可能的研究方向,特别地,如何结合三者:机器学习、经济政策评价和面板数据的未来的研究方向展开讨论,为年轻学者提供参考.
社会经济领域是数据科学应用的主要场合之一,如何把握该领域中数据科学的学科格局及其重心,是制定和实施学科发展战略的一个基本问题.本文从我国经济统计的切实需要出发,结合《HMYW 2019统计学报告》中的重要观点,讨论了数据科学在社会经济领域应用的学科格局.本文提出"数据整理方法"、"模糊不确定现象"和"问题导向"是大数据时代数据科学在社会经济中应用时应该把握的三个重心,并分析了各自的重要性和关键点.最后,本文对数据科学未来的发展重心和战略调整进行了探讨.
本文提出一个新的能够体现政策效应异质性的参数:政策受益比例.该参数反映了通过参与某个社会项目,获益个体占受众人群的比例,可用于度量该政策惠民的普遍性.本文在一般的潜变量因果分析框架下,研究了政策受益比例的非参数识别问题,并提出一种可行的估计方法.通过数值模拟,本文发现所提出估计量具有良好的小样本性质.我们将这一方法用于估计新农保政策对农村居民劳动供给、家庭收入和家庭消费的作用,发现新农保政策效果具有明显的异质性.新农保对高劳动供给、高家庭收入和高家庭消费个体的促进作用更加大,而对低劳动供给、低家庭收入和低家庭消费个体的促进作用较弱.这说明为全面准确地评估一项民生政策,须关注该政策的异质性作用.
未被满足的情感需求是导致中老年人决策偏差和经济损失的关键因素.利用2015年中国健康与养老追踪调查(CHARLS)的追踪数据,本文研究了幸福感对中老年人受骗风险的影响.结果表明,中老年人幸福感与受骗风险存在明显的负相关关系.进一步考虑内生性等问题之后,发现基本结果仍然成立.此外,论文支持幸福感或通过增强中老年人自我控制而降低其受骗风险的假设.在中老年人诈骗事件频发的背景下,本文的研究结论有助于社会各界深入认识心理健康对中老年人经济决策的重要性,也为监管部门构建诈骗风险防范体系提供了政策依据.
本文提出了Farrell-Type利润效率的数据包络估计方法,对我国29个省市的130家商业银行2014年至2016年的利润效率进行评估和效率分解.我们将银行的利润效率归因为收益增长(开源)和成本控制(节流)两类行为模式,并分析了所有制差异对行为模式的影响.研究发现了商业银行之间不同的所有制会导致不同的行为模式和效率表现,其中国有商业银行的利润效率显著更低,而股份制商业银行的效率最高.进一步的效率分解和回归分析发现,国有商业银行的无效率来源主要是开源的动力不足,这与其公有制公益性以及在银行体系中扮演的稳定器角色密切相关.我们认为之前单纯以利润取向的银行业效率评价研究高估了国有银行的无效率性,并给出了未来改革建议.该研究为银行利润效率研究提供了新的研究范式,并对国有商业银行的改革方向提供实证依据.
准确预测原油价格对于政府制定政策和市场参与者做出投资决策都至关重要.本文基于变分模态分解(VMD)和集成经验模态分解(EEMD)相融合的二次分解技术,结合差分进化(DE)算法优化后的极限学习机(ELM),提出对原油价格的VMD-RES.-EEMD-DE-ELM混合多步预测模型.为了验证模型的有效性,本文使用布伦特(Brent)和西德克萨斯(WTI)原油的样本数据验证了所提模型的性能.实证结果表明,与其他的基准模型相比,本文所提出的混合模型有效且稳健.
自从欧洲主权债务危机爆发以来,主权风险引发了业界和学术界越来越多的关注.本文基于多元驱动因素视角,采用多种机器学习算法对中美两国主权CDS利差展开预测,并结合平均影响值(MIV)算法分析了中美主权CDS利差驱动因素的异质性.研究发现SVR模型在中美两国的主权CDS利差预测中处于优势地位.而且,中美两国的主权CDS利差的重要驱动因素存在显著差异,本国性因素(例如标普500指数和美元指数)对美国主权CDS利差相对重要,而中国主权CDS利差基本上由全球性因素所决定.研究结论对于国际金融监管协调机构维护全球金融稳定、跨国企业海外投资以及国际投资者保证资产安全具有重要的意义.
本文的目的是在大数据框架下,系统地陈述了如何利用吉布斯抽样(Gibbs sampling)方法作为工具,以样本误差容忍度为标准的大数据关联特征因子提取的推断原理为基础,在金融衍生品场景下对关联风险特征进行有效提取的思维和路径.具体来讲,采用马尔可夫链蒙特卡罗(MCMC)框架下的吉布斯抽样(Gibbs sampling)算法为工具,通过"OR值"(odds ratio)(也称为"比值比"或"优势比")为验证标准,在大数据(包含传统的结构化和非结构化数据)一般框架下对高度关联特征因子提取推断的原理下,系统性地陈述了如何从海量数据中提取与金融衍生品价格或者风险关联度高的风险特征因子的随机搜索方法.为了能够比较全面地展示如何利用吉布斯抽样方法通过随机搜索算法来实现对金融衍生品风险特征的提取,在本文中,我们对三种金融产品的关联特征提取进行了比较全面和系统的讨论,他们是:1)对支持"基金中的基金"(fund of funds,简称"FOF")组建的影响基金业绩关联特征的挖掘;2)对影响大宗商品期货螺纹钢价格趋势变化的关联特征指标的挖掘;3)对影响大宗商品期货铜价格趋势分析的关联特征刻画的提取.本文的分析和实证结果表明,我们在大数据框架下建立的特征提取方法除了能够有效地筛选出刻画影响基金业绩的关联特征外,也够提取出影响螺纹钢期货和铜期货价格趋势变化的关联特征,这为业界对FOF的组建与管理,对应金融衍生品价格变化走势,特别是大宗期货交易和风险管理方面提供了一种新的分析维度和风险特征因子应用方向.另外,本文讨论的从大数据的视角筛选金融衍生品风险特征因子的方法,也与过去传统的计量分析方法不同,是金融科技在大数据金融方面分析和应用的创新点.
A股市场自成立以来,绝大部分时间内新股发行(IPO)定价都受到市盈率倍数限制.这种行政干预,是否会影响公司的盈余管理行为和IPO定价效率?本文以2005年1月至2012年4月A股上市公司为研究对象,探讨新股发行时定价有无市盈率倍数限制对公司盈余管理行为和定价效率的影响.结果发现:取消市盈率倍数限制,一方面,提高了新股的定价效率、减小了股票上市首日的收益,提高了资源配置效率;但另一方面,却加大了公司盈余管理行为,降低了会计信息质量.进一步,与国有企业相比,非国有企业在无市盈率倍数限制时,盈余管理的程度更重,股票上市首日的收益更小.本文丰富了政府干预IPO定价相关的经济行为与后果研究,有助于监管层进一步优化和完善IPO定价制度.
股票价格预测一直是学术界和投资者关注的一个重要问题,但由于股票价格走势非常复杂,同时取决于宏观经济环境、个股基本面和投资者情绪等诸多因素,寻找一个合适的模型来准确预测股票价格极具挑战性.传统时间序列预测模型往往基于日度、周度或月度历史数据对股价走势进行预测,但是预测效果一般.近年来,随着金融市场的飞速发展,借助现代信息收集技术,我们可以收集到时间间隔很小的高频交易数据,而高频数据包含大量低频交易数据之外的信息,因此有可能改善股价预测.本文基于非参数函数型数据分析方法从高频交易数据中提取预测因子,并与传统时间序列预测模型构成混合预测模型来对股价走势进行预测.我们的模型对高频预测因子的构造不作任何参数形式的设定,从而具有很高的灵活性.实证研究方面,我们将模型用于预测沪深300指数,分析结果表明,基于高频数据的新预测模型较之传统时间序列模型在预测表现上有显著改善,说明高频交易数据的确有助于改善短期股价预测.
股指价格变动反映了权益类市场的走势情况,是重要的金融行情指标之一,一直备受学术界与业界的关注.基于2006年1月至2019年3月的沪深300指数数据,通过构建混合信息提取器的长短期记忆神经网络模型(H-LSTM),对股票指数价格进行预测.结果表明:采用分批预测、逐点后推、控制涨跌幅度策略以及增加网络输入变量数量、减少预测的时间宽口,可以显著提升LSTM对价格预测的精准度;基于混合信息提取器方法对沪深300指数价格的运行特征提取效果要优于主成分分析、稀疏自编码和t-SNE等方法.
有效定价因子的筛选是多因子量化选股策略的关键.本文采用Group LASSO算法与非参数样条估计相结合的方法筛选中国A股市场的有效因子,结果得到了个别与其他方法一样的因子(如移动平均成交量),但筛选出很多独特因子(如流动比率、市盈率、去趋势换手率、营业利润增长率).进一步地,基于得到的有效因子构建的投资组合在样本外也有相对更高的超额收益率、更低的收益波动率以及更高的夏普比率.与相关研究的美股因子比较发现,两个市场的因子存在较大差异,美股中的各类动量因子、收益率波动率等并不是A股的有效因子,而A股的市盈率、流动比率也不是美股的有效因子.
成分数据作为因变量的回归模型在经济管理领域应用场景广泛,但在已有方法中,模型的自变量仅包含数值型数据和成分数据,无法满足在数据类型多元化的大数据时代中建模的需求.本文提出了因变量为成分数据,自变量包含函数数据和数值型数据的线性回归方法.借助于成分数据的等距对数比变换,函数数据的主成分基展开,实现了多源异质混合数据的建模分析.特别地,采用一种特定的等距对数比变换方式,保证回归模型的解释性.作为案例,采用中国股票市场日内收益率,交易量和市场情绪构成数据,建立了日内收益率(函数型)和交易量(数值型)对情绪构成(成分型)的回归模型,进一步说明了提出方法的工作过程及其应用价值.