收入不均等、贫困和中等收入群体占比等指标广受决策界、社会、学术界, 乃至媒体的关注, 也是众多经济社会变量(如增长、消费、投资、教育、健康和犯罪等等)的重要决定因素之一, 但鲜有文献将其纳入到实证模型里, 原因往往在于相关指标或数据的缺失.此外, 家户调查数据顶端和底端的观察值也常常缺失, 给实证估算带来偏差.本文基于2018年的中国家庭追踪调查(CFPS)数据, 评估了由Shorrocks and Wan (2009)提出的基于分组数据“还原”个体观察值, 进而估算不均等和贫困等指标的方法, 并引入条件分布对Shorrocks and Wan (2009)的方法进行拓展, 以便考虑收入分布顶端和底端的数据缺失问题.结果显示, 假设变量服从Dagum分布, 而非Shorrocks and Wan (2009)所使用的对数正态分布, 可以使“还原”偏差保持在可接受的范围内.此外, 本文对Shorrocks and Wan (2009)的方法的拓展, 能够明显降低数据截断所导致的“还原”偏差, 而且在该方法下Dagum分布依然占优.本文的发现表明, 后续研究可在Dagum分布的假设下, 对各省统计年鉴中提供的收入分组数据进行“还原”, 然后测算各省的收入不均等、贫困和中等收入群体占比等等指标, 并据此展开经济学分析, 至少应该将相关指标纳入到实证研究中, 以减少相关指标和模型估算偏误.
本文在内容上是《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》2的续篇, 试图从更为一般性的角度进一步探讨“应用统计方法研究”相关的“学科规范”问题, 即数理统计方法在社会经济领域应用过程中应该侧重做什么和怎样做, 关键是为什么这样做.全文分为三个部分: 研究的格局、研究的相关性和应用过程中的方法论研究.研究聚焦所面临的第一个选择是: 偏理论, 还是偏应用?这需要把握好研究的学科格局.进而对论题的聚焦则需要注重“研究的相关性”, 否则实证就失去了其不可或缺的社会经济意义.要达成实证研究的“内在一致性”和“外在一致性”, 统计学者应该充分发挥自己的专业优势, 深入开展“统计应用方法研究”, 其内涵便是本文试图概括阐述的, 以便统计实证奠基于方法应用的“机理”.统计应用过程也需要方法论研究, 这便是本文的核心观点(聚焦点).
在网络拍卖里(如eBay), 有三种主要的交易制度, 一是一口价, 二是一般的拍卖, 三是立即购买拍卖(auction with buy-it-now). 本文利用一个简单的理论, 说明这三种制度, 其实是卖家在同一个最适化问题下的三种不同的解. 换句话说, eBay里, 卖家对上述三种上架方式的策略选择, 可以在一个统一的理论模型下去内生化(endogenize). 其中的关键在于底价及立即购买价之间的相对关系, 尤以底价的角色最重要. 在这个理论下, 本文证明这三种交易制度下的底价的相对大小, 有一个固定的排序. 我们利用eBay的iPod上架数据, 来证实这个排序.
截至目前, 中国是世界上遭受非关税壁垒最多的国家, 在全球新一轮贸易保护主义浪潮以及"去全球化"浪潮愈演愈烈的大背景下, 深入探究非关税壁垒对中国出口的影响有助于前瞻性研判中国经贸未来的走势.本文基于HS6产品层面的贸易数据构建了时间-国家-产品层面的三维面板模型, 研究了非关税壁垒对中国出口的影响.此外, 本文从非关税壁垒视角探讨了中美经贸博弈以及RCEP协议签署给中国出口带来的损益.实证结果表明, 金融危机爆发以后, 非关税壁垒开始显著地抑制中国出口, 且技术性贸易壁垒是抑制中国出口的主要非关税壁垒, 而技术密集型行业和劳动密集型行业则是中国遭受非关税壁垒影响的重灾区.此外, 中国需要高度警惕美国对华施加的一系列技术性贸易壁垒, 其显著地降低了中国技术密集型行业和劳动密集型行业的对美出口.RCEP协议的签署将通过大幅削减东盟国家对华实施的非关税壁垒, 来促进中国与东盟国家的贸易往来, 加快亚洲区域经济一体化的进程.
制造业服务化水平对于我国在全球价值链中的地位究竟是促进还是抑制作用目前在文献中尚未达成一致结论. 本文区分全球价值链浅层参与和深度参与, 并同时考虑促进和抑制作用, 全面探讨制造业服务化水平对全球价值链整体升级的影响机制, 并基于双固定效应模型实证测算制造业服务化对我国全球价值链整体升级的影响. 研究发现: 制造业服务化水平与我国各制造业的全球价值链浅层后向参与和深度后向参与之间呈现"倒U型"关系, 与全球价值链浅层地位指数和深度地位指数之间则呈现"U型"关系, 且其作用效果和方向在不同制造行业间存在显著异质性.
当今中国和世界正处于百年未有之大变局, 维护国家的经济稳定性至关重要. 众所周知, 严重的通货膨胀是经济不稳定的一个重要因素. 因此, 建模和预测通货膨胀率成为了亟待解决的问题. 在本文中, 我们研究了包括中国和美国在内的世界四个主要国家近十年的消费者价格指数(CPI)通胀率, 提出含结构性断点波动率与时变参数均值随机波动模型(stochastic volatility in mean model with time-varying parameters and structural breaks in the volatility, SB-TVP-SVM), 并给出了相应的贝叶斯估计框架. 在以往的大多数研究中, 研究者们往往忽略了非平稳特征同时存在于CPI通胀率的条件均值和波动率序列中的可能性. 通过引入不可观测的结构性断点, SB-TVP-SVM解决了这一问题, 从而得到相比于既有方法更高的序列预测精度. 我们模型估计出的结构性断点与过去十年来最大的全球事件高度相关, 例如新冠病毒疫情以及俄乌地区冲突.
当前我国经济发展过程中面临着巨大的碳减排压力, 那么这种压力能否驱动我国经济高质量发展值得探究.本文基于2010-2019年中国30个省域面板数据, 采用碳排放强度表征政府面临的碳减排压力, 基于新发展理念五大维度测度各省域经济高质量发展水平, 运用时间固定效应的空间杜宾模型实证分析了碳减排压力驱动经济高质量发展的影响机制, 并检验了环保投资在两者间的中介效应.结果表明, 邻接地区的碳排放强度和经济高质量发展水平存在空间溢出效应; 碳排放强度对经济高质量发展存在“倒U型”的非线性影响, 整体上表现从促进经济发展质量提高向抑制经济高质量发展的转变趋势.中介效应回归结果表明, 环保投资在碳减排压力驱动经济高质量发展的过程中存在中介效应, 即碳减排压力可以通过激励环保投资推动经济高质量发展.
碳中和目标的实现依赖于科技创新有效发挥减排效应, 为研究行业视角下创新对减排的驱动效应, 构建LMDI模型分解分析了中国2012-2019年工业CO2排放驱动因素, 结果表明: 1)能源消费因素中, 能源排放强度的增长驱动工业碳排放总量增长, 能源的区域结构调整和集聚程度有显著的减排效应; 2)科技创新因素中, 创新转化效率和创新研发投入的提高并没有发挥预期的减排效应, 创新分布广度是最重要的减排驱动因素; 3)要素特征因素中, 低劳动密集度和高创新密集度代表了工业行业生产方式现代化, 面临更高减排压力; 4)工业生产因素中, 行业的整体增长驱动碳排放总量增长, 行业结构调整对碳排放总量起到抑制作用.分析驱动因素时间和行业异质性认为, 政策对因素驱动效应存在影响, 创新激励政策没有发挥预期的减排效应, 电力行业对工业碳排放影响最大, 各因素对电力行业的影响效应具有独特规律.保障和重视创新的分布广度, 激发各主体全面创新, 把握科技创新从转化到实际应用的环节, 引导科技创新向绿色技术倾斜, 是提高科技创新对中国碳减排驱动效应的潜在路径.
本文拓展了已有的生产率估计方法, 构建了一个包含内生生产率变化的计量框架来评估专利对报酬生产率的作用效应.该估计方法直接考虑了专利与研发投入对企业生产率的的影响, 从而避免了常见的假定生产率是外生变动而导致的生产函数的估计偏误.为了深入探讨专利对生产率的作用机制, 本文将专利对生产率的作用效应分解为垄断效应和规模效应.本文提出的估计框架可以广泛适用于评估和检验专利对报酬生产率的作用效应与作用机制.基于中国医药制造业2001-2007年的企业数据和专利数据的合并数据, 本文考察了专利对于生产率的作用效应与机制.实证结果发现: 第一, 仅有滞后一期的发明专利对于未来的报酬生产率有显著的促进效应; 第二, 专利对报酬生产率的作用主要体现为物质生产率提高所带来的规模效应而非垄断效应.最后, 本文进行了三方面的拓展研究并发现: 专利补贴政策未能改善专利对报酬生产率的作用结果, 专利审查能够有效地识别高质量的专利, 私人企业的发明专利相对于非私人企业能够更显著地促进报酬生产率的提升.
代币作为区块链融资过程中的重要媒介, 在区块链平台运营中发挥了重要作用.本文构建了有分红权益的平台币和无分红权益的一般实用型代币的定价模型.与传统金融产品价格依赖于未来的现金流不同, 加密代币的价格由用户对代币的均衡采纳所决定.模型中影响代币价格的变量包括平台用户基础、平台生产力、用户的应用需求、代币供应量、价格的漂移项和分红水平等, 其中平台生产力、平台用户基础与代币价格的交互影响促进了平台代币经济的积极发展.具体地, 采用随机分析的方法来刻画代币的价格、平台生产力和平台用户基础的变动规律, 分析平台币和一般实用型代币在平台的用户基础、用户基础波动性以及代币价格波动性等方面的差异.研究表明代币赋权能够促进平台用户基础的增长, 但同时也会放大用户基础和代币价格的波动性; 此外, 分红系数越高, 用户基础增长越快, 用户基础和代币价格的波动性也越大.
波动率分解是金融风险研究的重要问题, 有助于识别金融风险的驱动因素, 加深对系统性金融风险生成机制的理解.本文运用广义动态因子模型, 将金融机构股票收益率波动分解为公共波动和异质波动两部分, 并采用分位数向量自回归模型(quantile vectorautor egression, 简称: QVAR)探讨两种波动的风险关联, 最后构建了一个全新的金融系统脆弱性指标, 用于实时监测金融风险.主要结论如下: 1)公共波动关联水平较高, 且这种关联水平不随分位数变化, 异质波动关联具有非对称性, 两侧尾部关联强烈.2)尾部溢出蕴含更多的风险信息, 可揭示极端冲击下的金融风险传染, 而传统的条件均值估计无法捕捉这些特征.3)相对尾部依赖指标充分利用了数据的左尾信息和右尾信息, 可用于评估救助政策的有效性, 且具有实时性的优点.
在基于高频数据的金融资产波动率研究领域, 相较于外生抽样方案, 当抽样时间为内生时通常能够更有效地捕捉到价格波动是一个共识.目前被广泛采用的内生抽样方式为当价格变化超过某一给定门槛值时进行一次抽样, 然而更为具体的方案, 例如门槛值如何选定, 仍未有定论.本文在原有研究基础上提出了一种能够使波动率估计量渐近方差达到最小的内生抽样方案, 该最优内生抽样方案下的已实现波动率将不再存在渐近偏差, 且其置信区间宽度至多为5-min抽样方案的1/$\sqrt 3 $.文章使用蒙特卡罗模拟研究了最优内生抽样方案的有限样本性质, 同时在实证研究中采用多种常见的波动率预测模型对不同抽样方案所得波动率估计量的预测能力进行对比, 结果显示使用最优内生抽样方案所得波动率估计量作为解释变量时的预测精度更高.
债券风险溢价是衡量债券风险的晴雨表, 使用网络自回归模型(NAR)对高维的城投债风险溢价进行建模有助于研究系统性风险外溢效应.简单的NAR模型通过构造空间权重矩阵实现降维, 但所估计的网络外溢平均效应可能忽略了网络节点的异质性影响, 且忽略了系统因政策或外部冲击产生的结构性变化.本文构建了时变参数和异质性溢出效应的适应性算法模型, 提出了有效的适应性网络自回归算法(ANAR), 以及时探测参数与解释变量的最大化同质区间, 实现在及时探测参数结构性变化的同时, 也能对最佳解释变量进行实时选择.应用该模型对我国省级城投债风险溢价网络进行建模分析和预测, 我们发现: 1)适应性网络自回归算法ANAR相比其他预测模型在城投债风险溢价的样本外预测中具有显著的预测优势.2)从同质区间识别角度来看, 相比于2016年与2017年, 2018年与2019年ANAR模型的同质性区间变得更短, 说明市场短期不确定性风险上升, 我国城投债在这一段时期内也相应出现了短期风险溢价高于长期风险溢价的“倒挂”现象.3)从变量选择结果来看, 不同省份城投债风险在不同时间决定网络外溢风险的作用不同, 被算法以较高频率识别到的风险溢出省份多具有风险溢价较高、风险溢价波动较大以及债券发行数量较多的特征.债券平均规模与债券剩余期限的网络节点效应对债券未来风险溢价也有较大影响.本文提出的模型和方法对政策部门和投资者实时监控和预测城投债风险具有实用性和参考价值, 对深化金融供给侧结构性改革, 防范债务风险具有实际意义.
近年来我国债券市场频繁出现高信用评级债券违约的现象, 聚集性违约与股债两市风险“互溢”和“互补”频繁更迭是否存在关联引起了广泛的关注.论文从公司权益风险与风险的模糊不确定性视角, 讨论了权益价格的两种不确定性对债券利差的影响.使用权益的波动率之波动来度量公司权益风险的模糊不确定性, 利用2009-2021年我国A股的日内高频数据与匹配的公司债和企业债数据进行实证研究发现, 公司权益价格的两种不确定性对债券利差呈完全相反的影响.权益的模糊不确定性与债券利差呈显著的“异向震荡”和“互补”关系, 波动率之波动每增加1单位标准差, 将引起债券年利差平均下降3个基点.而权益的风险不确定性对债券利差呈显著的“同向联动”和风险“互溢”关系, 权益波动率风险每增加1个单位标准差, 将引起债券年利差平均上升8个基点.进一步的实证发现, 权益风险和风险的模糊不确定性与债券利差的异向影响, 在民营企业发行的债券、低信用评级和长期债券中表现尤为突出.机制分析表明, 债券的违约距离、公司的预防性储蓄和投资者的模糊性偏好异质性是权益风险的模糊不确定性对债券利差产生影响的可能渠道.论文的结果对股债两市的风险监管和公司信息披露要求提出了有价值的政策建议.