收入不均等、贫困和中等收入群体占比等指标广受决策界、社会、学术界, 乃至媒体的关注, 也是众多经济社会变量(如增长、消费、投资、教育、健康和犯罪等等)的重要决定因素之一, 但鲜有文献将其纳入到实证模型里, 原因往往在于相关指标或数据的缺失.此外, 家户调查数据顶端和底端的观察值也常常缺失, 给实证估算带来偏差.本文基于2018年的中国家庭追踪调查(CFPS)数据, 评估了由Shorrocks and Wan (2009)提出的基于分组数据“还原”个体观察值, 进而估算不均等和贫困等指标的方法, 并引入条件分布对Shorrocks and Wan (2009)的方法进行拓展, 以便考虑收入分布顶端和底端的数据缺失问题.结果显示, 假设变量服从Dagum分布, 而非Shorrocks and Wan (2009)所使用的对数正态分布, 可以使“还原”偏差保持在可接受的范围内.此外, 本文对Shorrocks and Wan (2009)的方法的拓展, 能够明显降低数据截断所导致的“还原”偏差, 而且在该方法下Dagum分布依然占优.本文的发现表明, 后续研究可在Dagum分布的假设下, 对各省统计年鉴中提供的收入分组数据进行“还原”, 然后测算各省的收入不均等、贫困和中等收入群体占比等等指标, 并据此展开经济学分析, 至少应该将相关指标纳入到实证研究中, 以减少相关指标和模型估算偏误.
本文在内容上是《数据科学在社会经济领域应用的重心——兼评 < 十字路口的统计学, 谁来应对挑战>》2的续篇, 试图从更为一般性的角度进一步探讨“应用统计方法研究”相关的“学科规范”问题, 即数理统计方法在社会经济领域应用过程中应该侧重做什么和怎样做, 关键是为什么这样做.全文分为三个部分: 研究的格局、研究的相关性和应用过程中的方法论研究.研究聚焦所面临的第一个选择是: 偏理论, 还是偏应用?这需要把握好研究的学科格局.进而对论题的聚焦则需要注重“研究的相关性”, 否则实证就失去了其不可或缺的社会经济意义.要达成实证研究的“内在一致性”和“外在一致性”, 统计学者应该充分发挥自己的专业优势, 深入开展“统计应用方法研究”, 其内涵便是本文试图概括阐述的, 以便统计实证奠基于方法应用的“机理”.统计应用过程也需要方法论研究, 这便是本文的核心观点(聚焦点).
在网络拍卖里(如eBay), 有三种主要的交易制度, 一是一口价, 二是一般的拍卖, 三是立即购买拍卖(auction with buy-it-now). 本文利用一个简单的理论, 说明这三种制度, 其实是卖家在同一个最适化问题下的三种不同的解. 换句话说, eBay里, 卖家对上述三种上架方式的策略选择, 可以在一个统一的理论模型下去内生化(endogenize). 其中的关键在于底价及立即购买价之间的相对关系, 尤以底价的角色最重要. 在这个理论下, 本文证明这三种交易制度下的底价的相对大小, 有一个固定的排序. 我们利用eBay的iPod上架数据, 来证实这个排序.