异质性政策效应评估的非线性方法:多期双重差分模型的拓展研究

王正新, 琚悦琦

计量经济学报 ›› 2022, Vol. 2 ›› Issue (3) : 533-547.

PDF(757 KB)
PDF(757 KB)
计量经济学报 ›› 2022, Vol. 2 ›› Issue (3) : 533-547. DOI: 10.12012/CJoE2022-0014
论文

异质性政策效应评估的非线性方法:多期双重差分模型的拓展研究

    王正新(), 琚悦琦()
作者信息 +

A Nonlinear Approach to Assessing Heterogeneous Policy Effects: An Extended Study of a Multiphase Difference-in-differences Model

    Zhengxin WANG(), Yueqi JU()
Author information +
文章历史 +

摘要

为了解决异质性政策效应的评估问题, 本文在多期双重差分模型中引入平滑转换函数, 提出了一种更具一般性的非线性双重差分模型及其估计方法, 并以设立国家级新区的异质性经济增长效应评估为例, 验证了新模型的有效性.研究发现, 作为多期双重差分模型的拓展, 非线性双重差分模型能够从机理上刻画政策生效的渐进过程和个体异质性特征.设立国家级新区对地区经济增长具有显著的异质性影响, 并随着创新水平的变化而呈显著的非线性特征, 该效应在0.95~2.905区间内平滑变化.

Abstract

To solve the problem of evaluating the effects of heterogeneous policies, a smooth transition function is introduced into the difference-in-differences model, and a more general nonlinear difference-in-differences model and its estimation method are proposed. The effectiveness of the new model is verified by taking the evaluation of the effect of heterogeneous economic growth of national new districts as an example. It is found that the nonlinear difference-in-differences model, as an extension of the traditional difference-in-differences model, can describe the gradual process and individual heterogeneity of policy effect from mechanism. The establishment of statelevel new areas has a significant heterogeneous effect on regional economic growth, and presents a nonlinear characteristic with the change of innovation level. The effect changes smoothly in the range of 0.95 to 2.905.

关键词

异质性政策效应 / 非线性双重差分模型 / 平滑转换函数 / 政策评估

Key words

heterogeneous policy effect / nonlinear difference-in-differences model / smooth transition function / policy evaluation

引用本文

导出引用
王正新 , 琚悦琦. 异质性政策效应评估的非线性方法:多期双重差分模型的拓展研究. 计量经济学报, 2022, 2(3): 533-547 https://doi.org/10.12012/CJoE2022-0014
Zhengxin WANG , Yueqi JU. A Nonlinear Approach to Assessing Heterogeneous Policy Effects: An Extended Study of a Multiphase Difference-in-differences Model. China Journal of Econometrics, 2022, 2(3): 533-547 https://doi.org/10.12012/CJoE2022-0014

1 引言

近年来, 双重差分(Difference-in-differences, DID) 模型被广泛应用于经济学诸多领域的政策效应量化评估. 该模型最早由国外学者Ashenfelter引入到经济学实证分析中, 其基本思想是通过对政策实施前后对照组和处理组间的差异比较, 构造出反映政策效应的双重差分估计量(Ashenfelter (1978)). 周黎安和陈烨(2005)在探究我国农村税费改革特征基础上, 运用传统双重差分模型评估了该政策的农民增收效应, 这是最早使用该方法研究政策评估问题的国内经济学文献. 为了使模型能够更好地适用于现实问题, 许多学者从不同角度提出了双重差分模型的拓展方法.
针对观测样本无法满足双重差分模型的平行趋势假设问题, 一些学者将倾向匹配法与双重差分模型加以组合. Heckman et al. (1997)引入倾向匹配得分法一定程度上解决了该问题, 其做法是从原始样本中挑选基本特征比较相似的数据作为新的处理组和对照组, 进而构建基于倾向匹配得分的双重差分模型. 不少国内学者使用该方法以满足双重差分模型的平行趋势假设. 陈文哲等(2021)基于倾向匹配的双重差分方法验证了可转债市场的扩容显著促进了企业创新质量的提高, 并厘清了债务治理、股权治理等影响机制在其中起的重要作用. 然而使用匹配法的前提是数据样本量较大, 当样本容量较少时, 使用三重差分法解决非平行趋势问题比较合适. Moser and Voena (2012)使用三重差分模型, 从《与敌对国家贸易法案》实施前后、个体是否为专利使用国和产业是否受到强制影响的三维差异, 评估了强制许可对专利使用国的影响. 国内学者在经济政策评估中较多使用三重差分模型以解决观测样本平行趋势的问题, 比如钱雪松等(2021)通过三重差分模型的实证检验, 验证了《物权法》出台引致的融资约束缓解对企业创新行为影响在金融化市场程度和法律制度层面存在显著差异性.
当个体或多或少受到政策影响或者政策强度不尽相同时, 在区分处理组和控制组问题上, 部分文献通过对连续变量设置一个门槛值c的方式划分处理组与控制组(Duflo (2001)), 但是将连续变量压缩为二分变量可能会损失较多信息, 并且评估的效应易受污染. Athey and Imbens (2006)提出了一种适用于连续型解释变量的非线性双重差分模型(NL-DID模型), 也称作双重变换模型(CIC模型), 该方法可以估计处理组和控制组的潜在结果分布, 识别更加有效的处理效应分布. 与双重变换模型相似的非线性双重差分法还有分位数双重差分模型, 可估计不同分位点上的处理效应, 因此该方法可以用于分析不同分布的协变量下政策实施的效应(Bonhomme and Sauder (2011)). 此外, Kim and Lee (2019)认为当对照组总受政策影响时, 可通过构建反向双重差分模型有效识别政策前期效应.
由于现实中绝大多数政策具有"先试点后推广" 的实施特点, 多期双重差分模型(多时点、渐进、交叠双重差分模型) 的应用逐渐普及, 受到学界的广泛关注, 比如金融发展(Beck et al. 2010)、土地改革(Almond et al. 2019)等领域均使用多期双重差分方法展开实证分析. 学者将带有双向固定效应的双重差分模型(TWFEDD) 视作传统双重差分模型的等价形式, 但是TWFEDD的模型同样依赖于平行趋势假设和处理组无论是组间还是不同时期的效应均为常数两个基础假设, 然而, 后者的个体或时期同质性假设通常并不满足, 即现实中政策异质性效应非常普遍(陈林和伍海军(2015)), 而模型当中如果忽略异质性效应的设定, 容易造成严重的估计偏误(Goodman-Bacon (2021), Sun and Abraham (2021)).
一方面, 由于政策处理效应随时间推进可能存在变化差异, Goodman-Bacon认为较早受政策影响的处理组与较晚受政策影响的处理组之间的比较是"Forbidden Comparisons", 并将多期DID的β估计系数分解为若干2×2 "canonical" 的DID估计量的加权平均数. Sun and Abraham (2021)则在动态DID领域中, 认为事件分析法当期的政策效应易受其他期线性组合的影响, 因而估计系数会被污染. 另一方面, 政策强度不同对估计系数的偏误. Meyer (1995)认为如果政策在个体间实施的强度存在差异, 有助于我们判断不同的政策强度引致的结果变化是否不同. 连续型DID (广义DID) 使用个体的强度变量与政策实施前后虚拟变量相乘, 衡量两者维度差异(Lee (2016)). 比如Qian (2008)使用茶叶种植面积量化地区维度差异. 除此之外, Callaway et al. (2021)认为TWFEDD估计量存在选择偏差, 这部分偏差来自不同剂量组的异质性治疗效应, 并且通过建立剂量(dose) 与反应(response) 之间的关系, 有助于解释更细致的因果关系和发现潜在机制.
现有文献对于个体异质性效应问题的处理, 主要通过地理区位、经济发达程度等几种分类方式各自建模来比较双重差分估计量的显著性和大小, 以刻画政策的异质性特征. 袁茜等(2019)就长三角经济一体化政策对高技术产业研发效率的异质影响, 分上、中、下游的情况讨论, 研究发现中、下游地区的高技术产业研发效率受政策影响较大, 而上游几乎不受影响. 考虑到个体受政策影响在空间维度上存在差异的情形, Sunak and Madlener (2016)使用空间双重差分模型评估德国风电投资项目对房产价格效应, 验证了风电项目的投资政策引起的不同地点景观变化对房产价格造成差异性损失, 其中受政策影响较大的一些区域房产价格下降了约9%~14%.
事实上, 许多政策效果的显现在时间维度上是渐进的, 同时在不同个体上的效果也是异质性的. 无论在考虑政策效应随时间变化的情况时, 忽略个体受不同强度的政策影响, 还是评估不同强度政策对个体影响, 忽略政策效应随时间变化的差异性, 都易造成具体政策效应的评估偏误. 我们注意到, Terasvirta and Anderson (1992)提出的平滑转移自回归模型(STAR) 允许转移过程中发生连续性的平滑转换, 有效刻画了针对时间序列的动态非线性影响. 另一方面, 为了解决经济变量可能存在结构突变的问题, Hansen (1999)提出了面板门槛模型(PTR), 由于该模型具有一套完整的估计、检验与推断, 在学界受到广泛应用. 进一步地, González et al. (2004)在平滑转移自回归模型(STAR)和面板门槛模型(PTR) 基础上, 拓展为适用性更广的面板平滑转换模型(PSTR模型). 突出了回归系数在不同区制之间的转换是缓慢、渐进式的特点, 能够有效识别不同个体异质性特征, 适用于刻画变量间非线性的因果关系(吴吉林等(2015), 王正新和朱洪涛(2017)). 在此类非线性模型中, 解释变量对被解释变量的影响程度与另一外生因素有关, 刻画了政策效应的连续平滑转换过程(González et al. 2004).
为了在双重差分模型分析框架中刻画政策生效的渐进过程和个体异质性特征, 本文借鉴面板平滑转换模型的设定思想, 将多期双重差分模型拓展为一种更一般化、适用性更广的非线性双重差分模型. 具体做法为: 在具有双向固定效应的多期双重差分模型(TWFEDD) 中引入政策变量与平滑转换函数相乘的交互项, 保留原本的协变量线性形式和双向固定效应, 进而政策变量估计系数包含了常数项和受不同个体和时间双重影响的平滑转换函数. 这种做法不仅能够刻画政策作用的渐进过程, 而且有效估计政策对不同个体的差异化影响效应, 使得评估结果更贴近现实. 非线性双重差分模型作为传统多期双重差分模型的拓展, 其参数γ0时, 退化为传统的多期双重差分模型. 另外, 本文可通过线性检验和剩余非线性检验(González et al. 2004) 以及非嵌套假设检验, 选择非线性双重差分模型还是传统多期双重差分模型的设定.
本文以国家级新区对区域经济增长的带动效应评估(曹清峰(2020)) 为应用案例, 使用非线性双重差分方法, 探究国家级新区对地区经济增长是否存在显著的异质性影响, 并且评估这种非线性效应, 以期回答长期以来困扰建设国家级新区的核心问题: 国家级新区的设立对经济增长的影响是否具有持续性、是否符合我国区域协调与高质量发展要求. 国家级新区作为我国改革发展与创新体制机制的试验示范区, 是我国为实现产业转型升级, 统筹产城融合发展, 提升区域经济发展效益的积极探索和重大举措, 在改革开放和现代化建设大局中具有重要战略地位. 尤其是2017年雄安新区的设立, 是以习近平同志为核心的党中央推进区域经济增长的"千年大计" 战略选择. 目前, 在新冠肺炎疫情和百年未有之大变局的叠加影响下, 发挥好国家级新区的重大经济政策的作用对推动区域经济增长、防范化解区域风险具有重要的实际意义. 学界对于探究设立国家级新区能否促进区域经济增长, 主要从三个方面展开相应研究: 其一, 国家级新区带动效应的持续性(曹清峰(2020)); 其二, 国家级新区辐射周边地区的影响力(范巧等(2018)); 其三, 不同区域的国家级新区带来的异质性效应(柳天恩等(2019)). 本文认为国家级新区作为一项区位导向性政策, 对不同区域不同时期的经济增长影响可能存在显著差异, 因此使用本文提出的非线性双重差分方法, 估计国家级新区设立对区域经济增长的异质性效应.
本文的主要贡献如下: 其一, 将平滑转换函数引入多期双重差分模型, 构建了一种适用性更广的非线性双重差分模型, 有效解决了异质性政策效应的评估问题; 其二, 证实了不同城市创新水平下国家级新区设立对区域经济增长的非线性效应, 细致比较了各个国家级新区政策效应的变化趋势, 为优化国家级新区政策提供了决策依据.

2 非线性双重差分模型的构建

本文在传统双重差分模型分析框架下引入平滑转换函数, 构建一种刻画政策生效的渐进过程和异质性特征的非线性双重差分模型, 通过网格搜索法和极大似然法估计参数, 并基于线性检验与剩余非线性检验选择模型设定形式, 进而识别政策的异质性效应.

2.1 传统双重差分模型的设定

以应用最为广泛的多期双重差分模型(Beck et al. 2010) 为例, 模型设定如下:
yit=α+βDIDit+μi+λt+ηxit+εit,
(1)
其中, i=1,2,,N, t=1,2,,T, yit是因变量, μi表示个体固定效应, λt表示时间固定效应. DIDit是政策是否实施与是否为处理组乘积的交互项, 体现了随时间和个体变化的政策变量. 当个体i为处理组并且时间t在政策之后, 政策变量赋值为1, 否则赋值为0. 而该变量的回归系数是我们感兴趣的处理效应. 此外, xitk维的时变控制变量, εit是随机误差项. 双重差分模型的核心是构造双重差分估计量, 通过处理组受政策干预前后差异与对照组干预前后差异的比较, 得到如下公式:
β=ΔY¯treatmentΔY¯control=(Y¯treatment,t1Y¯treatment,t0)(Y¯control,t1Y¯control,t0).
(2)

2.2 非线性双重差分模型的设定及其性质

传统双重差分模型难以有效识别政策效应的异质性, 本文试图从机理上刻画政策生效的渐进过程和异质性特征. 不同于传统的多期双重差分模型, 非线性双重差分模型引入了政策变量与平滑转换函数相乘的交互项, 模型定义如下:
yit=α+β0DIDit+β1G(qit;γ,c)DIDit+μi+λt+ηxit+εit,
(3)
其中, i=1,2,,N, t=1,2,,T, yit是因变量, μi表示个体固定效应, λt表示时间固定效应, xitk维时变的控制变量, εit是随机误差项, DIDit是政策是否实施与是否为处理组乘积的交互项, 为评估政策效应的核心变量. 以上这些设定与传统的多期双重差分模型保持一致. 例如, 在分批次设立国家级新区案例中, i为城市(i=1,2,,69), t为年份(t = 2003, 2004, …, 2017), 如果t年的城市i设立了国家级新区, 则DIDit=1, 反之DIDit=0. 本文亮点在于核心变量(政策) 与一个平滑转换函数G(qit;γ,c)相乘, 构造了新的交互项. 该函数是由外生转换变量qit决定的连续函数, 其中cm维位置参数向量, c=(c1,,cm)T, c1c2cm, 斜率参数γ (γ0)决定了平滑转换函数的斜率. 不同于面板平滑转换模型设定, 本文存在以下两点差异: 其一, 将平滑转换函数与政策变量相乘, 刻画政策在01之间的剂量(dose). 政策实施以来, 不同个体的效应并不相同, 并且随着时间的推进, 政策本身强度、政策带来的效应可能存在较大变化. 其二, 在双向固定效应前提下, 协变量(控制变量) 依然是线性形式, 重点关注的是政策实施带来的非线性效应.
其中, Terasvirta (1994), Van Dijk et al. (2002), Hubrich and Terasvirta (2013)等认为使用逻辑平滑转换函数(logistic star, LSTR)和指数平滑转换函数(exponential star, ESTR) 两种类型能够体现渐进过程, 定义如下:
LSTR:G(qit;γ,c)=(1+exp(γjm(qitcj)))1,
(4)
ESTR:G(qit;γ,c)=1exp(γ(qitc)2).
(5)
Luukkonen et al. (1988)认为可以对转换函数用合适的泰勒展开式替代, 并且使用该方法判断平滑转换函数使用LSTR还是ESTR类型. 非线性双重差分模型的特点在于交互项乘以一个平滑转换函数G(qit;γ,c), 这是一个关于外生变量qit的连续且有界的函数, 允许双重差分估计量随着时间、个体不同从β0β0+β1的平滑转换. 其中, γ的取值不同, 决定了模型的性质:
1) 当γ0时, 非线性双重差分模型即为传统多期双重差分模型:
LSTR:yit=α+(β0+12β1)DIDit+μi+λt+ηxit+εit,
(6)
ESTR:yit=α+β0DIDit+μi+λt+ηxit+εit.
(7)
2) 当γ+时, 随着qit变化,
LSTR: 非线性双重差分模型变为具有瞬变作用的非线性双重差分模型, 其中
G(qit;γ,c)={1,jm(qitcj)>012,jm(qitcj)=00,jm(qitcj)<0,
(8)
ESTR:yit=α+(β0+β1)DIDit+μi+λt+ηxit+εit.
(9)
3) 当0<γ<+时, 随qit变化, 政策处理效应随着时间从β0平滑转换到β0+β1, 表明政策实施起, 个体受影响的程度是存在显著差异的.

2.3 线性检验与剩余非线性检验

为了检验政策实施效果是否存在异质性, 非线性双重差分模型首先需要进行线性检验与剩余非线性检验. 从经济含义来说, 线性检验能够对经济学理论提供相应的解释依据, 表明政策作用不是同质的, 而是存在不同个体与时间的异质程度. 从统计学角度来说, 如果建模结果是线性的, 非线性双重差分模型难以识别. 线性检验(González (2004)) 是对原假设是否成立进行检验. 由于未知参数较多, 为了避免出现识别问题, 将G(qit;γ,c)γ=0附近m阶泰勒展开, 构造一个关于参数线性的辅助回归模型:
yit=α+β0DIDit+β1DIDitqit++βmDIDitqitm+μi+λt+ηxit+εit,
(10)
其中, 参数向量β1,,βmγm次连乘项, εit=εit+Rmβ1DIDit, Rm是泰勒展开式的余项, 因此检验H0:γ=0等价于检验H0:β1==βm=0. 我们分别估计线性固定模型和该辅助回归, 得残差平方和SSR0SSR1, 基于F检验统计量对线性原假设进行检验:
F=(SSR0SSR1)/mkSSR0/(TNNmk)F(mk,TNNmk),
(11)
其中, TN为总的样本容量, k为解释变量个数, F统计量服从F(mk,TNNmk)分布, m为位置参数个数, 通常取m=1m=2 (Colletaz and Hurlin (2006)). 通过剩余非线性检验可确定转换函数个数γ. 如果拒绝线性检验的原假设H0:r=0, 则需要进一步做"剩余非线性检验以考察非线性模型是否充分拟合, 即确定是否只存在唯一转换函数(H0:r=1)或者至少存在两个转换函数(H1:r=2). 方法与线性检验相类似, 基于第二个转换函数在γ2=0m阶泰勒展开来构造辅助回归式, 使用F统计量进行检验. 如果再次拒绝原假设, 则继续提出另一组假设检验(H0:r=2; H1:r=3), 依此类推, 直到无法拒绝原假设为止, 确定最优的r值.
为了进一步检验非线性双重差分模型相比传统模型的效果更优以及选择合适的平滑转移机制, 本文在实证验证中构建带有Logistic平滑转换函数(LSTR)、指数平滑转换函数(ESTR) 的非线性双重差分模型以及传统双重差分模型. 基于核心变量的显著性检验, 组内R2, Akaike Information Criterion (AIC)和Bayesian Information Criterion (BIC) 统计量以及Davidson and Mackinnon (1981)的非嵌套J检验选择适合的平滑转换函数以刻画政策异质性效应. 选择标准: 核心估计系数β0, β1, γc显著; 组内R2值越高模型越优; AIC和BIC信息准则越小的模型越优. 目前常见的非嵌套检验方法J检验是通过比较具有非嵌套关系的模型A和模型B哪个最优(Harvey, 1990), 进而选择合适的平滑转换机制. 检验分为两步: 第一, 对模型A进行估计, 得到因变量Y的拟合值, 并作为自变量加入到模型B中, 若通过了显著性t检验, 则模型A能包含改进模型B的其他信息, A模型更优. 第二, 将模型A和模型B调换顺序做上一步检验, 如果第一步通过了t检验, 而第二步未通过检验, 则进一步证实模型A比模型B更优. 该方法通过传统DID与非线性DID以及不同平滑转换函数类型的模型间两两比较, 确定最优的模型设定.

2.4 非线性双重差分模型的参数估计

尽管本文主要从政策评估实际应用的视角, 构造了一种新的非线性双重差分模型以评估政策异质性效应, 但是非线性双重差分模型的参数估计、统计检验同González et al. (2004)的非线性估计方法仍然保持一致性. 传统双重差分模型本质上是一类面板计量模型, 非线性双重差分模型本质上则是一个特定变量(政策变量) 存在平滑转移的面板计量模型.
在线性检验与剩余非线性检验符合条件的基础上, 本文对非线性双重差分模型进行参数估计. 如公式(3) 所示, 由于非线性参数γ,c未知, 此时传统的线性面板数据模型估计方法无法直接使用. 本文基于网格搜索法和极大似然法迭代估计各参数, 首先将模型转化为以下形式:
yit=ϑXit(γ,c)+μi+εit,
(12)
其中Xit(γ,c)包含政策变量、政策变量与转换函数的交互项、控制变量以及时间虚拟变量, 待估计参数向量ϑ包含重要的待估参数β1,β0.
进一步去除个体固定效应可得以下模型:
y~it=ϑX~it(γ,c)+ε~it,
(13)
由于X~it(γ,c)中的DID变量在各水平和个体均值上均依赖于参数(γ,c), 所以每次迭代均需要重新计算X~it(γ,c).
1) 确定非线性参数(γ,c)的初始值. 基于网格搜索法, 在一系列γc的可能取值范围内进行划分. 良好的初始值能够促进数值优化, 网格搜索法是一种可行的方法(Hansen (1999)). 本文设置位置参数的搜索范围为去掉转换变量值最大和最小T/2个观测值后的取值范围. 在不同取值组合下, 比较模型的残差平方和, 以其最小为目标, 确定最优γc的初始值γ(1)c(1).
2) 使用极大似然法估计ϑ^(j). 极大似然估计量(MLE) 的优势在于大样本性质: 一致性、渐进有效性和渐进正态性(陈强(2014)). 通过式(14)和(15) 可获得ϑ^(j). 基于极大似然法的观测信息矩阵(observed-information matrix, OIM) 可确定渐近协方差矩阵, 如式(16)所示, 进一步对该矩阵的主对角线元素取根号运算便可获得参数估计量的标准误1.
1如需本文模型Stata代码, 可向通信作者索取.
lnL(θ)=NT2ln(2πσ2)12σ2t=1TV~tT(θ)V~t(θ)V~t(θ)=y~itϑTX~it(γ,c),
(14)
ϑ^(j)=argmaxlnL(θ)=(iNtTX~it(γ(j),c(j))X~itT(γ(j),c(j)))1iNtT(X~it(γ(j),c(j))y~it),
(15)
Asy.C=[I(θ)]1=[E(2lnL(θ)θθT)]1,
(16)
其中, L(θ)为公式(14)的似然函数, γ(j)c(j)j表示第j次迭代.观测信息矩阵2lnL(θ)θθT二阶导数测度的是对数似然函数的曲率. 对数似然函数在极大值周围曲率最大, 相应地二阶导数最大, 从而方差小, 极大似然估计量相对准确. 根据极大似然法估计出新的参数γ(j+1)c(j+1), 重复(2) 的步骤, 估计ϑ^(j), 循环以上步骤, 直到参数向量ϑ收敛. N趋于无穷大时, 参数β1,β0,η的极大似然估计是依概率收敛的. 并且T趋于无穷大, 参数σ2的估计满足一致性.

3 设立国家级新区的经济增长效应评估

国家级新区作为国家经济发展的综合功能区, 是我国推动经济高质量发展的重要举措. 关于设立国家级新区政策评估的研究倍受学界关注, 曹清峰(2020)运用传统多期双重差分方法, 证实了国家级新区的设立显著促进了区域经济增长. 本文基于该文献作者提供的实证数据(数据来源于《中国工业经济》期刊网站http://ciejournal.ajcass.org/), 使用本文提出的非线性双重差分方法对设立国家级新区的经济增长效应进行异质性分析, 验证非线性双重差分模型的有效性.

3.1 变量说明

本文使用2003–2017年中国70个大中城市数据作为研究样本, 将设立国家级新区视作一项准自然实验, 构建一种新的非线性双重差分模型, 评估设立国家级新区后对经济增长的异质性效应. 同样地, 本文加入了社会统计指标以控制各城市其他影响因素, 包括: 1) 投资变量(Inv), 通过每年各城市固定资产投资额占GDP比值测算得到; 2) 国内消费变量(Con), 用每年各城市的全社会商品销售总额占GDP比重衡量; 3) 净出口变量(Exp), 用每年各城市出口总额与进口总额之比衡量; 4) 财政支出(Gov), 通过每年各城市全市的财政总支出占GDP比重衡量; 5) 经济集聚度(Agg), 用各城市市辖区GDP占全市GDP的比重衡量; 6) 二产比重(Sec), 用各城市第二产业增加值占GDP的比重衡量; 7) 创新水平(Inn), 用各城市每万年人拥有的专利授权数衡量. 此外, 创新水平对经济增长具有正向的非线性效应, 本文认为城市的创新水平影响了设立国家级新区对区域经济增长的作用程度, 因此, 该变量设定为非线性双重差分模型中的转换变量.

3.2 模型检验与转换函数选择

Luukkonen et al. (1988)认为可以使用合适的泰勒展开式替代转换函数, 并且使用这种方法选择逻辑平滑转换函数(logistic star, LSTR) 还是指数平滑转换函数(exponential star, ESTR) 类型. 表 1提供了线性检验和剩余非线性检验结果, 在线性检验中对于检验p值均小于0.01, 拒绝了原假设H0:γ=0, 结果表明使用非线性双重差分模型研究国家级新区的设立对区域经济增长的异质性效应是必要且合理的. 剩余非线性检验则进一步确定转换函数的个数, 无论在5% 还是10%显著性水平下均无法拒绝, 则表明非线性双重差分模型应该选择1个转换函数. 此外, 位置参数个数m=2时, 非线性双重差分模型估计的位置参数在搜索范围之外, 因此本文取位置参数个数m=1的情况.
表1 非线性双重差分模型的线性检验与剩余非线性检验
线性检验 剩余非线性检验
H0 F df1 df2 p F df1 df2 p
β1=0 5.908 2 480 0.003 0.442 1 480 0.507
β1=β2=0 3.644 4 478 0.006 0.222 2 479 0.801
β1=β2=β3=0 3.12 6 476 0.005 0.202 3 478 0.895
β1=β2=β3=β4=0 2.945 8 474 0.003 0.584 4 477 0.675
非线性双重差分模型除了需要确定转换函数个数、位置参数个数外, 确定合适的平滑转移机制十分重要, 换句话说, 国家级新区数据不可能同时符合多种转移机制, 逻辑平滑转换函数(logistic star, LSTR)和指数平滑转换函数(exponential star, ESTR) 是现有研究贴合现实数据最为常见的两类转换函数(Hubrich and Terasvirta (2013)). 本文通过非嵌套检验选择平滑转换函数, 其中Davidson and Mackinnon (1981)的J检验最为常见. 表 2报告了J检验结果, 传统DID (模型1) 与LSTR-DID (模型2) 比较中, 模型1的估计量作为自变量加入模型2时t统计量为0.03, 未通过显著性检验, 说明模型2可能为真. 相反, 模型2的估计量加入到模型1中, t统计量为2.01, 显著性较高, 进一步证明模型2为真, 换句话说, LSTR-DID (模型2) 兼容传统DID (模型1). 同理, 传统DID (模型1) 与ESTR-DID (模型2) 比较中, 结果表明ESTR-DID (模型2) 兼容传统DID (模型1). 而在LSTR-DID (模型1) 与ESTR-DID (模型2) 比较中, 检验均未通过显著性检验, 不过相比较而言, ESTR-DID (模型2) 的p值为0.166, 小于LSTR-DID (模型1) 的p值0.586, 表明选择带有指数平滑转换函数的非线性双重差分模型比Logistic转换函数的非线性双重差分模型和传统模型更优.
表2 非线性双重差分模型的非嵌套假设检验
模型1 vs模型2 模型1 模型2
t统计量 p t统计量 p
传统DID vs LSTR-DID -0.03 0.979 2.01** 0.049
传统DID vs ESTR-DID 0.38 0.707 2.41** 0.019
LSTR-DID vs ESTR-DID 0.55 0.586 1.4 0.166

3.3 参数估计与模型比较

为了有效评估国家级新区的设立对区域经济增长的异质性效应, 本文分别构建了传统双重差分模型和非线性双重差分模型加以比较. 表 3报告了传统的双重差分模型(1) (2) (3)的估计结果, (2) 在(1) 的基础上加入了控制变量, 结果显示在1%显著性水平下, 政策变量DID的系数为1.507, 说明了设立国家级新区对所在城市的经济增长具有显著的正向效应, 促进经济增长率提高了1.507%, 其他控制变量的估计系数与预期保持一致. 为修正样本选择偏误问题, 本文使用倾向匹配方法(PSM), 具体做法是按1: 1近邻匹配有放回的抽样方法对处理组进行逐年匹配. 各变量处理组与对照组的样本均值差异在5%水平下未通过显著性检验, 保证了处理组与对照组样本的平衡性. 在倾向匹配方法基础上, 表 3 (3) (4)和(5) 分别报告了传统DID、LSTR-DID、ESTR-DID模型的回归结果.
表3 设立国家级新区的经济增长效应评估
变量 模型(1) 模型(2) 模型(3) 模型(4) 模型(5)
线性部分
DID 1.163* 1.507*** 1.395** 2.006*** 2.905***
(-0.585) (-0.475) (-0.556) (-0.45) (-0.732)
非线性部分
DID -1.250** -1.955***
(-0.589) (-0.765)
c 14.617*** 11.526***
(-1.554) (-0.791)
ln(γ) 3.662 -1.515*
(-61.77) (-0.885)
控制变量
Inv 0.050*** 0.042*** 0.043*** 0.044***
(-0.009) (-0.013) (-0.008) (-0.008)
Con -0.111*** -0.124** -0.126*** -0.129***
(-0.034) (-0.059) (-0.025) (-0.025)
Exp 0.167** 0.293*** 0.291*** 0.311***
(-0.071) (-0.088) (-0.083) (-0.083)
Gov 0.255*** 0.373** 0.360*** 0.371***
(0.091) (-0.178) (-0.07) (-0.07)
Sec 0.062** 0.009 0.015 0.009
(-0.03) (-0.06) (-0.032) (-0.032)
Agg 0.073*** 0.066*** 0.075*** 0.070***
(-0.022) (-0.022) (-0.02) (-0.019)
Inn 0.036** 0.067* 0.078*** 0.075***
(-0.017) (-0.04) (-0.02) (-0.019)
_cons 7.224*** -3.991 -2.727 -3.516*** -3.110***
(-0.305) (-3.491) (-7.024) (-0.404) (-0.393)
个体固定效应 YES YES YES YES YES
时间固定效应 YES YES YES YES YES
统计量
组间R2 0.585 0.692 0.738 0.74 0.741
AIC 4646.051 4351.27 2249.17 2250.938 2248.627
BIC 4720.184 4459.997 2344.458 2359.226 2356.914
注: *、**、***分别表示10%、5%和1%的显著性水平水平上显著; 括号内为个体层面的聚类稳健标准误.
值得注意的是, 模型(4) (5) 非线性双重差分模型的政策变量DID以非线性的形式均在1%水平下通过了检验, 显著性程度高于传统模型. 相应地, 非线性双重差分模型的组内R2大小高于传统双重差分模型. 根据经济含义、变量显著性检验、组内R2和信息准则的综合考虑, 我们认为引入指数平滑转换函数的非线性双重差分模型效果最优.
表 3模型(5) 报告了ESTR-DID模型的回归结果, 政策变量DIDitβ0 (线性部分) 显著为2.905, β1 (非线性部分) 显著为1.955, 位置参数c显著为11.526, 斜率参数ln(γ)显著为1.515, 这表明设立国家级新区对区域经济增长的影响是非线性的, 并且随着各地区创新水平的变化, 政策效应呈显著的异质性, 该效应处于0.95~2.905范围内. 此外, 控制变量的影响方向符合经济含义, 与传统模型保持一致. 进一步地, 如图 1所示, 当创新水平在[0,11.526]范围内, 随着创新水平的提高, 国家级新区设立对经济增长的效应呈单调递增趋势; 创新水平达到11.526时, 效应达到最大值, 为2.905, 而当创新水平超过11.526后, 效应呈单调递减趋势. 图 1直观表明设立国家级新区与区域经济增长之间蕴涵着非线性效应, 根源在于平滑转换函数的引入能够刻画政策生效的渐进过程和个体异质性特征. 当创新水平处于[3.25,19.85]时, 随着创新水平的提高, 国家级新区的设立对区域经济增长的影响呈现先递增后递减的趋势, 即国家级新区的设立对区域经济增长的效应呈非线性特征, 并且异质性效应在0.95~2.905范围内变化. 该模型估计结果有效验证了国家级新区设立对区域经济增长存在地区、时间上显著的异质性效应.
图1 设立国家级新区对经济增长的非线性效应

Full size|PPT slide

3.4 异质性分析

鉴于各大中城市存在不同程度的政策效应, 本文进一步评估了不同城市的国家级新区设立对区域经济增长的年均效应. 我国共设立19个国家级新区, 由于评估样本数据为我国2003–2017年70个大中城市面板数据, 上海的浦东新区和浙江舟山的群岛新区未纳入其中, 17个国家级新区设立以来对经济增长的年均效应如表 4所示. 从时间、个体的双重角度来看, 国家级新区带来的效应存在显著差异. 2017年河北保定的雄安新区设立的经济增长年均效应达2.905, 在17个国家级新区中排位第一. 江苏南京的江北新区, 四川成都、眉山的天府新区, 广东广州的南沙新区, 重庆的两江新区依次排第二位到第五位, 年均效应分别是2.875、2.849、2.812、2.428. 甘肃兰州的兰州新区, 贵州贵阳、安顺的贵安新区等国家级新区自设立以来年均效应维持在较低水平(0.95). 此外, 云南昆明的滇中新区、天津的滨海新区和黑龙江的哈尔滨新区自国家级新区设立以来, 年均效应变动较大, 变异系数分别为0.627、0.484和0.446. 具体而言, 以2006年5月设立的滨海新区为例, 由于实践中地方政府已提前知道是否设立为国家级新区, 并提前开展工作, 政策发挥作用时间早于国务院批复时间. 2005–2009年滨海新区的设立对天津经济增长的影响较大, 政策估计系数为2.905, 2009年之后国家级新区带动效应出现下降趋势, 到2016年降至最低点0.95. 其他城市受政策影响, 随着时间的变化亦表现出效应的异质性. 从2017年的横向比较来看, 受政策影响的大中城市带动效应介于0.95~2.905内, 该年平均政策效应为1.595. 此外, 基于进一步计算的各城市年均效应, 估计出国家级新区设立对经济增长带动效应的平均值为1.741. 以上结果均表明构建非线性双重差分模型的合理性, 不仅能够估计出政策的平均处理效应, 而且有效评估不同年份各城市的国家级新区设立对经济增长的显著异质性效应, 更为贴近现实.
表4 设立国家级新区的年均政策效应
序号 新区名称 获批时间 主体城市 年均效应 标准差 变异系数
1 滨海新区 2006/5/26 天津 2.035 0.984 0.484
2 两江新区 2010/5/5 重庆 2.428 0.842 0.347
3 兰州新区 2012/8/20 甘肃兰州 0.95 0 0
4 南沙新区 2012/9/6 广东广州 2.812 0.227 0.081
5 西咸新区 2014/1/6 陕西西安、咸阳 2.233 0.94 0.421
6 贵安新区 2014/1/6 贵州贵阳、安顺 0.95 0 0
7 西海岸新区 2014/6/3 山东青岛 0.95 0 0
8 金普新区 2014/6/23 辽宁大连 0.95 0 0
9 天府新区 2014/10/2 四川成都、眉山 2.849 0.111 0.039
10 湘江新区 2015/4/8 湖南长沙 0.95 0 0
11 江北新区 2015/6/27 江苏南京 2.875 0.051 0.018
12 福州新区 2015/8/30 福建福州 0.95 0 0
13 滇中新区 2015/9/7 云南昆明 1.57 0.984 0.627
14 哈尔滨新区 2015/12/16 黑龙江哈尔滨 2.286 1.019 0.446
15 长春新区 2016/2/3 吉林长春 0.95 0 0
16 赣江新区 2016/6/14 江西南昌、九江 0.95 0 0
17 雄安新区 2017/4/1 河北保定 2.905 0 0
注: 由于评估样本为我国大中城市国家级新区设立于2003–2017年范围内, 上海的浦东新区和浙江舟山的群岛新区未纳入其中.

4 结论

本文提出的非线性双重差分模型扩大了传统多期双重差分模型的适用范围, 突显了政策效应的非线性特征和异质性效应. 针对我国设立国家级新区对经济增长带动效应可能存在异质性问题, 本文基于线性检验与剩余非线性检验, 非嵌套检验以及模型变量显著性检验证实了国家级新区的效应具有非线性特征. 基于网格搜索法和极大似然法迭代估计了政策变量估计系数(β0β1)、位置参数(c)、斜率参数(γ)及控制变量系数, 核心变量均通过了显著性检验. 结果表明, 设立国家级新区促进了区域GDP增长率的提高, 并且效应具有显著的异质性特征: 其一, 作为传统双重差分模型的拓展, 本文提出的非线性双重差分模型, 有效估计了设立国家级新区对区域经济增长的异质性效应, 效应在0.95~2.905范围内变化. 其二, 揭示了设立国家级新区与区域经济增长之间蕴涵着非线性效应, 表现为随着创新水平的变化, 而变化该政策效应呈现显著的非线性特征. 其三, 非线性双重差分模型以带有平滑转换函数的模型设定, 有效刻画了政策效应的非线性和异质性效应, 拓展了传统双重差分模型的适用性.
尽管本文提出的非线性双重差分模型能够刻画政策生效的渐进过程和个体异质性特征, 但是, 新模型更为复杂, 准确估计需要的数据样本也更多. 对于非线性双重差分模型的参数估计和统计检验同面板平滑转换模型的方法保持一致, 不过统计检验中线性检验与剩余非线性检验是针对平滑函数的泰勒展开进行的, 这种情况会导致检验在某些特定的方向上失去功效, 今后的研究当中将尝试采用前沿的非线性检验方法加以完善. 此外, 非线性双重差分模型中政策变量的离散性也有待进一步深入研究.

参考文献

曹清峰, 国家级新区对区域经济增长的带动效应——基于70大中城市的经验证据[J]. 中国工业经济, 2020, (7): 43- 60.
Cao Q F , Driving Effects of National New Zone on Regional Economic Growth-Evidence from 70 Cities of China[J]. China Industrial Economics, 2020, (7): 43- 60.
陈林, 伍海军, 国内双重差分法的研究现状与潜在问题[J]. 数量经济技术经济研究, 2015, (7): 133- 148.
Chen L , Wu H J , Research Status and Potential Problems of Differences-in-differences Method in China[J]. The Journal of Quantitative & Technical Economics, 2015, (7): 133- 148.
陈强, 高级计量经济学及Stata应用[M]. 北京: 高等教育出版社, 2014.
Chen Q , Advanced Econometrics and Stata Applications[M]. Beijing: Higher Education Press, 2014.
陈文哲, 石宁, 梁琪, 可转债能促进企业创新吗?——基于资本市场再融资方式的对比分析[J]. 管理科学学报, 2021, 24 (7): 94- 109.
Chen W Z , Shi N , Liang Q , Can Convertible Bonds Promote Corporate Innovation: Comparative Research of Refinancing Means in Capital Markets[J]. Journal of Management Sciences in China, 2021, 24 (7): 94- 109.
范巧, 郭爱君, 国家级新区辐射带动力及其实现机制研究[J]. 经济体制改革, 2018, (5): 46- 51.
Fan Q , Guo A J , Radiation Power of National New Area and Its Formation Mechanism[J]. Reform of Economic System, 2018, (5): 46- 51.
柳天恩, 田学斌, 曹洋, 国家级新区影响地区经济发展的政策效果评估——基于双重差分法的实证研究[J]. 财贸研究, 2019, 30 (6): 24- 35.
Liu T E , Tian X B , Cao Y , Policy Effect Evaluation of the National New District on Regional Economic Development: An Empirical Research Based on Difference in Differences Method[J]. Finance and Trade Research, 2019, 30 (6): 24- 35.
钱雪松, 丁滋芳, 陈琳琳, 缓解融资约束促进了企业创新吗?——基于中国《物权法》自然实验的经验证据[J]. 经济科学, 2021, (1): 96- 108.
Qian X S , Ding Z F , Chen L L , Does Alleviating Financing Constraints Firms' Innovation? Evidence from a Natural Experiment in China[J]. Economic Science, 2021, (1): 96- 108.
王正新, 朱洪涛, 创新效率对高技术产业出口复杂度的非线性影响[J]. 国际贸易问题, 2017, (6): 61- 70.
Wang Z X , Zhu H T , The Nonlinear Effects of Innovation Efficiency on Export Sophistication of High-tech Industry: Based on Panel Smooth Transition Regression Model[J]. Journal of International Trade, 2017, (6): 61- 70.
吴吉林, 陈刚, 黄辰, 中国A、B、H股市间尾部相依性的趋势研究——基于多机制平滑转换混合Copula模型的实证分析[J]. 管理科学学报, 2015, (2): 50- 65.
Wu J L , Chen G , Huang C , Long-term Dynamic Trends in Tail Dependence of Chinese A, B and H Stock Markets: Empirical Analysis Based on Multi-regime Smoothing Transition Mixed Copula Model[J]. Journal of Management Sciences in China, 2015, (2): 50- 65.
袁茜, 吴利华, 张平, 长江经济带一体化发展与高技术产业研发效率[J]. 数量经济技术经济研究, 2019, (4): 45- 60.
Yuan Q , Wu L H , Zhang P , Integrated Development of the Yangtze River Economic Belt and R & D Efficiency of High-tech Industry[J]. The Journal of Quantitative & Technical Economics, 2019, (4): 45- 60.
周黎安, 陈烨, 中国农村税费改革的政策效果: 基于双重差分模型的估计[J]. 经济研究, 2005, (8): 44- 53.
Zhou L A , Chen Y , The Policy Effect of Tax-and-Fees Reforms in Rural China: A Difference-in-differences Estimation[J]. Economic Research Journal, 2005, (8): 44- 53.
Almond D , Li H , Zhang S , Land Reform and Sex Selection in China[J]. Journal of Political Economy, 2019, 127 (2): 560- 585.
Ashenfelter O, (1978). Union Relative Wage Effects: New Evidence and a Survey of Their Implications for Wage Inflation[M]//Econometric Contributions to Public Policy. London: Palgrave Macmillan, 31–63.
Athey S , Imbens G W , Identification and Inference in Nonlinear Difference-in-differences Models[J]. Econometrica, 2006, 74 (2): 431- 497.
Beck T , Levine R , Levkov A , Big Bad Banks? The Winners and Losers from Bank Deregulation in the United States[J]. The Journal of Finance, 2010, 65 (5): 1637- 1667.
Bonhomme S , Sauder U , Recovering Distributions in Difference-in-differences Models: A Comparison of Selective and Comprehensive Schooling[J]. Review of Economics and Statistics, 2011, 93 (2): 479- 494.
Callaway B, Goodman-Bacon A, Sant'Anna P H C, (2021). Difference-in-differences with a Continuous Treatment[J]. arXiv preprint arXiv: 2107.02637.
Colletaz G, Hurlin C, (2006). Threshold Effects of the Public Capital Productivity: An International Panel Smooth Transition Approach[R]. France: UniversitéD'Orléans: Orléans.
Davidson R , MacKinnon J G , Several Tests for Model Specification in the Presence of Alternative Hypotheses[J]. Econometrica, 1981, 49, 781- 93.
Duflo E , Schooling and Labor Market Consequences of School Construction in Indonesia: Evidence from an Unusual Policy Experiment[J]. American Economic Review, 2001, 91 (4): 795- 813.
González A, Terasvirta T, Van Dijk D, (2004). Panel Smooth Transition Regression Model and an Application to Investment under Credit Constraints[R]. Unpublished manuscript, Stockholm School of Economics.
Goodman-Bacon A , Difference-in-differences with Variation in Treatment Timing[J]. Journal of Econometrics, 2021, 225 (2): 254- 277.
Hansen B E , Threshold Effects in Non-dynamic Panels: Estimation, Testing, and Inference[J]. Journal of Econometrics, 1999, 93 (2): 345- 368.
Harvey A C , The Econometric Analysis of Time Series[M]. Boston: MIT Press, 1990.
Heckman J J , Ichimura H , Todd P E , Matching as an Econometric Evaluation Estimator: Evidence from Evaluating a Job Training Programme[J]. The Review of Economic Studies, 1997, 64 (4): 605- 654.
Hubrich K , Terasvirta T , Thresholds and Smooth Transitions in Vector Autoregressive Models.The Views Expressed in This Article are Those of the Authors and Should Not be Interpreted as Reflecting the Views of the European Central Bank[M]. Jilin: Emerald Group Publishing Limited, 2013.
Kim K , Lee M , Difference in Differences in Reverse[J]. Empirical Economics, 2019, 57 (3): 705- 725.
Lee M , Generalized Difference in Differences with Panel Data and Least Squares Estimator[J]. Sociological Methods & Research, 2016, 45 (1): 134- 157.
Luukkonen R , Saikkonen P , Terasvirta T , Testing Linearity Against Smooth Transition Autoregressive Models[J]. Biometrika, 1988, 75 (3): 491- 499.
Meyer B D , Natural and Quasi-experiments in Economics[J]. Journal of Business & Economic Statistics, 1995, 13 (2): 151- 161.
Moser P , Voena A , Compulsory Licensing: Evidence from the Trading with the Enemy Act[J]. American Economic Review, 2012, 102 (1): 396- 427.
Qian N , Missing Women and the Price of Tea in China: The Effect of Sex-specific Earnings on Sex Imbalance[J]. The Quarterly Journal of Economics, 2008, 123 (3): 1251- 1285.
Sun L , Abraham S , Estimating Dynamic Treatment Effects in Event Studies with Heterogeneous Treatment Effects[J]. Journal of Econometrics, 2021, 225 (2): 175- 199.
Sunak Y , Madlener R , The Impact of wind Farm Visibility on Property Values: A spatial Difference-in-differences Analysis[J]. Energy Economics, 2016, 55, 79- 91.
Terasvirta T , Specification, Estimation, and Evaluation of Smooth Transition Autoregressive Models[J]. Journal of the American Statistical Association, 1994, 89 (425): 208- 218.
Terasvirta T , Anderson H M , Characterizing Nonlinearities in Business Cycles Using Smooth Transition Autoregressive Models[J]. Journal of Applied Econometrics, 1992, 7 (S1): S119- S136.
Van Dijk D , Terasvirta T , Franses P H , Smooth Transition Autoregressive Models — A Survey of Recent Developments[J]. Econometric Reviews, 2002, 21 (1): 1- 47.

脚注

作者感谢匿名审稿专家、白仲林教授和王群勇教授提供的宝贵意见和建议, 当然文责自负.

基金

国家自然科学基金面上项目(71971194)
浙江省软科学研究计划重点项目(2021C25043)

版权

版权所有,未经授权。
PDF(757 KB)

7227

Accesses

0

Citation

Detail

段落导航
相关文章

/