
样本选择偏误与性别工资差距
Sample Selection Bias and Gender Wage Gap
本文基于2013年和2017年中国家庭金融调查数据,利用Oaxaca-Blinder分解方法结合Heckman样本选择模型对我国25~49岁城镇已婚劳动者的性别工资差距进行了估计和分解.实证研究发现:1)不考虑样本选择偏误的情况下,2013年到2017年性别工资差距有所扩大;2)与以往文献不同,本文在Heckman样本选择模型中明确考察了配偶收入对女性劳动参与的影响,发现已婚女性的就业存在显著的正向选择偏误,即潜在能力越强的女性更倾向于就业;3)正向选择偏误导致已婚群体的性别工资差距明显被低估,2017年性别工资差距的低估范围在42%~62%之间.本文的研究表明,低技能女性劳动参与率过低的现象掩盖了性别工资差距过高的事实,如何通过有关政策提高低技能女性的劳动参与率值得关注.
Based on China Household Finance Survey data in year 2013 and 2017, this paper uses the Oaxaca-Blinder decomposition method and the Heckman sample selection model to estimate and decompose the gender wage gap for urban married workers aged 25~49. Empirical results show that: 1) Without correcting sample selection bias, the gender wage gap widened from 2013 to 2017; 2) Unlike previous literature, this paper explicitly examines the impact of spouse income on female labor participation in the Heckman sample selection model and finds that there is a significant positive selection bias among married women, that is, women with stronger potential ability are more likely to choose to be employed; 3) Positive selection bias leads to an obvious underestimation of the gender wage gap of the married workers. In 2017, the underestimation of the gender wage gap ranged from 42% to 62%. The research findings of this paper imply that the relative low labor force participation rate of low-skilled women conceals the fact that the gender wage gap is essentially large. How to increase the labor force participation rate of low-skilled women through relevant policies deserves attention.
性别工资差距 / 女性劳动参与 / Heckman样本选择模型 / 样本选择偏误 {{custom_keyword}} /
gender wage gap / female labor force participation / Heckman sample selection model / sample selection bias {{custom_keyword}} /
表1 样本描述性统计 |
劳动年龄人口样本 | 已婚受雇劳动者样本 | ||||||||||
2013年 | 2017年 | 2013年 | 2017年 | ||||||||
男性 | 女性 | 男性 | 女性 | 男性 | 女性 | 男性 | 女性 | ||||
已婚(%) | 91.9 | 92.22 | 91.79 | 92.35 | 100 | 100 | 100 | 100 | |||
年龄 | 39.2 | 38.69 | 39.77 | 39.61 | 39.27 | 38.32 | 39.94 | 39.42 | |||
小学及以下(%) | 3.05 | 5.78 | 2.99 | 5.57 | 1.37 | 1.67 | 1.22 | 1.95 | |||
初中(%) | 20.15 | 24.17 | 17.54 | 21.03 | 13.69 | 11.71 | 12.59 | 11.87 | |||
高中/中专/职高(%) | 26.35 | 27.5 | 24.6 | 24.92 | 23.43 | 23.73 | 21.7 | 20.41 | |||
大专(%) | 20.75 | 19.2 | 21.77 | 19.99 | 23.59 | 24.97 | 24.59 | 23.45 | |||
本科及以上(%) | 29.7 | 23.36 | 33.1 | 28.49 | 37.92 | 37.92 | 39.9 | 42.32 | |||
样本量 | 4690 | 5193 | 4556 | 5008 | 2484 | 1614 | 2534 | 1744 |
注: 数据来源于2013、2017年中国家庭金融调查, 劳动年龄人口样本限定为25~49岁的受访者及其配偶.已婚受雇劳动者样本进一步限定为小时工资大于零的非农受雇劳动者, 剔除每年小时工资小于1%分位点和大于99%分位点的样本.对于所有已婚女性, 仅保留配偶年工资收入大于0的样本. |
表2 就业率的性别差异(单位: %) |
2013年 | 2017年 | ||||||
男性 | 女性 | 差异 | 男性 | 女性 | 差异 | ||
总体 | 90.3 | 71.9 | 18.4 | 91.5 | 77.4 | 14.1 | |
婚姻状况 | |||||||
未婚 | 81.6 | 81.2 | 0.4 | 83.4 | 82.0 | 1.4 | |
已婚 | 91.1 | 71.1 | 20.0 | 92.2 | 77.0 | 15.2 | |
年龄组 | |||||||
25~29岁 | 90.7 | 75.5 | 15.2 | 93.0 | 78.4 | 14.5 | |
30~34岁 | 95.2 | 75.7 | 19.5 | 96.3 | 79.9 | 16.4 | |
35~39岁 | 94.0 | 74.5 | 19.5 | 94.3 | 79.2 | 15.1 | |
40~44岁 | 90.4 | 73.5 | 16.9 | 91.5 | 78.8 | 12.6 | |
45~49岁 | 84.1 | 63.5 | 20.6 | 86.6 | 73.2 | 13.4 | |
教育程度 | |||||||
小学及以下 | 74.8 | 45.0 | 29.8 | 73.5 | 58.8 | 14.7 | |
初中 | 80.2 | 57.5 | 22.7 | 83.1 | 66.3 | 16.8 | |
高中/中专/职高 | 88.1 | 67.2 | 20.9 | 89.6 | 72.5 | 17.0 | |
大专 | 95.1 | 80.9 | 14.1 | 95.2 | 82.5 | 12.6 | |
本科及以上 | 97.5 | 91.5 | 6.0 | 96.5 | 89.8 | 6.7 | |
样本量 | 4690 | 5193 | 4556 | 5008 |
注: 数据来源于2013、2017年中国家庭金融调查, 劳动年龄人口样本限定为25~49岁的受访者及其配偶. |
表3 平均对数小时工资的性别差距 |
2013年 | 2017年 | ||||||
男性 | 女性 | 差异 | 男性 | 女性 | 差异 | ||
总体 | 3.03 | 2.91 | 12.9% | 3.22 | 3.07 | 16.7% | |
教育程度 | |||||||
初中及以下 | 2.48 | 2.27 | 23.3% | 2.66 | 2.31 | 40.6% | |
高中/中专/职高 | 2.73 | 2.59 | 15.3% | 2.92 | 2.69 | 25.5% | |
大专及以上 | 3.27 | 3.16 | 11.9% | 3.45 | 3.34 | 10.8% | |
所有制部门 | |||||||
私营部门 | 3.00 | 2.74 | 29.8% | 3.15 | 2.87 | 31.6% | |
国有部门 | 3.04 | 3.00 | 4.2% | 3.28 | 3.19 | 8.5% | |
行业 | |||||||
第二产业 | 2.99 | 2.85 | 15.6% | 3.13 | 3.08 | 5.0% | |
高等服务业 | 3.08 | 3.06 | 2.6% | 3.35 | 3.26 | 10.3% | |
初等服务业 | 2.90 | 2.59 | 36.0% | 3.00 | 2.73 | 31.1% | |
职业 | |||||||
低技能职业 | 2.89 | 2.73 | 17.3% | 3.05 | 2.87 | 20.0% | |
高技能职业 | 3.13 | 3.10 | 3.6% | 3.42 | 3.41 | 0.7% | |
样本量 | 2484 | 1614 | 2534 | 1744 |
注: 数据来源于2013、2017年中国家庭金融调查, 样本限定为25~49岁, 小时工资大于零的已婚非农受雇劳动者(受访者及其配偶).剔除每年小时工资小于1%分位点和大于99%分位点的样本.对于所有已婚女性, 仅保留配偶年工资收入大于0的样本.工资以2012年价格为基准, 根据省份城镇居民消费者价格指数进行调整.性别工资差距=[exp(男性平均对数工资-女性平均对数工资)-1]*100. |
表4 就业概率的性别差异 |
2013年 | 2017年 | |
A部分: 基准回归 | ||
女性 | -0.163*** | -0.130*** |
(0.009) | (0.010) | |
B部分: 性别与教育程度虚拟变量交互 | ||
女性*小学及以下学历 | -0.307*** | -0.157*** |
(0.044) | (0.048) | |
女性*初中学历 | -0.231*** | -0.170*** |
(0.025) | (0.023) | |
女性*高中/中专/职高学历 | -0.209*** | -0.173*** |
(0.018) | (0.016) | |
女性*大专学历 | -0.139*** | -0.129*** |
(0.013) | (0.017) | |
女性*本科及以上学历 | -0.056*** | -0.067*** |
(0.010) | (0.013) | |
C部分: 性别与婚姻状况虚拟变量交互 | ||
女性*已婚 | -0.180*** | -0.142*** |
(0.009) | (0.010) | |
女性*未婚 | 0.020 | 0.004 |
(0.023) | (0.023) | |
D部分: 性别与子女状况虚拟变量交互 | ||
女性*家中无0~17岁儿童 | -0.127*** | -0.083*** |
(0.012) | (0.010) | |
女性*家中有0~6岁儿童 | -0.251*** | -0.228*** |
(0.018) | (0.014) | |
女性*家中仅有7~17岁儿童 | -0.151*** | -0.112*** |
(0.012) | (0.012) | |
E部分: 性别与老人同住状况虚拟变量交互 | ||
女性*家中有60岁以上老人 | -0.141*** | -0.112*** |
(0.020) | (0.023) | |
女性*家中无60岁以上老人 | -0.168*** | -0.133*** |
(0.010) | (0.010) | |
样本量 | 9883 | 9564 |
注: 样本限定为25~49岁的受访者及其配偶. ***、**、* 分别代表系数在1%、5%和10%的显著性水平下显著.标准误为省份聚类标准误.为节省篇幅, 未报告控制变量的回归系数. |
表5 已婚群体性别工资差异的均值分解 |
2013年 | 2017年 | 2013年 | 2017年 | ||
A部分: 未纠正样本选择偏误的分解结果 | |||||
总差异 | 0.121*** | 0.154*** | |||
可解释部分 | -0.022* | -0.020*** | |||
教育 | -0.007 | -0.013* | |||
工作经验 | -0.000 | 0.002 | |||
地区 | -0.014* | -0.009 | |||
不可解释部分 | 0.143*** | 0.175*** | |||
样本量 | 4098 | 4278 | |||
B部分: 纠正样本选择偏误的分解结果 | |||||
模型1 | 模型2 | ||||
调整后的总差异 | 0.054 | 0.227*** | 0.614*** | 0.379*** | |
可解释部分 | -0.022 | -0.020 | -0.022 | -0.020 | |
不可解释部分 | 0.076 | 0.247*** | 0.636*** | 0.399*** | |
样本量 | 4098 | 4278 | 4098 | 4278 | |
女性就业的Probit回归 | |||||
家中0~6岁儿童数量 | -0.368*** | -0.601*** | -0.353*** | -0.588*** | |
(0.088) | (0.074) | (0.089) | (0.074) | ||
家中7~17岁儿童数量 | 0.002 | -0.147** | 0.003 | -0.142** | |
(0.071) | (0.065) | (0.071) | (0.065) | ||
家中60岁以上老人数量 | 0.104 | -0.000 | 0.100 | -0.004 | |
(0.066) | (0.059) | (0.066) | (0.059) | ||
配偶年工资收入(万元) | -0.020*** | -0.010** | |||
(0.006) | (0.004) | ||||
样本量 | 2286 | 2343 | 2286 | 2343 | |
女性工资回归 | |||||
逆米尔斯比 | -0.164 | 0.195 | 1.219*** | 0.604*** | |
(0.229) | (0.128) | (0.335) | (0.134) | ||
样本量 | 1614 | 1744 | 1614 | 1744 |
注: 样本限定为25~49岁, 小时工资大于零的已婚非农受雇劳动者(受访者及其配偶). 剔除每年小时工资小于1%分位点和大于99%分位点的样本.对于所有已婚女性, 仅保留配偶年工资收入大于0的样本. ***、**、*分别代表系数在1%、5%和10%的显著性水平下显著.限于篇幅, 女性就业决策回归未报告教育水平、工作经验和省份固定效应的回归系数.女性工资回归仅报告逆米尔斯比的回归系数. |
表6 已婚群体性别工资差异的均值分解 |
2013年 | 2017年 | 2013年 | 2017年 | ||
A部分: 未纠正样本选择偏误的分解结果 | |||||
总差异 | 0.121*** | 0.154*** | |||
可解释部分 | 0.024* | 0.041*** | |||
教育 | -0.008 | -0.012* | |||
工作经验 | 0.002 | 0.002 | |||
所有制 | 0.014*** | 0.019*** | |||
行业 | 0.024*** | 0.020*** | |||
职业 | 0.005 | 0.020*** | |||
地区 | -0.013** | -0.008 | |||
不可解释部分 | 0.096*** | 0.114*** | |||
样本量 | 4098 | 4278 | |||
B部分: 纠正样本选择偏误的分解结果 | |||||
模型1 | 模型2 | ||||
调整后的总差异 | 0.091 | 0.226*** | 0.606*** | 0.365*** | |
可解释部分 | 0.024 | 0.041*** | 0.024 | 0.041*** | |
不可解释部分 | 0.067 | 0.185*** | 0.582*** | 0.324*** | |
样本量 | 4098 | 4278 | 4098 | 4278 | |
女性工资回归 | |||||
逆米尔斯比 | -0.073 | 0.191 | 1.200*** | 0.565*** | |
(0.223) | (0.123) | (0.331) | (0.128) | ||
样本量 | 1614 | 1744 | 1614 | 1744 |
注: 样本描述见 |
表7 已婚群体性别工资差异的均值分解: 家庭收入对女性就业选择的影响 |
2013年 | 2017年 | 2013年 | 2017年 | ||
A部分: 未纠正样本选择偏误的分解结果 | |||||
总差异 | 0.121*** | 0.154*** | |||
可解释部分 | 0.024* | 0.041*** | |||
不可解释部分 | 0.096*** | 0.114*** | |||
样本量 | 4098 | 4278 | |||
B部分: 纠正样本选择偏误的分解结果 | |||||
模型1 | 模型2 | ||||
调整后的总差异 | 0.091 | 0.226*** | 0.311*** | 0.422*** | |
可解释部分 | 0.024 | 0.041*** | 0.024 | 0.041*** | |
不可解释部分 | 0.067 | 0.185*** | 0.286*** | 0.381*** | |
样本量 | 4098 | 4278 | 4098 | 4278 | |
女性就业的Probit回归 | |||||
家中0~6岁儿童数量 | -0.368*** | -0.601*** | -0.374*** | -0.622*** | |
(0.088) | (0.074) | (0.088) | (0.074) | ||
家中7~17岁儿童数量 | 0.002 | -0.147** | -0.005 | -0.163** | |
(0.071) | (0.065) | (0.071) | (0.066) | ||
家中60岁以上老人数量 | 0.104 | -0.000 | 0.097 | -0.014 | |
(0.066) | (0.059) | (0.066) | (0.060) | ||
家庭人均年收入(万元) | -0.013** | -0.031*** | |||
(0.006) | (0.008) | ||||
样本量 | 2286 | 2343 | 2286 | 2343 | |
女性工资回归 | |||||
逆米尔斯比 | -0.073 | 0.191 | 0.467** | 0.723*** | |
(0.223) | (0.123) | (0.213) | (0.136) | ||
样本量 | 1614 | 1744 | 1614 | 1744 |
注: 样本描述见 |
表8 配偶收入水平与女性的就业率 |
低收入 | 中低收入 | 中等收入 | 中高收入 | 高收入 | |
2013年 | 57.10% | 69.90% | 72.20% | 76.10% | 78.80% |
2017年 | 63.60% | 74.60% | 74.80% | 80.80% | 78.40% |
注: 样本限定为25~49岁的已婚女性, 包括受雇劳动者和未就业者. 所有女性仅保留配偶年工资收入大于0的样本. |
表9 基于模型2的性别工资差距的估计偏误 |
调整后的差距 | 实际观测的差距 | 估计偏误(百分点) | 估计偏误(百分比) | |
(1) | (2) | (2)-(1) | (2)/(1)-1 | |
小时工资 | ||||
2013年 | 83.30% | 12.90% | -70.40% | -84.60% |
2017年 | 44.10% | 16.60% | -27.40% | -62.20% |
月工资 | ||||
2013年 | 86.30% | 20.40% | -65.80% | -76.30% |
2017年 | 52.30% | 24.90% | -27.50% | -52.50% |
年工资 | ||||
2013年 | 83.50% | 22.90% | -60.60% | -72.60% |
2017年 | 47.00% | 27.10% | -19.80% | -42.20% |
注: 性别工资差距=[exp(男性平均对数工资-女性平均对数工资)-1]*100.模型设定为在工资回归方程中控制个人特征和工作特征变量, 在女性就业选择方程中控制子女状况、与老人同住状况和配偶收入. |
表附表1 排他性约束条件检验结果 |
变量Z | 年份 | 标准化统计量 | p值 |
家中有0~6岁儿童=1 | 2013 | -2.722 | 1.000 |
2017 | -2.009 | 1.000 | |
家中有7~17岁儿童=1 | 2013 | 0.071 | 1.000 |
2017 | 0.130 | 1.000 | |
家中有60岁以上老人=1 | 2013 | 0.064 | 0.483 |
2017 | -2.149 | 0.998 | |
配偶年工资收入大于中位数=1 | 2013 | -0.980 | 1.000 |
2017 | -1.052 | 1.000 | |
人均家庭年收入大于中位数=1 | 2013 | -0.914 | 1.000 |
2017 | -0.984 | 0.961 |
杜凤莲, 张胤钰, 董晓媛, 儿童照料方式对中国城镇女性劳动参与率的影响[J]. 世界经济文汇, 2018, (3): 1- 19.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
何泱泱, 刘国恩, 徐程, 中国职业隔离与性别工资差异的变化趋势研究[J]. 经济科学, 2016, (4): 78- 89.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
李实, 宋锦, 刘小川, 中国城镇职工性别工资差距的演变[J]. 管理世界, 2014, (3): 53- 65.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
罗楚亮, 滕阳川, 李利英, 行业结构、性别歧视与性别工资差距[J]. 管理世界, 2019, (8): 58- 68.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
马双, 李雪莲, 蔡栋梁, 最低工资与已婚女性劳动参与[J]. 经济研究, 2017, 52 (6): 153- 168.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
沈可, 章元, 鄢萍, 中国女性劳动参与率下降的新解释: 家庭结构变迁的视角[J]. 人口研究, 2012, 36 (5): 15- 27.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
宋锦, 史泰丽, 古斯塔夫森, (2017). 中国城镇性别工资差距: 新趋势?[M]//李实, 岳希明, 史泰丽, 佐藤宏. 中国收入分配格局的最新变化. 北京: 中国财政经济出版社, 2017: 285-326.
Song J, Sicular T, Gustafsson B, (2017). China's Urban Gender Wage Gap: A New Direction?[M]//Li S, Yue X M, Sicular T, Sato H. Changing Trends in China's Inequality. Beijing: China Financial and Economic Publishing House, 2017: 285-326.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
姚先国, 谭岚, 家庭收入与中国城镇已婚妇女劳动参与决策分析[J]. 经济研究, 2005, (7): 18- 27.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
Heckman J J, (1977). Sample Selection Bias as a Specification Error (with an Application to the Estimation of Labor Supply Functions)[R]. NBER Working Paper.
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_citation.content}}
{{custom_citation.annotation}}
|
{{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
〈 |
|
〉 |