1978
行业技能互补性
数据简介
吉萍等(2025)指出,行业技能互补性指的是在生产环节中,某一行业里不同技能类型的劳动者之间相互配合、协同工作的程度。在那些技能互补性较强的行业中,拥有不同技能的工人彼此协作,这一点对生产效率起着至关重要的作用。拿高科技制造业来说,在其生产流程中,工程师、技术工人、设计师等具备各类技能的劳动者共同参与其中,并非由单一技能的劳动者主导整个过程。一个行业的技能互补性越高,就意味着它对多样化技能的依赖程度越深,而不同技能之间的搭配组合,能够带来更显著的产出效益。
因此,我们参考吉萍等(2025)方法,用来测算中国的行业技能互补性。该方法是以行业内职业结构为权重对职业技能互补性进行加权,得到行业技能互补性程度。由于中国缺乏细分职业技能和行业内职业结构的数据,作者建议采用美国数据进行测算。
-O*NET职业信息研究数据库,该数据以问卷调查方式用一系列标准化、可测量的变量集刻画了不同职业的特征。我们采用CNPD团队所整理的O*NET数据进行测算,该整理版本所涵盖信息量最全,不论是跨年度还是特征数据,并且结构清晰,分类明确,适用于未来相关指标研究拓展。
-美国劳动统计局(Bureau of Labor Statistics,BLS)提供的NAICS行业内各职业就业人数数据,我们在此采用2024年5月份版本,与此同时O*NET数据也是2024年5月份版本,为达到绝对时间配对;并作出一系列处理。
关于用美国数据构建的指标来反映中国的情况,张国峰等(2016)在对于行业沟通密集度指标的测算中,指出不同职业对沟通的需求强度是其自身固有的属性,这种属性在不同国家之间的差异并不大。其次,每个行业都有其独特的就业结构特点,行业内部各职业的就业人数通常存在较为合理的搭配比例,因此同一行业在不同国家的就业结构不会有显著差别。此外,通过 “就业比重排序” 重新构建的沟通密集度指标可以看出,因各国产业结构不同而产生的就业结构差异,对行业沟通需求强度的影响并不明显。综上所述,利用美国职业数据构建的沟通密集度指标,能够相对科学地反映中国各行业的沟通强度。同时强调,只要不同职业的就业比重在该行业内的排序不发生变化,即不存在“要素密集度逆转”( factor intensity reversal) ,该指标就适用于所有国家。
同时,Bombardini et al.(2012)也基于应用了美国相关数据构建了技能替代性、技能扩散度、技能互补性等指标,用来映射19个国家的情况。
上述两篇文献所构建的相关行业特征指标均采用O*NET数据库中的情境表(Context),里面所统计的各项与职业相关指数结果都是这些职业自身固有的属性,在不同国家之间差异并不大,因此是有测算中国的行业技能互补性的合理性。
接下来是我们所采取的制作步骤:
1.吉萍等(2025)将O*NET数据中的人际关系→角色关系→工作互动→团队合作项下“与团队或团队中的其他人一起工作有多重要”的调查结果作为测度所需基础变量。因此,对应该路径,我们在O*NET数据中的情境表里,提取出各职业的工作情景要素为“与工作小组或团队合作或为其作出贡献”的样本(在该岗位中,与工作小组或团队合作或做出贡献有多重要?),并从中筛选出维度名称为“情境”的观测值,结合所对应的评分数值(0-100),这指代该职业在这个情境要素下的通用评分,即该情境要素对于该职业的整体重要性。
2.基于BLS提供的NAICS行业内各类职业的就业人数,测度行业内职业结构。
根据对该数据的观察,我们做出如下处理,以获得全美各NAICS四位数编码级别行业下每个职业的就业人数:
(1)先过滤出 AREA_TYPE 为‘1’的观测值,该指代全美统计
(2)接着过滤出 I_GROUP 为‘4-digit’的观测值,主要是因为该NAICS层级里的职业种类统计样本量最多,结构会很清晰详细
(3)然后过滤出 O_GROUP 为‘detailed’的观测值,因其对应的 OCC_CODE 是六位数编码层级,可对应ONET中 SOC职业代码 中的六位数编码层级
注:由于BLS数据的限制,匹配时只基于前六位的职业类别,剔除后两位不为0的
编码的职业样本,这样不会造成匹配混乱。
然后过滤出 O_GROUP 为‘detailed’的观测值,因其对应的 OCC_CODE 是六位数编码层级,可对应ONET中 SOC职业代码 中的六位数编码层级
注:由于BLS数据的限制,匹配时只基于前六位的职业类别,剔除后两位不为0的编码的职业样本,这样不会造成匹配混乱。
注:OCC_CODE中是包含SOC职业代码的
(4)最终提取出 NAICS、NAICS_TITLE、OCC_CODE、OCC_TITLE、TOT_EMP
接着将整理后的BLS数据与所过滤筛选后的O*NET数据进行匹配,获得全美各NAICS四位数编码级别行业下每个O*NET职业对应的就业人数,以及对应的工作情景要素(与工作小组或团队合作或为其作出贡献)的分数,个别没对应上的职业的。
通过行业内不同职业在就业中所占比重作为权重,测度行业内职业结构,并通过加权平均测算NAICS行业的技能互补性程度。
3.通过NAICS-ISIC-CIC对照表,得到CIC行业技能互补性程度,即基于中国行业的行业技能互补性程度。
先介绍下NAICS是北美产业分类体系,我们用的是2022版(最新);ISIC是联合国经济和社会事务部下属统计司制定的《所有经济活动的国际标准行业分类》(International Standard Industrial Classification of All Economic Activities),我们用的是Revision 4(最新版);对于CIC中国工业分类标准,我们采用《国民经济行业分类》(GBT 4754-2017)(按第1号修改单修订)。
上述分类指南皆为pdf格式,我们提取并转换为excel表格,并遵循各分类标准层级进行结构化处理,同时利用所转化为数据表后的NAICS-ISIC对照表,和GB/T-ISIC对照表,将所有分类标准匹配在一起。
需要注意的是,由于各分类体系下层级细分不一致,会导致最终匹配出现许多重复情况,进而会使得最终匹配结果中许多GB/T小类行业所对应的行业技能互补性会出现重复值,如下所示各分类对照:
最终我们得到了中国国民经济行业分类-行业技能互补性:
需要强调的是,测度数据中出现空值,是因为原对应的BLS统计下的NAICS各级行业数据中,均未统计相关分类下的职业从业人数,这些是正常的。
数据来源
O*NET职业信息研究数据库(CNPD团队整理版本),美国劳动统计局(Bureau of Labor Statistics,BLS),《国民经济行业分类》(GBT 4754-2017)(按第1号修改单修订),联合国《所有经济活动的国际标准行业分类》,“North American Industry Classification System”=
时间跨度
——
数据范围
国民经济行业分类
数据格式
数据格式为Excel形式
数据指标
GB/T 门类代码 |
GB/T 门类 |
GB/T 大类代码 |
GB/T 大类 |
GB/T 中类代码 |
GB/T 中类 |
GB/T 小类代码 |
GB/T 小类 |
行业技能互补性 |
数据展示
(分类数据在“过程附录”中)
参考文献
[1] 吉萍, 蒋为, 阎丽. 劳动力通勤成本、技能互补性与城市出口比较优势[J]. 世界经济, 2025, 48(5): 3-31
[2] 蒋为, 周荃, 向姝婷, 李锡涛. 方言多样性、团队合作与中国企业出口[J]. 世界经济, 2021, 44(4): 103-127
[3] 张国峰, 王永进, 李坤望. 产业集聚与企业出口: 基于社交与沟通外溢效应的考察[J]. 世界经济, 2016, 39(2): 48-74
[4] Bombardini, M.; Gallipoli, G. and Pupato, G. “Skill Dispersion and Trade Flows.” The American Economic Review, 2012, 102 (5), pp. 2327‒2348.