1440
新质生产力政府关注度——基于各省政府工作报告(2001-2024年)
“新质生产力”发文趋势与主题分布
数据来源
基于各省政府工作报告,由皮皮侠团队整理。
时间跨度
2001-2024年
数据范围
各省、市、自治区
数据指标
本数据集展示了2001-2024年各省政府工作报告中的新质生产力词频统计数据。
注:本数据收集的具体过程如下
第一,定义种子词汇。基于国家发展和改革委员会网站公布的资料,确定了包括“新质生产力”、“数字经济”等在内的16个种子词汇。这些词汇涵盖了新质生产力的核心特征,如数字化、智能化、高效能等。
(https://www.ndrc.gov.cn/wsdwhfz/202402/t20240206_1363980.html)
第二,根据确定的16个种子词汇,借助Word2Vec神经网络模型,运用深度学习的技术手段,从2023年9月至2024年4月间国家发展和改革委员会网站发布的有关“新质生产力”新闻文章中提取与种子词汇语义相近的词汇。为确保测量的精确性,本研究仅保留了那些与种子词汇相似度超过0.85的词汇,同时排除了与主题无关的词汇,如人名。
第三,挖掘各省政府年度报告中种子词汇与相似词词汇在其中出现的频数,为了便于比较,将词频加一后取自然对数。最终,识别出61个与新质生产力相关的高频词汇,包括但不限于“量子”、“数据”“高效能”、“科技创新”、“低损耗”等。词库包含的61个词汇详见数据皮皮侠。
16个种子词展示如下:
新质生产力 |
数字经济 |
数字化 |
智能化 |
网络化 |
先进生产力 |
信息技术 |
高科技 |
高效能 |
高质量 |
生物技术 |
能源技术 |
材料科学 |
数据 |
科技创新 |
高新技术 |