






数字经济政策-地级市、省级、中央(1954-2024年)
本次数据为地级市、省级、中央三级数字经济60个词频、扩展词频,三类数据更新至2024年
参考金灿阳(2022)和陶长琪(2022),根据各省、市政府工作报告,统计了省级、地级市60个数字经济相关词频,以衡量“数字经济”的政府政策支持力度,分别统计数字经济政策词频A、数字经济政策词频B
一、数据介绍
数据名称:数字经济政策-60个相关词频
数据范围:地级市、省级、中央
样本数量:6494条
数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)
数据来源:地方政府网站
数据说明:内含数字经济相关的60个词频明细、扩展词频
更新时间:2024年4月
二、整理说明
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
(精确:\'推荐\', \'mk\', \'数据网\')
(全:\'推荐\', \'mk\', \'克数\', \'数据\', \'数据网\')
➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频
➤利用正则表达式统计60个扩展词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、60个词频明细、文本长度
本次数据为地级市、省级、中央三级数字经济60个词频、扩展词频,三类数据更新至2024年
参考金灿阳(2022)和陶长琪(2022),根据各省、市政府工作报告,统计了省级、地级市60个数字经济相关词频,以衡量“数字经济”的政府政策支持力度,分别统计数字经济政策词频A、数字经济政策词频B
一、数据介绍
数据名称:数字经济政策-60个相关词频
数据范围:地级市、省级、中央
样本数量:6494条
数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)
数据来源:地方政府网站
数据说明:内含数字经济相关的60个词频明细、扩展词频
更新时间:2024年4月
二、整理说明
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
(精确:\'推荐\', \'mk\', \'数据网\')
(全:\'推荐\', \'mk\', \'克数\', \'数据\', \'数据网\')
➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频
➤利用正则表达式统计60个扩展词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、60个词频明细、文本长度


