3.2版更新说明:
1.上版本基础上,进一步更新指标至2020年
2.减小剔除阈值,保留更多区县
3.0版更新说明:
1.数据更新至2020年
2.剔除缺失较多的区县,转为平衡面板
3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据
一、数据介绍数据名称:中国县域数据库
数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》
数据范围:2000-2020年,包括2703个区县
样本数量:平衡面板56763条(2703*21=56763)
数据整理:马克数据网,各指标存在不同程度的缺失
更新时间:2022年12月,当前最新3.2版
二、整理方法第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,人工验证。得到指标的面板数据,并人工抽样验证
第六,平衡面板。将非平衡面板转为平衡面板数据
第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版
三、数据指标共计83个指标,部分如下:
年份 | 宽带接入用户数 | 农林牧渔业总产值 |
行政区划代码 | 地区生产总值 | 规模以上工业企业数 |
地区名称 | 第一产业增加值 | 规模以上工业总产值 |
经度 | 第二产业增加值 | 城镇固定资产投资完成额 |
纬度 | 工业增加值 | 全社会固定资产投资 |
所属城市 | 第三产业增加值 | 社会消费品零售总额 |
所属省份 | 农业增加值 | 房地产开发投资 |
长江经济带 | 牧业增加值 | 普通小学学校数 |
行政区域土地面积 | 人均地区生产总值 | 普通中学学校数 |
乡及镇个数 | 城镇单位在岗职工平均工资 | 普通小学专任教师数 |
乡个数 | 城镇居民人均可支配收入 | 普通中学专任教师数 |
镇个数 | 农村居民人均可支配收入 | 普通小学在校生数 |
街道办事处个数 | 地方财政一般预算收入 | 普通中学在校学生数 |
村民委员会个数 | 各项税收 | 中等职业教育学校在校学生数 |
年末总户数 | 地方财政一般预算支出 | 医院、卫生院床位数 |
乡村户数 | 城乡居民储蓄存款余额 | 医院和卫生院卫生人员数_卫生技术人员 |
年末总人口 | 年末金融机构各项贷款余额 | 医院和卫生院卫生人员数_执业医师 |
乡村人口 | 出口额 | 各种社会福利收养性单位数 |
户籍人口数 | 实际利用外资金额 | 各种社会福利收养性单位床位数 |
年末单位从业人员 | 农作物总播种面积 | 全社会用电量 |
城镇单位在岗职工人数 | 常用耕地面积 | 城乡居民生活用电量 |
乡村从业人员数 | 机收面积 | 废气中氮氧化物排放量 |
农林牧渔业从业人员数 | 设施农业占地面积 | 废气中烟尘排放量 |
年末第二产业单位从业人员 | 农用机械总动力 | 工业废气中二氧化硫排放量 |
年末第三产业单位从业人员 | 粮食总产量 | 艺术表演场馆数_剧场、影剧院 |
农业机械总动力 | 棉花产量 | 公共图书馆总藏量 |
固定电话用户 | 油料产量 | 体育场馆机构数 |
移动电话用户数 | 肉类总产量 |
赠送原始年鉴:
http://www.macrodatas.cn/article/1147466866
注:整理数据为社区中级会员-附赠数据