5.0版更新说明:
1.数据更新至2022年
2.剔除较少区县
4.0版更新说明:
1.数据更新至2021年
2.修复少部分地区代码错误
3.0版更新说明:
1.数据更新至2020年
2.剔除缺失较多的区县,转为平衡面板
3.填补升级。内含原始版本、线性插值、ARIMA填补三个版本数据
注:上图显示为2020年,实际更新至2022年
一、数据介绍数据名称:中国县域数据库
数据范围:2725个区县
数据年份:2000-2022年
样本数量:2725县*23年=62675条
数据来源:《中国区域经济统计年鉴》、《中国县域统计年鉴》
数据整理:马克数据网,各指标存在不同程度缺失
更新时间:2024年6月,当前最新5.0版
二、整理方法第一,识别年鉴。利用NLP算法识别《中国区域经济统计年鉴》、《中国县域统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善县域数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,人工验证。得到指标的面板数据,并人工抽样验证
第六,平衡面板。将非平衡面板转为平衡面板数据
第七,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第八,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版
三、数据指标共计83个指标,部分如下:
行政区划代码 | 年份 | 地区名称 |
经度 | 纬度 | 所属省份 |
所属城市 | 长江经济带 | 行政区域土地面积 |
乡及镇个数 | 乡个数 | 镇个数 |
街道办事处个数 | 村民委员会个数 | 年末总户数 |
乡村户数 | 年末总人口 | 乡村人口 |
户籍人口数 | 年末单位从业人员 | 城镇单位在岗职工人数 |
乡村从业人员数 | 农林牧渔业从业人员数 | 年末第二产业单位从业人员 |
年末第三产业单位从业人员 | 农业机械总动力 | 固定电话用户 |
移动电话用户数 | 宽带接入用户数 | 地区生产总值 |
第一产业增加值 | 第二产业增加值 | 工业增加值 |
第三产业增加值 | 农业增加值 | 牧业增加值 |
人均地区生产总值 | 城镇单位在岗职工平均工资 | 城镇居民人均可支配收入 |
农村居民人均可支配收入 | 地方财政一般预算收入 | 各项税收 |
地方财政一般预算支出 | 城乡居民储蓄存款余额 | 年末金融机构各项贷款余额 |
出口额 | 实际利用外资金额 | 农作物总播种面积 |
常用耕地面积 | 机收面积 | 设施农业占地面积 |
农用机械总动力 | 粮食总产量 | 棉花产量 |
油料产量 | 肉类总产量 | 农林牧渔业总产值 |
规模以上工业企业数 | 规模以上工业总产值 | 城镇固定资产投资完成额 |
全社会固定资产投资 | 社会消费品零售总额 | 房地产开发投资 |
普通小学学校数 | 普通中学学校数 | 普通小学专任教师数 |
普通中学专任教师数 | 普通小学在校生数 | 普通中学在校学生数 |
中等职业教育学校在校学生数 | 医院、卫生院床位数 | 医院和卫生院卫生人员数_卫生技术人员 |
医院和卫生院卫生人员数_执业医师 | 各种社会福利收养性单位数 | 各种社会福利收养性单位床位数 |
全社会用电量 | 城乡居民生活用电量 | 废气中氮氧化物排放量 |
废气中烟尘排放量 | 工业废气中二氧化硫排放量 | 艺术表演场馆数_剧场、影剧院 |
公共图书馆总藏量 | 体育场馆机构数 |
2000-2023年原始年鉴:www.macrodatas.cn/article/1147471783
注:整理数据为社区中级会员-附赠数据(点击底部领取)