目录
01 中国城市数据库
02 上市公司招聘大数据
03 中国县域数据库
04 人工智能企业数据库
05 中国省级数据库
06 亿量级|人口迁徙数据
07 企业人工智能-年报词频统计
08 中国手机基站数据库
09 城市各行业-新注册企业数据
10 上市公司专利引用数据明细
数据名称:
根据《中国城市统计年鉴》整理城市面板数据,数据范围为地级市,覆盖189个指标,包含原始版本、线性插值、回归填补三个版本
数据名称:
参考《经济研究》中孙鲲鹏(2021)、《管理世界》刘毓芸(2024)等人的做法,马克团队从各大网络招聘平台爬取了企业的网络招聘数据,并根据上市公司及集团公司的名单,整理上市公司的招聘大数据2014-2023年。总计693万余条,是非常有价值的研究资料
数据名称:
根据《中国县域统计年鉴》整理县域面板数据,覆盖2700+区县,包括80个指标,包含原始版本、线性插值、回归填补三个版本
数据名称:
参考《中国工业经济》中王林辉(2022)的做法,整理人工智能企业数据库,包括企业名称、行业、员工、经营范围等数据。当企业经营范围涉及芯片、图像识别、计算机视觉、语音识别、传感器等与人工智能相关的关键词时,将该企业识别为人工智能企业
数据名称:
将国家统计局省级板块整理为面板数据,28个类别共计3000+指标,更新至2023年,包含长面板、宽面版、线性插值、回归填补四个版本
数据名称:
根据高德地图整理人口迁徙数据,包括367个城市两两之间的人口迁徙意愿指数、 实际迁徙指数,总量过亿,对于研究人口迁徙有一定的参考价值
数据名称:
参考《管理世界》中姚加权(2024)的做法,团队根据上市年报文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式
数据名称:
参考《数量经济技术经济研究》中钞小静(2024)、陈强(2024)等人的做法,马克团队从OpenCelliD(世界上最大的开放式手机基站数据库)中爬取全球5000万余条基站信息 筛选得到中国的基站信息,获取中国2G、3G、4G、5G基站的原始数据。覆盖年份为2006-2024年,总计183万余条,是具有价值的研究资料
数据名称:
从中国工商企业注册数据库获取企业注册登记数据,注册总量2.8亿+,并根据注册地址整理,获得了各城市各行业的新注册企业数据 目前该数据覆盖年份为2000-2023年,包括368城市、20个行业的数据
数据名称:
根据谷歌专利,整理了上市公司专利被引用的数据。截至2023年底,整理上市企业被引用专利明细数据1300万+。整理的专利引用数据包括专利公开号、专利领域、IPC分类号、专利类型等21个变量