参考《管理世界》中姚加权(2024)的做法,团队根据上市年报文本内容,对73个人工智能的相关词频进行统计,并计算上市公司-人工智能水平,包括精确词汇、扩展词汇两种方式
在前文,马克团队利用上市公司年报文本全文数据,对“人工智能”73个相关词频进行了统计,衡量上市公司人工智能水平,本次团队继续更新数据至2023年
相关数据:人工智能企业数据库,上市公司年报原文数据,数字化转型词频数据,MD&A数字化词频数据
一、数据介绍数据名称:企业人工智能-年报73个词频、文本统计
数据范围:A股上市公司
数据年份:1999-2023年
样本数量:63052条,84个变量
年报来源:巨潮资讯网
数据整理:马克数据网
数据说明:内含人工智能73个词频、精确和扩展词汇两种方式
更新时间:2024年7月
二、整理说明➤从巨潮资讯网下载1999-2023年上市公司年报
➤将原始报告文本整理为面板数据
➤统计年报全文的文本长度
➤统计全文中,中英文部分的文本长度
➤构建人工智能术语词典,将词汇扩充到python的jieba库
➤去除停顿词,统计精确词汇、扩展词汇数目
➤计算两种方式下的人工智能水平
三、指标说明股票代码 | 股票简称 | 年份 |
行业名称 | 行业代码 | 人工智能水平_精确词汇 |
人工智能水平_扩展词汇 | 人工智能词频和_精确词汇 | 人工智能词频和_扩展词汇 |
人工智能 | 计算机视觉 | 图像识别 |
知识图谱 | 智能教育 | 增强现实 |
智能政务 | 特征提取 | 商业智能 |
智能养老 | 支持向量机(SVM) | 知识表示 |
模式识别 | 物联网 | 人机对话 |
AI产品 | 人机交互 | 数据挖掘 |
智慧银行 | 智能客服 | 虚拟现实 |
自动驾驶 | 无人驾驶 | 智慧金融 |
大数据营销 | 长短期记忆(LSTM) | 智能芯片 |
边缘计算 | 云计算 | 深度神经网络 |
AI芯片 | 深度学习 | 特征识别 |
智能保险 | 智能零售 | 智能医疗 |
智能运输 | 智能家居 | 循环神经网络 |
大数据风控 | 机器人流程自动化 | 可穿戴产品 |
大数据平台 | 增强智能 | 大数据运营 |
机器翻译 | 神经网络 | 语音合成 |
人机协同 | 智能农业 | 智能音箱 |
卷积神经网络 | 问答系统 | 强化学习 |
大数据分析 | 自然语言处理 | 大数据管理 |
智能计算 | 语音交互 | 机器学习 |
生物识别 | 语音识别 | 智能监管 |
智能投顾 | 智能语音 | 声纹识别 |
人脸识别 | 智能体 | 大数据处理 |
分布式计算 | 智能传感器 | 智能搜索 |
智能环保 |
企业数目
数据概览-excel明细
数据概览-stata统计
五、获取数据注:该数据为马克社区高级会员-附赠数据