数据是数字经济时代的基础性资源,也是企业实现高质量发展的关键生产要素。中国信通院发布的《国家数据资源调查报告(2021)》显示,2021年我国数据产量达到6.6ZB,占全球数据总产量的10%,位列全球第二随着大数据的普及和信息化水平的提高,数据资产已经成为企业在现代商业环境中的重要竞争资源,数据资产的管理和披露水平对企业的透明度和竞争力具有重要意义
本次分享的数据是上市公司-数据资产信息披露水平,数据年份为2000-2023年,根据上市公司年报词频统计而来,包含每个关键词的词频明细
一、数据介绍数据名称:上市公司-数据资产信息披露水平
数据年份:2000-2023年
数据范围:上市公司,6w+样本
数据格式:面板数据
数据来源:马克社区用户
二、数据指标股票代码 | 公司简称 | 年份 |
全文总词数 | 关键词词频数 | 数据资产信息披露水平 |
数据资产 | 信息资源 | 数据挖掘 |
数据源 | 大数据 | 数据共享 |
海量数据 | 数据平台 | 数据分析系统 |
数据资源 | 知识库 |
参考牛彪和于翔等(2024)的做法,采用“种子词+Word2Vec相似词扩充”的文本分析方法来测算企业的数据资产信息披露水平。具体步骤如下:
首先,根据《中国信通院2019年发布的《数据资产管理实践白皮书(4.0版)》,“数据资产”被定义为能够为企业创造经济利益的数据资源。基于此,将“数据资产”和“数据资源”作为种子词汇,生成相关的相似词词集
其次,通过深度学习技术和Word2Vec神经网络模型,生成与种子词汇语义相近的相似词集,并仅保留相似度最高的前10个词汇
最后,统计词汇在年报中的频次,并结合以下公式计算企业的数据资产信息披露水平
牛彪,于翔,苑泽明,等.数据资产信息披露与审计师定价策略[J].当代财经, 2024(2):154-164.
五、数据概览上市公司数据资产信息披露水平数据概览