数据要素变现分为数据资源化、产品化、资产化三个环节。
1.数据要素变现三部曲:资源化-产品化-资产化
在法规制度和技术手段未成熟前,大量的数据因缺乏适当的流通渠道而成为“被掩 盖的黄金”。伴随市场制度和技术保障的逐步成熟,数据要素变现成为优先显现的 收益,但我们认为变现并不是唯一目的,但由此引发的推动数据治理、规范和管控, 并最终在整个经济和生活领域全面提升数据“价值”的兑现,提高全社会运行效率 和生活福祉,才应是最终目的。 数据要素变现分为数据资源化、产品化、资产化三个环节。这三个环节实现了从原 始数据到数据资产的跨越,层层递进,逐步增加数据的可用性和流通性,最终投入 到丰富的数据资产应用当中,创造新的价值。
数据资源化是指将原始数据加工处理成要素性数据资源的过程。数据资源化需要在 数据战略的指导下,构建其数据能力体系和建立企业数据治理体系,从而在企业及 机构内部形成与数据驱动型业务模式相适配的人才、技术、组织安排和系统等。资 源化阶段,企业通过数据仓库和数据集市、数据治理两大体系的建设,实现整个企 业的数据资源的整合与标准化,消除数据孤岛,支持各个业务部门以及监管部门的 工作。

数据产品化是将数据资源转变为数据产品的过程。数据资源之所以成为生产要素, 是因为数据资源不仅能被生产数据的企业自己所用,更需要通过流通渠道被外部企 业所用。产品化过程需要企业进行大量的分析工作,包括建立数据资源可能的应用 价值图谱、分析目标客户的数据需求及应用场景、选择合适的测试客户、共同组织 数据产品及其技术开发。基于大数据加工的各种方式,数据产品能够为客户量身定 制所需的数据产品,并提供全生命周期的服务,提高数据产品获客精准度的同时, 也一定程度上进行了数据风险的控制。
数据资产化是数据产品形成价值和价值兑现的重要参考依据。在数据资产价值变现 的过程中,企业需要建立明确的数据资产化战略、构建数据资产管理体系、谋求数 据资产经营战略和组织落实、执行数据资产的经营管理。资产化阶段组织的管理目 标由单一的内部应用发展为内外部应用并举,组织在对数据资产的管理中不止考虑 数据质量、安全和有效利用,更关注数据经济效益、应用价值,以及促进业务发展的 能力。最终,企业将价值提炼的结果进行量化与评价,将数据计入“第四张表”。
数据要素市场迎来高增长,相关产业环节初具规模。据国家工信安全中心估计,2021 年我国数据要素市场规模在815亿元,预计“十四五”期间市场规模复合增速将超过 25%,整体将进入群体性突破的快速发展阶段。2023年预计将增长至1144亿元。 从数据要素市场的不同环节来看,2021年数据分析、数据加工、数据存储价值占比 较高,分别有175亿元、160亿元、180亿元,占比分别为21%、20%、22%。
2.数据要素产业链梳理
生产环节
各行业都在产出数据要素,但是行业不同,数据要素生产的发展状况不同。 政务数据要素发展相对成熟。根据国家工业信息安全发展研究中心披露信息,目前 国内31个省政务云基础设施建设基本完成,超过70%的地级市已经建成或正在建设 政务云,北京、山东、重庆等多省市政务系统上云率超过90%。截至2021年5月,国 家数据共享交换平台上线目录超过65万条,发布共享接口1200余个,累计提供数据 查询核验服务超过37亿次。 互联网、金融、医疗、科学等行业有序推进,且逐渐呈现一定的差异化。而工业数 据要素生产发展较慢,主要源自于工具和方法论的缺失,以及数据安全的考量。
数据生产环节包括数据的采集、存储、加工和分析,经过这些环节,数据可以产生 有价值的信息,成为可以利用的资源。
(一)数据采集
数据采集是数据要素市场的基础。企业在经营过程中,需要针对不同的数据类型进 行采集,并进行分析处理训练。企业数据采集主要包括内部数据采集、外部数据采 集和定制化数据采集等三种类型。
数据采集行业主体主要包括采集设备提供商、采集解决方案提供商两类。 (1) 数据采集设备提供商为数据采集提供传感器、采集器等专用采集设备和智能 设备。如工业数据采集通过智能装备本身或加装传感器方采集生产现场数据,包 括设备数据、产品数据、过程数据、环境数据、作业数据等,采集的数据用于工 业现场生产过程的可视化和持续优化,实现智能化的决策与控制。 (2) 数据采集解决方案提供商通过人工采集服务、系统日志采集系统、网络数据采 集系统等方式为客户提供解决方案。其中人工采集对象主要包括语音数据、图像 数据、视频数据等;系统日志是记录系统中硬件、软件和系统问题的信息,同时 还可以监视系统中发生的事件,用户通过分析系统日志来检查错误发生的原因或 者寻找设备受到攻击时攻击者所留下的痕迹;网络数据采集包括通过网络爬虫等 方式获取数据,对象主要是各类网站,相应的一些API、用户接口和一些流型数 据。 数据采集的行业集中度高,机构数据价值量大。根据《国家数据资源调查报告(2021)》 披露信息,2021年我国数据产量高达6.6 ZB,同比增加29.4%,占全球数据总产量 的9.9%,其中全国各类行业机构共产生数据5.2 ZB。 从行业分布上看,数据产量排名前五位的行业分别为政府、互联网、媒体、公众服务 及专业服务、交通,上述五个行业数据产量占全国行业机构数据总产量的65%左右。
(二)数据存储
企业在完成数据采集环节后,需对有价值的数据进行有效存储,以便进一步对数据 进行加工和处理。在进行数据存储过程中,企业主要会从数据敏感度、数据时效性、 企业硬件水平等维度考虑,选择不同的数据存储服务。
(1) 公有云数据存储:现阶段公有云是我国数据存储最大的平台。截至2019年底, 我国在数用数据中心机架总规模达到314.5万架,同比增长39%。从技术角度看, 我国的数据存储和处理市场成熟度相对较高,已经成长出Oceanbase等分布式数 据库,数据存储能力有了大规模上升。同时,公有云提供商已经从早期的阿里云、 腾讯云等几家互联网公司,发展成为超过60家企业的供应商群体。 虽然我国公有云规模有了较大上升,但公有云建设仍存在一定的盲目性,现阶段 我国数据中心平均上架率仅为53.2%,使用情况较差。
(2) 私有云数据存储:对数据安全性要求较高的企业可构建属于该企业的数据中 心并设立防火墙,将数据存储在私有云。同时,对于某些时序性要求较高的数据, 云端访问在流量峰值期间容易出现性能问题(如网络拥堵),在局域网访问数据 的本地化部署可以有效避免外部流量峰值的冲击。 由于企业私有云搭建和维护成本较高,且部署在私有云上的数据较难通过远程访 问,因此私有云的广泛部署仍存在限制。未来,我国数据要素市场私有云存储仍 主要集中在政府部门、大型企业及高新科技企业等主体。
(3) 混合云数据存储:混合云是公有云和私有云两种数据存储方式的结合。企业可 按数据类别选择存储方式,将自己核心业务及重要数据资源存放在私有云上,而 将次要及需要外部访问的数据存放在公有云上,提高数据资源的整体安全性能; 另外,企业也可以依时序需求选择存储方式,当数据存储需求量较大时可由私有 云切换为公有云存储方式。混合云数据存储方式兼具公有云和私有云的优势,提 高了数据存储的安全性和灵活性,降低了存储成本。

(三)数据加工与分析
数据加工是指对企业采集和存储的数据进行筛选和处理,提高数据可用性,为数据 资源的挖掘和分析奠定基础,主要包括数据清洗、数据标注、数据审核以及数据融 合处理等方式。
数据加工市场集中度较低。根据拓尔思TRS数星产业大脑披露数据,数据加工行业 集中度不足10%,市场竞争激烈,市场参与厂商众多,数据加工产业下仅7,000余家 企业,且企业整体规模较小。 产业下游客户需求偏个性化,难度较高,数据服务商需投入大量人力资本、技术研 究,中小型厂商竞争力明显不足,未来行业并购将可能成为趋势。
数据分析主要是指最大化地开发数据的功能,发挥数据的作用。从数据来源来看, 分为内部数据分析和外部数据分析。 数据分析市场规模位居我国数据要素市场前列,市场空间有望进一步扩大。根据国 家工业信息安全发展研究中心测算数据,2022年我国数据分析市场规模有望达到 175亿元,仅次于数据存储市场规模;
流通环节
数据要素流通市场建设包括数据要素流通政策与法律法规、数据要素流通制度、数 据要素流通模式、数据要素流通技术、数据要素流通标准五个方面。制度包括权属 制度、评估制度、流通制度、监管制度;流通模式包括登记模式、定价模式、交易共 享模式、服务运营模式;技术包括登记技术、元件技术、空间技术、隐私技术。 其中,政策和法规是保障,流通制度是主要途径和载体,流通标准是衔接制度和技 术重要治理工具。整体来看,数据要素流通的市场模式是融合政策、法律法规、制 度、技术和标准,实现数据要素市场化配置的关键环节。
(一)确权与登记
登记是指登记机构为了特定的目的,根据某种具有法定意义的登记依据,将某些特 定的对象记录在某种载体上的行为和过程。从行为、过程和结果来讲,登记的要素 主要包括登记目的、登记依据、登记机构、登记者、登记对象、登记载体、登记审查、 登记效力等八个核心要素。 一个有效的登记需要遵守“七统一”的原则,即统一登记依据、统一登记机构、统一 登记载体(平台系统)、统一登记程序、统一审查规则、统一登记证书、统一登记效 力的原则。 登记具有多种目的和功能,如:事实确认、权属界定、监督管理、政策依据、公开公 示、统计汇总等。
我国数据资产登记政策历史悠久。最早可以追溯到上个世纪九十年代开始的国民经 济信息化建设,发展历程具体可以概括为国民经济信息化起步阶段、信息资源目录 体系建设阶段、数据资源汇聚阶段以及数据资产登记探索阶段。 第一阶段从1993年的“三金工程”开始,经历了“政府上网工程”、“三网一库” 等重点项目的建设;第二阶段从2002年开始,这一阶段出台了众多的电子政务建设 政策,政务公开制度初步建立,开始设计信息资源目录体系建设;第三阶段从2007 年开始,形成了政务信息资源目录体系和交换体系国家标准、政务信息资源编目制 度和企业信息登记制度;第四阶段从2017年开始至今,这一阶段从政务数据和公共 数据起步,开始登记数据资产,从社会数据采购,并探索社会数据资产登记制度。
我国数据资产登记制度和标准经历了多次迭代。从1989年的国家标准GBT12054- 1989《数据处理 转义序列的登记规程》到2021年的国家标准GB/T 40685-2021《信 息技术服务数据资产管理要求》,适应时代发展,不断助力数据资产的登记和流通。
各地对数据资产的登记展开探索。登记凭证一般以证书的形式呈现,内容包括但不 限于:证书名称、统一证书编号、申请人信息、登记数据资产信息(名称/类型/应用 范围/更新情况)、申请人对数据资产的权属关系(所有/管理/使用)、数据取得方式、 证书发放日期、发放机关。
数据要素登记的目的是为了数据要素“实物”的确权,证明登记者拥有该数据要素。 由于数据要素登记涉及的面广,权威性要求高,因此登记机构应该是能代表国家的、 具有权威性的登记机构,是基于全国集中统一的登记系统和登记制度来完成。机构 依据法定的程序对登记申请进行受理、审核。在规范性审核通过以后,登记机构经过一个法定程序完成赋予确权的功能并核准,最后签发数据要素登记证书,并公开 证书,以确保登记的真实性和合法性。对规范性审核、或确权审核未通过者,登记机 构不予登记和确权。 产品登记以后即市场挂牌,进入交易环节。随着市场交易活动的开展,数据产品登 记机构将数据产品的历次交易记录记载于登记系统中,以确保数据产品登记的真实 性和合法性,从而为该数据产品及其市场价值评估提供有效凭证。 从产业实践来看,数据要素登记体系的建设亦存在一系列挑战:(1)数据产权制度 尚属“空白地带”:为确保数据登记的法定效力,推动各类市场主体积极参与数据要 素登记和交易活动,制定数据要素产权相关法律法规是关键的制度前提;(2)尚需 完善数据要素登记体系:包括研究组建全国一体化的数据登记机构、筹建立完善相 关配套政策等;(3)需要建设统一的数据要素登记平台。
(二)数据要素定价方式
依照传统估值途径,数据要素的定价途径可以分为三类:成本途径、收益途径、市 场途径。 成本途径下,资产的价值等于重置成本减去资产的贬值。重置成本包括直接、间接 成本、机会成本、利润和相关税费,贬值包括功能性贬值、实体性贬值和经济性贬 值,该途径重视资产价值和成本的相关度。 收益途径下,资产的价值等于资产投入使用后预期收益的现值。该途径更加重视资 产能为企业带来的经济贡献。 市场途径下,参照市场上所选参照物的现行价格,将参照物与资产之间的差异量化,依据量化后的差异调整价格得到资产的价值。 数据资产在形式上类似于无形资产,但又有所不同。数据资产既有类似于无形资产 的非实体特性,又不像无形资产那样具有损耗性。 因此,上述三种传统要素常用的定价方式在数字要素领域既有其适用的特定场景, 也有一定的局限性。
针对数据资产的特性,目前产业界对传统的定价途径进行了修正。 采用成本途径对数据估价的具体步骤为:确定应用场景、确定开发成本、结合数据 质量进行成本调整、根据数据应用维度及稀缺性进行修正、结合潜在开发场景数量 考虑贡献度。
收益途径要求卖方企业用买方的视角来模拟定价,具体步骤为:确定应用场景、评 估拥有该数据资产各年度带来收益、考虑没有该数据资产造成的现金流(如企业需 外购数据、企业缺少数据而导致的经营不利等)、对两者的差额进行折现得到数据 资产的价值。
市场途径仍旧极大地受制于数据要素市场的成熟度,因而在数据要素市场发展初期 应用价值不大,其整体理论类似于对股票的PE估值法。具体步骤为:确定数据资产 的结构、存储、场景等各方面的信息;识别数据资产的驱动因素,如质量因素、流通 性因素、垄断性因素等;选取市场上的可比数据资产;对被评估资产和可比资产在 驱动因素维度上打分并加权得到综合评价系数;以市场价值/综合评价系数为估值倍 率,计算出数据资产的估值。
成本途径是现阶段常用定价方式。现阶段买卖双方在对数据要素的价值进行评估时 信息不对称,卖方无法在定价时根据买方场景对数据资产进行评价,因此难以采用收益途径进行估值。而数据资产的买方对需购买的数据产品的使用场景及其能带来 的增量效益有更明确的认识,可以量化使用数据产品为企业带来的价值增量。在企 业尚未健全数据资产管理及效益核算体系的情况下,多数卖方企业在运用收益途径 时存在难度,因此当前收益途径仅在少数条件下适用。
从产业实践来看,数据要素定价亦存在一定的挑战: (1)数据权利主体多元化,数据要素定价仍需建立在权利归属明确的前提下:数据 的价值并不是依循传统观点的买卖逻辑,多是由多方主体相互协作完成数据交易, 此时经济利益难以界限分明,因此定价需要建立在明确权利归属的前提下; (2)数据交易方式不确定,场景影响效应难量化:目前数据交易方式尚处于探索阶 段,决定数据经济价值的要素除了数据本身之外,还包括应用场景,可能导致卖方 根据买方所处行业的特性采取歧视性价格策略; (3)数据估价指标不统一,数据质量标准难定论:数据分析技术仍在更新迭代,市 场主体对数据质量的要求越来越高,但行业内仍未能就数据估价指标和数据质量标 准达成一致意见,成本、利润、行业属性、时效性、颗粒度等要素均能对数据的最终 定价产生重要影响。
(三)数据要素流通模式
数据要素的流通模式可以分为:数据交易机构模式、产业数据上下游模式。数据交 易机构模式又可以分为场内交易模式和场内备案模式。产业数据上下游模式又可以 分为数据空间模式和数据链主模式。
场内交易模式指的是数据供需双方在数据交易机构达成数据交易合约,依照合约约 定,完成交付及清结算过程。交易机构为双方提供交易凭证,对于交易主体交付地 点不进行时空限制,对交付方式允许双方协商进行,典型例子是上海数据交易所。 场内备案模式更加注重数据隐私。场内备案模式指的是在支持使用权的数据交易场 景下,依托交易平台,将数据和算法(含模型和参数)等资源组合成可被多方签署认 可的计算合约,运用算力进行加工,并借助多方安全计算、联邦学习、可信执行环境 等安全融合技术和区块链技术,在保证数据隐私的前提下,支撑数据处理服务、数 据产品及其应用、数据集、衍生服务等交易活动。 对于重要数据及高价值数据的流动突破了未加工或粗加工的数据买卖初级模式,典 型例子是北京国际大数据交易所。
数据空间模式有极强的可执行性。该模式由德国提出,通过建立一个涵盖五层架构、 三个维度、四类主体、三大流程的数据空间来促进数据资源共享流通和价值释放。 该模式从静态和动态两个层面进行严格认证以构建信任,运用数据连接手段保证数 据安全,建立标准化机制,通过智能化合约灵活实施。
数据链主模式对标产业链链主思维。选取产业内最有实力的龙头企业作为数据流通 试点牵头单位,发挥龙头企业产业场景丰富、业内信任度高的优势,拉动产业链上 下游的数据融通。借助工业互联网、产融合作等平台,带动产业链上下游数据撮合 和人才、资本、知识、生态等供需对接,通过龙头企业产业内资源配置能力和影响 力,借助交易服务机构实现数据挂牌、交易及交付。例如:中汽创智科技有限公司通 过搭建的“汽车大数据共享服务平台”,探索异业合作场景,激活汽车行业数据生 态,通过数据挖掘实现数据价值释放。
(四)安全保障
数据安全保障是数据要素交易流通的重要前提之一。为了防止个人隐私、商业机密、 国家机密的泄露,数据流通的过程中必须有对应的安全保障措施保驾护航,隐私计 算技术应运而生,常见的技术方案有安全多方计算、联邦学习、可信执行环境等。
安全多方计算是指在无可信第三方的情况下安全地进行多方协同计算。在一个分布 式网络中,多个参与实体各自持有秘密输入,各方希望共同完成对某函数的计算, 运用此技术后,每个参与实体除计算结果外,均不能得到其他参与实体的任何输入 信息。安全多方计算包含的基础技术有很多,比如同态加密、秘密分享、不经意传 输、混淆电路等。安全多方计算技术主要可应用于联合风控、联合营销、联合商业智 能等业务应用场景。当前探索安全多方计算技术的厂商主要有蚂蚁集团、阿里云等。
联邦学习是指基于多方数据进行联合建模。各自原始数据不对外输出、由中心方进 行协调的建模,都可称为联邦学习。联邦学习的技术原理在于参与学习的各方机器 上部署的客户端从服务器端下载现有模型以及参数,而后根据各自所有的数据对模 型的参数进行更新,并把结果传回客户端并更新模型。使用该方法不会与服务器交 互原始数据,因此保证了原始数据不会出库。另外,原始数据或者梯度在使用前都 可以使用某种方式进行加密或加噪,来增强安全性。目前,联邦学习已经开始用于 医疗、基因分析等领域。
可信计算环境(TEE)是指主处理器的安全区域。它保证装载在内部的代码和数据 在保密性和完整性方面受到保护。TEE 作为一个独立的执行环境,提供了完整的安 全特性,如执行的独立性、使用 TEE 执行的应用程序的完整性以及其数据的机密 性。为了满足对隐私的紧迫需求,越来越多的云提供商正在转向采用 TEE 技术方 案。Gartner 在其报告中将 TEE 列为 30多种“关键安全技术”之一。2019 年, 百度、阿里巴巴及腾讯等公司联合国外大型科技企业启动了“机密计算联盟”项目, 联盟的成员共享 TEE 开源工具,实现 TEE 标准互认。
数据沙箱技术强调调试环境和运行环境的分离。数据分析师在调试环境中使用样本 数据调试代码,然后将代码发送到运行环境中运行全量数据,从始至终数据分析师 无法接触全量数据,从而达到保护数据隐私的目的。该技术实现了“数据不动程序 动,数据可用不可见”,在确保原始数据不泄露的同时,促进合法合规的数据开放, 充分发挥了数据的最大价值。
区块链技术在数据交易领域逐渐普及。区块链有去中心化、防篡改、可溯源的特点, 它不是单一的信息技术,而是在现有技术的基础上整合创新,创造一种全新的信任 方式。通过搭建区块链技术平台,人们解决数据交易中的安全保密问题,确保数据 的安全,同时使得数据的流通透明可信可追溯,解决数据交易流通中数据非授权复 制和使用的问题。 数据共享将换平台规范数据共享目录和交换标准,数据应用平台根据场景需要综合 系统应用,基础平台依托信源链,为用户提供存在性、完整性、身份、时间戳、数据 关系等多项证明,具备可验证、可审计、防篡改的特性。