如何有效识别数据要素流通使用中存在的可信风险?

如何有效识别数据要素流通使用中存在的可信风险?

最佳答案 匿名用户编辑于2023/12/15 11:42

可以从主体(业务生命周期)、客体(数据生命周期)和环境(流通使用技术)视角,对 可信风险进行了系统识别。

1.业务⽣命周期视⻆的主体可信⻛险分析

业务生命周期指数据要素流通使用的全过程,本报告根据文献[32]将数据要素业务生命周期划分为交易申 请、交易磋商、交易实施和交易结束四个阶段。 交易申请阶段的安全风险可归纳为交易主体资质安全风险、数据准入安全风险和产品质量风险。数据要 素流通使用过程涉及供方、需方、交易服务机构等多方主体,主体资质直接关系到数据来源和流通使用的合 法合规性[33],肖建华等人认为不同交易主体应有不同的资质审核要求,对于法人主体,交易平台需要审核其 法人信息、营业执照、税务信息等;对于个人主体,交易平台需要审核其身份信息、交易目的、数据使用范 围等[34],确保数据交易参与主体不存在法律、法规禁止或限制的任何情形;数据是流通与使用的标的物,如 果出现不合规的数据流入市场有可能严重影响个人隐私安全、商业安全和国家安全,数据准入安全风险需重 点关注数据产品是否包括禁止交易数据、未授权的个人数据、商业机密数据等;参与流通使用的数据要素除 需满足准入的安全要求外,还要考虑数据质量风险。若因审核不严而使伪造或错误的数据上线,可能导致基 于数据的分析结果无效,给需方造成巨大损失。

交易磋商阶段主要存在供需匹配风险、交易公平风险和交易透明风险。在供需匹配上,数据市场中充斥 着大量的数据,面对丰富的、不同规模、不同重点的数据供给,如何找到最适合需求的数据非常困难,匹配 在时间和质量上能否契合成为供需匹配的最大风险;在交易公平性上,由于大多数的数据流通使用通过既充 当交易的组织者又充当裁判的数据交易平台进行,如果出现平台与买方或卖方合谋,交易的公平性将难以保 证,此外,由于数据产品边际成本接近于 0,使得卖家具备了实施价格歧视的更大弹性;在交易透明性上, 供方往往面临着数据如何出售、哪些数据更有价值的挑战,需方无法获得数据的透明访问,了解原始数据的 真实性;供需双方在支付细节、上市、数据发现和存储等方面缺乏透明度保证。

交易实施阶段的安全风险主要体现在权限分配、定价和交易清结算方面。在数据交易中,交易的不仅是 数据本身,更是与之相关的各项权限,数据产品交割后所有参与者主张的排他性权限能否得到保障,关系到 数据要素流通交易能否顺利进行。数据作为一类特殊产品,相较于传统商品,在成本上以及消费单位、聚合 性、消费方式、再利用和转售上存在着巨大的差异,导致了在定价原则和方法上的不同考虑,版本控制成为 设计和定价数据要素的常用机制,不同版本的价格可以与不同客户群体的价值相关联。这对数据要素的定价 提出了一系列新要求,其中包括公平性[35]、无套利[36]、真实性[37]、隐私保护[38]以及计算效率[39]等要求;与 此同时,数据要素定价还面临着与传统市场类似的操纵风险,即恶意打压或哄抬价格等。在交易清结算时, 供需双方均可能面临交易违约风险,需方付款后所收到数据的真实性、时效性和完整性是否与供方声称的一 致,供方是否会因为需方发生拒不交付、抵赖等行为导致其无法得到约定的款项。

交易结束阶段违规使用、转卖、再识别等安全风险。在交易结束阶段,安全风险主要来自于需求方。当 数据交付给需方后,面临着不诚实的数据需方没有按照约定而是超范围地使用数据,从而侵犯供方的合法权益,甚至威胁多方安全,面临着需方将其购买的数据产品进行二次流转、转卖的风险。尽管在数据交易前, 已对涉及用户身份信息的数据进行清洗、加密、匿名化等操作,但是随着公开资料的不断增多和互联网信息 技术的不断发展,经过匿名化处理的数据都有可能被再识别。

2.数据⽣命周期视⻆的客体可信⻛险分析

数据生命周期指数据从产生或获取到销毁的全过程。本文按照数据要素流通使用的相关操作流程,将数 据生命周期划分为采集存储、交付传输、加工使用、备份销毁四个阶段。 采集存储的安全风险主要有采集安全风险、侵权风险和存储安全风险。数据采集的质量标准会影响整个 链路的数据质量,原始数据的真实性、完整性、可靠性直接关系着后续的数据挖掘和分析工作[40];如果采集 的原始数据无法反映客观真实的情况,在此基础上的模型预测结果就会出现偏差,影响数据产品的可用性 [41]。数据采集时还需要严格遵守用户知情同意和最小必要等相关法律原则,但在实际中不少智能设备厂商和 app 公司为了精准营销,得到更准确的用户画像,而过度收集用户个人信息,甚至“监听”用户的智能设备, 使用户在网络空间中变为透明人,严重侵犯了个人知情权、隐私权等。数据一般存储在云端或分布式文件系 统中,云端直接加密会带来巨大计算开销,增加密钥管理风险,而分布式存储中一个节点或多个节点遭受攻 击,可能直接影响计算结果。

交付传输的安全风险主要源自网络硬件风险和外部攻击风险。数据在长距离网络传输过程中,面临着网 络不稳定导致的数据包丢失风险、网络带宽不足导致的传输时效风险,特别是面临大规模数据传输时网络硬 件风险将更加突出;数据在多路径中快速集群和转发,容易遭受病毒植入和攻击,大规模数据的汇集与传输 会降低外部攻击成本,提高单次攻击的收益,从而引起黑客的攻击,用户与服务器间共享和生成密钥是数据 传输中的重要风险点,社会工程已经成为外部攻击和窃取数据的一种重要手段。 加工使用的安全风险突出表现在隐私泄露风险、安全攻击风险和数据滥用风险。从原始数据得到可流通 交易的脱敏数据、模型化数据,必须借助大数据技术进行脱敏、分析、测试等加工操作[39],但大数据技术在 学习训练过程中面临着两类隐私泄露风险,即非授权用户直接获取数据的隐私泄露风险和攻击者通过一定方 式推断数据集中敏感信息的隐私泄露风险。在数据加工使用时,还容易遭受来自多方面的攻击,如伪造数据 或修改数据、攻击模型参数、恶意攻击服务器等。由于数据要素的使用用途和用量难以监控和衡量,受利益 驱动,在数据使用过程中往往存在超权限使用现象,甚至滋生出非法数据交易产业链,对个人隐私、国家安 全造成严重危害。

备份销毁的安全风险有备份审计安全风险和销毁安全风险。数据流通交易结束后需要生成相关交易日志 并进行备份,但备份过程可能存在未经授权擅自更改或删除、异机备份等情况,无法为交易过程的查询、分 析、审计和争议仲裁等提供可靠依据。数据销毁安全是指在监管业务和服务所涉及的系统及设备中清除数据 时,通过建立针对数据的删除、销毁、净化机制,防止数据被恢复而采取的一系列防控措施。不及时、不彻 底的销毁给内部人员和黑客提供可乘之机,可能产生数据泄露、个人信息重新识别、数据二次转售等恶性影 响,特别是当数据存储在云端时,云服务商可能拒绝按照用户的删除指令销毁数据,而是恶意保留数据,从 而使其面临被泄露的风险。

3.流通使⽤环境视⻆的环境可信⻛险分析

流通使用环境是指数据要素在流通使用的整个业务生命周期中所涉及的环境。具体而言,可分为流通交 易平台、软件环境、硬件环境三大部分。数据要素流通使用过程中,从交易申请到交易结束的全过程都在流 通交易平台中完成,检测、脱敏、挖掘等各个具体操作都依赖于流通交易平台的大环境实现;同时,数据要 素的汇集整理、建模分析等计算操作是依靠软件环境的相关算法实现的;而软件中算法的运行需要硬件基础 设施提供算力资源才能完成。 流通交易平台的安全风险主要表现在访问控制能力、环境应变能力、运行能力和内容交换控制能力。访 问控制能力是指有益用户都应能访问系统,而有害用户都应被拒绝,体现了平台的可扩展性和安全性;环境 应变能力是指平台对内外部变化应具有的灵活性和可靠性,一方面体现了平台可以在不同的环境下运行,另 一方面体现了平台内部结构的相对稳定性;运行能力是指平台有效实现数据要素流通利用的性能,有用性体 现了平台的事务处理能力,易用性是指实现业务功能时占用最小系统资源的能力从而保证系统的运行性能, 如访问速度快、操作方便等;内容交换控制能力是指平台的连通性和隐私性,要求既能够保障正常内容的交 换,又能保护隐私内容。

软件环境的安全风险体现在系统软件风险和应用软件风险。数据要素流通使用过程中需要各类系统软件 和应用软件的支撑,这些软件存在着各种各样的漏洞甚至隐含着恶意代码,而检测此类软件中存在的恶意代 码非常困难,给数据要素流通使用带来了巨大的潜在风险。算法是数据要素流通应用中的一类特殊应用程 序,随着各类深度学习模型、协同学习模型的应用,算法的计算逻辑、交互逻辑日益复杂和多样化,使得算 法结果的可解释性差强人意,算法自身的安全性也难以控制,此外很多算法的设计基于某种安全假设,例 如,假设多个参与方之间均遵守指定规则及协议流程且不存在同谋等,这额外地增加了一种安全假设风险, 即当算法的安全假设不能被满足时,算法结果可能会难以预料6 。 硬件环境安全风险指数据存储、运行等所需要的关键信息基础设施安全风险,主要分为计算机物理安全 和计算机网络安全。计算机物理安全风险包括计算机的异常损毁、被盗、非法使用等;计算机网络安全风险 包括对计算机网络设备、计算机网络系统、数据库等的攻击行为。此外,供应和搭建硬件环境的厂商是否可 信任、是否曾发生未经允许自动读取设备信息和产品质量不合格事件、设备是否存在故障、传输是否存在延 迟、是否存在硬件木马等都是与硬件环境相关的安全风险。如果硬件设备易遭受攻击、频频出现故障,将严 重影响数据要素相关产业的健康发展。

参考报告

数据交易PDCA模型.pdf

数据交易PDCA模型。数据作为数字经济的核心生产要素和创新动力源泉,蕴含着事物的关联性及其发展规律,对提升国家安全管理能力、社会治理能力、经济发展质量等各方面具有重要的价值。然而,数据要素流通使用环境复杂,承载多方主体利益,流通使用过程环节众多,容易引发多重安全风险和隐私泄露问题,威胁个人隐私、商业秘密、国家安全以及各参与主体的合法权益,严重制约数据要素大规模流通使用。近年来,政府组织、学术界和产业界围绕数据要素在产权分配、数据治理和数据资产等方面的问题,很少有研究在中观或者微观层面关注数据流通交易、数据市场可持续发展的基础条件——市场信任。由于数据要素市场的双向信息不...

查看详情
相关报告
我来回答