主流隐私计算技术梳理

主流隐私计算技术梳理

最佳答案 匿名用户编辑于2023/03/24 11:18

我来对主流隐私计算技术进行简单梳理。

1.差分隐私

差分隐私是密码学中的一种手段,当从统计数 据库进行查询时,提供了一种最大化数据查询的准 确性,同时最大限度减少识别其记录的机会。它可 以通过对数据引入随机性,添加噪声,从而防止数 据被推测。差分隐私能够做到在利用数据来满足业 务需求的同时,抵抗外部攻击和实现隐私保护。在 差分隐私技术的实践中,实现差分隐私保护的机制 通常包括拉普拉斯机制和指数机制。拉普拉斯机制 实现了对数值型结果的保护,指数机制则是实现对 离散型结果的保护。如今,差分隐私已经应用到各 行各业的业务场景中,比如医疗行业用于患者电子 健康档案的保护、医疗传感器如可穿戴设备的地理 位置信息的保护等。

2.同态加密

同态加密是一种特殊的密码学技术,它可以通 过对加密的数据进行计算得到密文计算结果,后对 其 进行解密得到与原数据计算结果相同的结果。同态加密能够真正做到数据的“可算不可见”,在得到 正确 结果的同时保证了数据安全和隐私保护。在实 践中,同态加密根据加密方式可以分为部分同态加 密和全同态加密。部分同态加密是指仅支持对密文 进行部分的计算,全同态加密是指对密文进行任意 的计算。

近几年,同态加密的应用场景较广泛,在云计算、 区块链和物联网中都存在同态加密的运用。如在云 计算场景下,通过同态加密实现数据的流通,保证 数据在流通的全过程中是密文的形式,确保数据安 全。又如在区块链场景下,同态加密帮助实现了链 上数据的保密性。同态加密的运用为数据的流通提 供了安全保障,因此它已逐渐渗透到了医疗、金融、 法律业等高度监管的行业。

3.联邦学习

联邦学习是隐私计算中最常见的一项技术,它 本质上是一种分布式机器学习技术,通过中央服务 器来实现对加密数据的流通与处理,最后完成多方分布的机器学习框架。联邦学习能够在确保数据合 规与隐私保护的前提下,多方共同参与完成联合建 模。在整个过程中,既保证了数据安全,又实现共 同学习的目标,协助企业解决数据孤岛、数据不可用、 数据泄露等问题。实践中主要运用在企业风控评定、 安全防控检测、医疗诊断等方面。

联邦学习在使用过程中,根据参与方之间的样 本分布,分为横向联邦学习、纵向联邦学习和联邦 迁移学习,不同的分类在实践中对应解决了不同类 型的问题。

横向联邦学习适用于参与方特征相同,但是 样本重叠较少的情景。横向联邦学习主要通过增加 样本数量,达到了提升模型的准确性和泛化能力的 目的。

纵向联邦学习则适用于参与方样本相同,但 是特征重叠较少的情景。纵向联邦学习主要通过丰 富样本来优化学习模型。

联邦迁移学习适用于参与方特征和样本重叠 度都较低的情景,是对横向联邦学习和纵向联邦学 习的补充。

4.隐私集合求交

隐私集合求交指的是,在保证互相之间不透露 原始数据集的情况下,求得多方数据集之间的交集。 隐私集合求交的用途十分广泛,如广告效果追踪、 多方安全计算等。在前面联邦学习的介绍中,纵向 联邦学习需要较高的参与方样本重合度,那么如何 才能在不向其他联邦学习参与方透露自己有哪些数 据的情况下仍能找出重合的数据样本呢?答案便是 隐私集合求交。隐私集合求交有多种实现手段,如 将数据进行哈希处理后进行求交,便可以迅速找到 交集,并使得对方无法获得原始数据;当然,哈希仅仅是比较简单的手段,且安全性不佳。目前,常 见的隐私集合求交方法包括不经意传输、基于密钥 的方案、基于混淆电路的方案等,不同方案在安全性、 计算成本、通信成本等方面有着不同的优劣势。

5.多方安全计算

多方安全计算是指,各参与方在互不信任的场 景下,共同计算一个联合函数,并保证参与方仅能 获得自己的计算结果,不泄露其他任何信息。它既 能够确保数据的保密性,还能够确保各参与方都收 到原有计算函数的正确结果。多方安全计算主要可 以分为混淆电路和秘密分享。混淆电路能够在保证 不泄露参与方数据的情况下进行计算,并且指定计 算结果的所属者。秘密分享是通过拆分秘密信息, 来实现数据安全,防止信息被丢失、破坏和篡改。 近几年,多方安全计算陆续开始也应用到各类行业, 其中混淆电路通常用于各类计算,而秘密分享在身 份认证、密钥管理等方面有重要的作用。

6.零知识证明

零知识证明同样是一种特殊的密码学技术。一 般来说,若需证明一个事实,如自己的身份、对某 权益的所有权,验证者需与证明者掌握同样的信息 才可进行验证,如口令、证书;但利用零知识证明 技术,证明者能够在让验证者掌握任何被验证的具 体信息的情况下,验证者仍可以进行有效的验证。“色 盲游戏”是一个经典的零知识证明的例子:假设你有 红绿两个小球,两个小球除了颜色之外完全相同, 但你的朋友是红绿色盲,无法区分两个小球,那么 为了证明这两个小球颜色的确是不同的,你的朋友 双手各持一个小球并将手藏在身后,然后随机交换 双手的球并询问你双手的球是否交换过,那么由于 你每次都能答对,你的朋友最终相信了这两个球的颜色的确是不同的,尽管他最终也无法知道两个球 分别是什么颜色。

目前,零知识证明被较多用于加密货币中, 用于保护交易中的隐私,确保匿名支付的情况下 仍然能够在区块链上验证交易。主流协议包括 zkSNARK, zk-STARK 等。但除了加密货币中的匿名 支付之外,零知识证明的特性使其能够用于更加广 泛的场景,包括:

资产管理:如在 NFT、元宇宙的应用中,同 过零知识证明在不泄露具体资产信息的情况下证明 自己对资产的所有权;

身份认证与访问控制:在不泄露申请人的具体 身份信息、口令的情况下,进行身份认证、权限管理;

合规证明:在不泄露合规详情的情况下,如 纳税记录,证明自己对法律法规的遵从情况。

参考报告

2022全球数据合规与隐私科技发展报告.pdf

2022全球数据合规与隐私科技发展报告。2022年是中国数据合规全面发展的一年,也是隐私科技进一步从概念走向落地的一年。回顾近一年的发展,安永与赛博研究院联合发布第二期年度《全球数据合规与隐私科技发展报告》。本报告全面梳理了国内外数据安全与算法应用的合规体系,对隐私科技的概念、内涵和外延进行更新,并通过对近百家头部企业的问卷调研,覆盖金融、科技、媒体与通信、消费品、生命科学、制造业等行业,客观了解企业数据合规的现状与隐私科技的需求,最后为国内外企业数据合规实践提供参考案例与创新思路,供业内参考。

查看详情
相关报告
我来回答