量子位硬科技深度产业报告——隐私计算 Privacy computing 隐私计算 Qbitai Industry Insight 产业展望报告 技术分析·价值延展·产业透视 1 量子位硬科技深度产业报告——隐私计算 核心结论 我们认为,隐私计算的想象空间不止于数据安全合规。作为目前能有效解决数据安全流通问题的唯一技术手段, 隐私计算能够在业务价值提升、乃至社会生产力提高上有明显的放大作用。隐私计算不仅是一种工具,也不仅 是作为IT底层的“隐私计算Inside”,而应当是联通价值网络的“隐私计算 all over”。 同时,我们也发现,隐私计算产业,虽然仍在早期的孵化落地阶段,但已呈现出了种种“竞争过热”的现象。 以下为本篇报告中,所提出与市场不同的分析结论: 1. 隐私计算的价值分为三层,目前的价值来源于第一层的安全合规,但我们认为,其与AI/大数据产业的联动 嵌入会成为其第二波增长动力。在未来,基于对数据要求安全流动,从而创造业务价值的影响,隐私计算将成 为IT行业普遍应用的底层技术。 • 行业本身的价值创造(数据合规;提升业务价值) • 作为底层支撑,与AI产业及大数据产业协同发展 • 推动数据要素安全流通,提升社会生产力。第三层价值回答了为何政策对隐私计算产业提供了高度支撑,也展示了这一技 术目前的不可替代性,以及未来的巨大发展空间 行业自身发展 保护数据安全合规 产业协同发展 推动数据要素流通,提升社会生产力 大数据&AI产业 以提供数据运营,辅助数据定价确权等方式,服 工具底层设施 务于不同机构及交易所,推动数据要素顺利流通, 指导社会要素分配 2. 据量子位智库测算,预计到2030年,我国隐私计算行业的总市场规模将达到1134亿。其中,第一、二、三 层价值分别占比11%,27%和62%。 3. 业界公认,隐私计算行业已经进入了“竞争过热”状态,产品供给远超意向客户及所需项目数量。玩家呈现 出第三方初创公司、大型互联网公司、AI等软件开发商、转型公司、甲方自研参与的多方混战局面。尽管规划 上已经有明显区分,但受限于资源和发展年限等,在具体落地上,企业的竞争战略和现有定位仍然较为同质化。 我们预计未来3-5年内,将出现比较明显的差异化竞争路线。 量子位硬科技深度产业报告——隐私计算 3. 隐私计算行业还处于早期落地阶段,目前整体上处于产业点状落地期(2021-2025年),行业重点在于打 磨头部客户及案例实践,预计2025年后可达到大规模商用的二次浪潮。 4. 行业入门门槛低、缺乏战略性的竞争差异、技术优势难以形成并证明是目前竞争过热的底层原因。扩展在产 业链上的定位是玩家们未来的备选项之一。本报告基于分析给出了隐私计算产业未来的延展形态。 现有三段式产业链 隐私计算理想产业链 5. 产品标准化平台化和基于数据运营的业务价值化成为竞争与发展的共同方向。 6. 不同的分化路线已出现,但仍需进一步特色巩固,形成各公司可靠的战略优势,具体包含:数据生态服务商、 软件系统服务商、专注垂直赛道、标准化完整方案、基础设施服务商、底层加速硬件厂商。其中,数据生态服 务商已经成为绝大多数厂商的定位主张,但据观察,除专注特定赛道的厂商外,大规模的数据生态搭建仍需一 段时间。 7. 要实现破局,需要强调的是隐私计算行业的综合门槛。主要涉及标杆客户、长期自研技术壁垒、连接能力、 价值创造能力和产品工程化能力。 本系列报告感谢以下公司参与深度采访:冲量在线、洞见科技、锘崴科技、融数联智、华控清交、微众银行、富数科技、平安科技、星云 Clustar、同盾科技、翼方建数、矩阵元、OpenMPC(排名不分先后) 量子位硬科技深度产业报告——隐私计算 目录 技术篇 01 定义及分类 02 技术发展现状 价值篇 04 技术价值分析 07 市场价值估算 产业篇 09 行业供需现状 — 供远大于需,现有行业天花板明显 11 代表玩家分析 —多方参与,现有落地路线相似,有待进一步分化 17 行业阶段划分 — 仍需3年进入成熟阶段 21 产业链分析 — 需从数据要素角度出发延展产业链定位 24 竞争过热背后 — 同质化导致缺乏竞争壁垒 25 未来破局 — 关注行业综合门槛 量子位硬科技深度产业报告——隐私计算 技术篇 1.1 定义 隐私计算并非特定的技术,而是近年提出的新技术概念,统指用于保护原始数据隐私的软硬件技术。在使用隐私计算后, 使用者能够在不泄露原始数据、保护数据拥有者隐私及利益的前提下(如客户的具体身份),对所需数据进行采集加工、 处理分析等。也即业界常称的“数据可用不可见”。 除去自有的“数据可用不可见”特性外,在辅以MPC、区块链等技术后,隐私计算还能够实现数据的“用途可控可计 量”,并完善定价、确权等功能。在数据要素市场上,从底层的隐私保护出发,承接转移、交易、定价、确权等流程的 技术需求。 目前多实现的典型功能包括: • 隐私检索匹配:保护检索过程中的检索条件,在条件加密的情况下和数据库进行匹配 • 隐私推理:在保护个体信息的前提下,直接得到模型结果 • 隐私建模:连接多个机构的横向建模,这一功能在病人样本稀缺的医学领域表现突出 三大技术路线 在技术路线上,隐私计算大致可以分为联邦学习、多方安全计算和可信硬件三类。 在实际应用中,不同的场景、模型关注的技术指标不同(如安全性、准确性、并发性、响应速度等),而三类技术路线 各自存在长短板,仅靠单一路线无法满足需求。因此,隐私计算公司不会将自身限定在某一特定路线上,而是选择全面 布局,同时在专长的路线上形成技术壁垒。在实际应用中,基于对性能、安全性和准确性的取舍,对各类技术模块根据 需求灵活部署。 多方安全计算 MPC(Secure Multi-Party Computation) 代表公司* 在无可信第三方的前提下,通过多方共同参与,安全地完成某种协同计算。即,在一个分布式的网络中,每个参与者都各自 技术特征 持有处理后的秘密信息(如加密数据、模型、梯度、参数等),共同完成对某个函数的计算,没有中心节点 基于MPC的隐私计算领域应用了同态加密(Homomorpgic Encryption)、不经意传输(Oblivious Transfer)、混淆电路 (Garbled Circuit),秘密共享(Secret Sharing)等十分复杂的密码学技术 严重损耗效率:由于有基于密码学的严格信任假设前提,MPC技术的安全性相对更高,但同时也会严重损耗效率(算力、 问题 通信等)。因此,多方安全计算大多是在分等级(信息处理标准不同)、分场景(如多用于两方计算、高延时场景)的前提 条件下,结合其他加密方式使用的 *本表格及后续表格中不同技术的代表公司参考了中国信通院云大所2021年7月《隐私计算白皮书》中公布的测评结果 联邦学习 FL(Federated learning) 代表公司 1 量子位硬科技深度产业报告——隐私计算 最早由谷歌提出,用于利用用户手机进行模型训练。在进行机器学习的过程中,各参与方借助其他方数据进行联合建模,各方 无需共享数据资源,本地原始数据不出库,对中间加密数据流通&处理,来完成多方联合的机器学习训练,建立共享的机器学 习模型。该技术路线下仍然具有中心节点 技术特征 大致可分为三类* ·横向联邦学习(特征高度重合,联合的是样本。适用于业务逻辑相似的多方) ·纵向联邦学习(样本数据重合,适用于目标样本重合的多方) ·联邦迁移学习(同时结合了横纵向的两类特点) 问题 ·模型效果提升可能相对有限,因为数据间重合,或者过于无关,或者难以获取等 ·联邦学习算法基于梯度,可能被还原,其安全性有待进一步考量,一般与TEE、合成数据等其他技术联合使用,以增强安全性 *定义参考:微众银行2020年4月 《联邦学习白皮书2.0》、中国信通院云大所2021年7月《隐私计算白皮书》 可信执行环境 TEE(Entrusted Execution Environment) 代表公司 在硬件层面上,将各方数据统一汇聚到隔离的执行环境进行单独计算,该环境的安全性更强,功能比安全芯片更丰富,提供代 码和数据的机密性和完整性保护*,具体实现效果与硬件的开发水平紧密相关。 技术特征 主流TEE技术以X86指令集架构的IntelSGX技术和ARM指令集架构的TrustZone技术为代表,支持多层次、高复杂度的算法逻 辑实现,运算效率高,可信度量保证运行逻辑可信等,被广泛认可*。 由于无需学习密码学、相关统计学等,第三方的使用门槛较低,且其安全性不涉及算力问题,在国外使用更广。Linus基金会旗 下设立机密计算联盟(Confidential Computing Consortium),早期参与者以TEE厂商为主。 目前,这一路线的争议主要在于芯片厂商,特别是国外厂商的可信度问题。为此,国产硬件与信创厂商的隐私计算适配已经成 为星云Clustar、融数联智、冲量在线等隐私计算公司新的战略增长点。 问题 此外,这一技术十分复杂,与底层硬件适配的门槛较高(据冲量在线透露,其适配代码超过200万行),部署过程复杂。因此前 期研发投入高,需要研发人员同时具有芯片设计、密码学等基础。其实际安全效果除硬件外还有赖于传输层安全协议、多因素 验证、密钥管理服务等。 *参考中国信通院云大所2021年7月《隐私计算白皮书》 1.2 技术发展现状 隐私计算技术相关的底层理论最早出现于上世纪80年代。密码学、零知识证明等分支技术在数据安全等领域均已有一定 的商业应用,这也导致多家隐私计算初创公司脱胎于综合性厂商的相关技术部门,在技术商用落地上有一定的先发优势。 2020年起,隐私计算作为单独的技术门类,逐渐克服了安全、效率(如大量节点的并行计算、百万级数据规模)、可用 方式(除加、减、比较外,开始支持逻辑函数、分类算法、甚至神经网络等)等技术门槛,进入点状落地阶段,并出现 了对数据规模和延迟要求更高的生产级、城市级、基础设施级解决方案。 安全 然而,尽管隐私计算技术已经有了明显发展,但依旧有些问题需要关注。 • 不可能三角 在隐私计算中,由于需要大量的加密解密步骤,安全、效果、性 能的三角往往难以平衡。 效果 —— 全同态加密 —— 联邦学习 —— 多方安全计算 性能 2 量子位硬科技深度产业报告——隐私计算 安全性 对客户而言,其中最为重要的是安全性,需要隐私计算产品进行充分的安全自证。在技术层面将更多的依赖于源代 码自证、安全假设模型验证,以及POC和实际应用中的业务安全性证明。 模型效果 据公开资料,采用隐私计算后,银行的反欺诈模型AUC在0.6-0.7之间,约有20%左右的下降。但

pdf文档 量子位 隐私计算产业展望报告

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
量子位 隐私计算产业展望报告 第 1 页 量子位 隐私计算产业展望报告 第 2 页 量子位 隐私计算产业展望报告 第 3 页
下载文档到电脑,方便使用
本文档由 路人甲 于 2022-08-16 03:35:36上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。