国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211131682.0 (22)申请日 2022.09.15 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 周政演 罗佳昱 吕靖雯 吴春明 (74)专利代理 机构 杭州求是专利事务所有限公 司 33200 专利代理师 邱启旺 (51)Int.Cl. G06F 9/50(2006.01) (54)发明名称 一种基于可编程交换机的差分隐私大数据 处理方法 (57)摘要 本发明公开了一种基于可编程交换机的差 分隐私大数据处理方法, 本发明方法(1)利用线 速数据包处理ASIC流水线加速差分隐私的计算, 显著减少CP U周期的消耗; (2)通过聚合网络流量 并除去不必要的操作减少网络流量开销; (3)通 过可编程交换机自动化隐私审计。 本发明在网内 部署差分隐私系统, 加速差分隐私计算, 提高CP U 吞吐量, 减少网络流 量和隐私审计的开销。 权利要求书2页 说明书5页 附图4页 CN 115480917 A 2022.12.16 CN 115480917 A 1.一种基于可编程交换机的差分隐私大 数据处理方法, 其特 征在于, 包括以下步骤: 步骤一: 收集每一数据的键值对信息, 并逐一检查收集的每一数据的键值对信息是否 在预定义范围内; 步骤二: 在可编程交换机控制平面生成一组随机分布的噪声值, 并将其预加载到可编 程交换机的数据平面的有状态内存中; 然后生成一个随机数, 从该随机数索引的有状态内 存中采样噪声; 将采样的噪声加入到步骤一处理获得的尚未添加噪声的数据中, 获得满足 差分隐私的数据并转 发至规约器, 规约器对其中不在预定义范围内的数据用预定义范围的 平均值替换对应数据, 所有数据聚合后输出 结果。 2.根据权利要求1所述的方法, 其特 征在于, 所述 步骤一包括以下子步骤: (1.1)在可编程交换机的数据平面部署CM ‑sketch算法, 收集全部基于映射器提取的每 一数据的键值对信息; (1.2)逐一检查收集的每一数据的键值对信息是否在预定义范围内, 若在预定义范围 内, 继续执行步骤二; 若超出预定义范围, 则基于哈希表或精确表检查该数据是否第一次出 现, 若是第一次出现, 则交换机将该超 出预定义范围的数据的键汇集到哈希表或精确表中, 继续执行步骤二; 否则, 丢弃 该数据。 3.根据权利要求2所述的方法, 其特 征在于, 所述 步骤(1.2)具体为: 在可编程交换机数据平面创建一张 哈希表和一张精确 表, 逐一检查收集的每一数据的 键值对信息是否在预定义范围内, 若在预定义范围内, 继续执行步骤二; 若超出预定义范 围, 则基于哈希表或精确表检查该数据是否第一次出现, 若 是第一次出现, 则哈希表在O(1) 的时间复杂度内记录键, 如果存储时发生哈希冲突, 则将该键上报可编程交换机控制平面, 可编程交换机控制平面将这些冲突的键插 入到精确表中,继续执 行步骤二。 4.根据权利要求1所述的方法, 其特 征在于, 所述 步骤二包括以下子步骤: (2.1)在可编程交换机控制平面中生成一组随机分布的噪声值; (2.2)将生成的一组随机分布的噪声值预加载到可编程交换机的数据平面的有状态内 存中; (2.3)基于数据的键和数据表查询每一数据是否被噪声扰动, 若数据表中存在该键, 即 该数据已被扰动, 则该数据被转发至规约器; 若数据表中不存在该键, 即该数据未被扰动, 则生成一个随机数, 从该随机数索引的有状态内存中采样噪声; 将采样的噪声加入到该数 据的值中, 再将该数据的键汇集到数据表中并转发该数据至规约器; 所述数据表包含全部 被扰动的数据的键 。 5.根据权利 要求4所述的方法, 其特征在于, 所述步骤(2.1)中, 所述一组随机分布的噪 声值为符合拉普拉斯分布的噪声值。 6.根据权利 要求4所述的方法, 其特征在于, 所述步骤(2.2)中, 所述有状态内存采用寄 存器数组的实现方式, 其中, 左移生成的每 个噪声值缩放 为整数再预加载到寄存器中。 7.根据权利要求4所述的方法, 其特征在于, 所述步骤(2.3)中, 在扰动数据 时, 对映射 器输出的数据的键值对移动相同比例, 并添加采样的移动后的噪声值到该移动相同比例的 数据的值中, 将添加噪声后的数据的键汇集到数据 表中之后转发至规约器, 其中, 转 发时将 移动的比例 封装在分组报头中, 报头也被进一步转发到规约器, 规约器将经过缩放且加噪 声的数据右移以恢复缩放比例, 规约器对其中不在预定义范围内的数据用预定义范围的平权 利 要 求 书 1/2 页 2 CN 115480917 A 2均值替换对应数据, 所有数据聚合后输出 结果。 8.根据权利要求1所述的方法, 其特征在于, 还包括运用布隆过滤器记录输出键值和映 射器的依赖关系, 通过查询所有输出键的依赖关系计算隐私预算。 9.根据权利要求8所述的方法, 其特征在于, 运用布隆过滤器记录输出键和映射器的依 赖关系, 通过查询所有输出键的依赖关系计算隐私预算具体为: a、 将布隆过滤器划分为多个分区与每个映射器对应, 记录各映射器输出过的键, 即键 与映射器的依赖关系; b、 运用布隆过 滤器统计各分区相应的映射器输出的键数量; c、 根据获得的各分区相应的映射器输出的键数量的最大值计算隐私预算。权 利 要 求 书 2/2 页 3 CN 115480917 A 3
专利 一种基于可编程交换机的差分隐私大数据处理方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 13:08:28
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GA 482 《中华人民共和国机动车驾驶证》第2号修改单.pdf
GB-T 24627-2023 外科植入物用镍-钛形状记忆合金加工材.pdf
DB13-T 5557-2022 村庄规划技术规范 河北省.pdf
DB34-T 3264-2018 公路泥岩路基施工及质量检验评定规范 安徽省.pdf
DB36-T 1099-2018 电子政务云平台安全规范 江西省.pdf
GM-T 0074-2019 网上银行密码应用技术要求.pdf
GB-T 39334.1-2020 机械产品制造过程数字化仿真 第1部分:通用要求.pdf
NB-T 10340-2019 水电工程坑探规程.pdf
GM-T 0069-2019 开放的身份鉴别框架.pdf
T-CPQS A0011—2022 二手车车况检测及评估通则.pdf
GB-T 25059-2010 信息安全技术 公钥基础设施 简易在线证书状态协议.pdf
DB52-T 702-2011 杉木二元立木材积表 贵州省.pdf
GB-T 29453-2012 煤炭企业能源计量器具配备和管理要求.pdf
DL-T 364-2019 光纤通道传输保护信息通用技术条件.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
GB-T 41904-2022 信息技术 自动化基础设施管理 AIM 系统 要求、数据交换及应用.pdf
GB-T 36957-2018 信息安全技术 灾难恢复服务要求.pdf
GB-T 38775.2-2020 电动汽车无线充电系统 第2部分:车载充电机和无线充电设备之间的通信协议.pdf
GB-T 30269.601-2016 信息技术 传感器网络 第601部分:信息安全:通用技术规范.pdf
GB-Z 20986-2007 信息安全技术 信息安全事件分类分级指南.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。