Protect Privacy from Gradient Leakage Attack in Federated Learning

news2025/7/11 1:54:43
  • wangjunxiao/GradDefense: Defense against Gradient Leakage Attack (github.com)
Summary
  • 针对DGA和DIA攻击,提出了一个轻量、保证训练准确性、够用的的防御机制。
  • 防御机制主要包括随机layer添加扰动,然后进行梯度补偿来减少噪声对模型准确性的影响。
  • 实验效果优于梯度裁剪、和差分隐私(添加Gaussian和Laplacian噪声)
Method
  • 流程
    image-20221020165935220

    • 先在本地进行随机扰动,分层。加噪声,然后server进行全局更新,然后噪声估计与相应的消除,最后是进行补偿更新。
  • 使用关于输入信息的梯度变化敏感度来衡量,sensitivity易于计算,可以获得基于分层方式的信息泄露。将梯度切片,在随机抽取切片进行加噪声。

  • 全局更新补偿

    • 全局梯度的层次之间高度相关,因为是基于大量数据在反向传播中逐层产生的。假的噪声不会太改变梯度的方向,因为随机变量独立地加到原始数据,这些差距将会分布在所有方向。基于此,进行补偿时可以从扰动的数据中获取更准确的梯度数据,减少噪声扰动的影响。
  • 雅可比矩阵 衡量信息泄露风险

    • image-20221020193444433
    • 衡量矩阵变化的敏感度
    • 泄露风险:image-20221020193624242
    • 使用 F 范数,因为雅可比矩阵在不同大小的层之间进行比较,并且 F 范数将考虑数据样本的所有维度。
  • 基于随机扰动的风险平衡

    • Sl是Gl的size,Rl是l层的泄露风险。
    • 为了平衡层大小加权的泄露风险(因为之前说了size越大,风险一般越大),先去每层的size S的最大公约数将梯度划分大小相同的块。然后Sb和Rb为每一块的size和泄露风险。
    • 根据装箱问题,将梯度切片,每一片都有相同的信息泄露风险。
    • 每一轮学习,每个client都会随机选择一部分切片
      • 梯度被切分为s片,然后γ∈(0,1],每次选s x γ个 slices。
      • 加的噪音是高斯分布的。N (𝜇, 𝜎2)
    • 局部扰动基于Reservoir 样本进行的。计算复杂度为s,因为只有s片梯度。
  • 总:通过一个衡量方式:梯度变化的敏感度捕获分层间的信息泄露风险概率,并加以跨层随机扰动,攻击者重构数据的质量大幅下降。client在本地训练的时候会对梯度切片进行加噪声,attacker很难定位,即使定位了,也无法重建原始数据。

  • 全局更新补偿

    • 全局梯度的属性相关性

      • 在反向传播中,损失函数l(预测输出和分类准确性之间)从最后一层传到第一层,这里说的层应该是卷积层和全连接层这类的层。

      • 对于l层,梯度向量由链式规则计算的权重和偏差的梯度组成。因为逐层属性在反向传播中逐层产生,所以全局梯度中的逐层属性高度相关,由此可以获得更准确的原始数据。用此进行全局更新的补偿。

      • 因为属性的相关,所以属性之间有些方向之间有较大的的差异,有的方向差异很小。

      • C :加了噪声扰动的全局梯度矩阵、Z:原始数据的矩阵、R:噪声的矩阵。所以 C = R + Z。The shape of the three matrix is 𝑣 × 𝑤. R中的元素是符合高斯分布的独立同分布的随机变量。

        image-20221021163351508

        其中m参与者的数量,s是切片总数,d是进行噪声扰动的切片。𝜖是聚合的weight,范围是0-1开区间

      • image-20221021165945849
        以𝝕为变量,matrix R 的维度v和w,为函数𝑣(·), 𝑤(·)。经验累积分布函数的渐近性,𝝕趋于无穷,𝑣(·), 𝑤(·)也趋于无穷,Q为𝑣(·), 𝑤(·)的比值,当Q>=1,才有上述假设。在以上假设下,经验累积分布函数收敛为FQ(x),其概率密度为:
        image-20221021170542850
        当x不在LR(协方差矩阵)的特征值 的范围内,FQ等于0.

      • 因此,随机矩阵 R 具有可用于全局更新补偿的概率属性。

    • 全局梯度补偿

      • C是扰动的全局梯度矩阵。C的协方差矩阵为image-20221021184145062

      • 其中Pc、Pr、Pz是正交矩阵,其列向量是特征向量,ΛC、ΛZ 和 ΛR 是对角矩阵,其对角线上有相应的特征值。

      • R T Z and Z T R be equal to 0,因为R的独立随机生成,所以与Z的向量不相关,协方差为0.

        • 由以上 推理可得下列定理

          • image-20221021185212257
            由噪声相关矩阵的最大和最小的特征值来规定了数据相关矩阵的界限,ci的特征值大于zi加r的最小值,小于zi加r的最大值。我们假设数据相关矩阵只有几个主要的特征值,z1到zj,则存在zi<=β,j+1<=i<=w,这里如果j=w,那就有所有的w的,不符合之前的假设。假设zj大于r1(r1是r最大的特征值)。
            通过在𝜆1,r处的简单阈值,将数据和噪声的特征值从扰动数据特征值中分离,因为z最小的特征值要大于r最大的。

          • 所以这个流程就是:根据随机矩阵理论使用协方差矩阵的特征值分布从C中分离出噪声和数据部分。然后根据数据部分矩阵的特征值进行全局补偿。这可以通过简单地将数据沿数据特征向量投影,然后将其映射回原始空间来完成。

          • 因为噪声分布已经给了,所以我们可以通过式子4求得噪声矩阵的最大最小特征值,并用这个特征值来限定数据矩阵的特征值范围。

          • 选i-j个特征值,噪声的特征值是i-j,别的就是数据的(之前不是说噪声的是1-j)。

            • image-20221021192011587
              上图是特征值组成的对角矩阵
            • image-20221021192040108
              上图是特征向量组成的矩阵。
            • Z:数据矩阵也是同上。
          • 将 C (扰动后的数据矩阵)投影到 P∗Z(实际数据的特征向量组成的矩阵,应该是实际数据的方向) 跨越的子空间上得到的实际数据 Zis 的补偿 Z∗。
            image-20221021192906580

      • 为了衡量补偿的效果,考虑一下当从w个特征值中选w*个,因为全局梯度的相关性,所以w*方向的方差要大,去掉其他方向的不会造成太多信息损失,然而噪声是随机的,没有相关性,取出w*方向后损失这部分的噪声方差。

    • 避免攻击者利用补偿

      • 本地裁剪,剪裁各个数据样本的梯度并将它们缩放到与该噪声相对应的相似范围,并基于该范围来限制每个各个数据样本对共享梯度G的影响。

      • 裁剪过程:Following

        • image-20221021194514237,噪声的高斯分布,其中B是噪声强度

        • 然后,在局部训练的每一步,我们使用文献[15]中提出的Norm裁剪方法,根据数据样本的2-范数对各个数据样本的梯度进行裁剪。。g被image-20221021195258717取代。当g的2-norm小于g,则g不变,相反,g被B替换。

    • 收敛分析

      • 没看懂
Experiment

两种梯度泄露攻击,三个图像数据集,基于非独立同分布

  • 防御基线
    • DAG中提出的梯度裁剪,差分隐私(DP,加噪声)和PLD(隐私泄露防御)。其中DP分为DP-G,DP-L。分别加高斯噪声和Laplacian。
    • 用PSNR和SSIM评估重构的数据和初始数据,判断防御的效率。
  • 数据集:
    • MNIST, Fashion-MNIST, CIFAR-10,non-IID,100选10个client,或1000选200client,每个2个class,每个class有1-10或者1-20个samples。
  • 模型
    • LeNet和Convnet
  • 效果
    • image-20221021200334327
      有时候ART(代价)虽然高点,但是模型准确率远高于GC和DP。
    • 根据Table3A,基于梯度敏感度的切片能够更准确地捕捉到原始信息泄漏的风险,相应的PSNR(越大越好,越好代表防御失败,数据重构好)、SSIM(越大越相似)明显低于基线。
      根据3B,发现只有100个训练样本的根数据集足以捕获信息泄漏的风险。
      3C:对于梯度敏感度的切片能够更准确地捕捉到原始信息泄漏的风险,相应的PSNR、SSIM明显低于基线。
      3D:Q(𝑣(·), 𝑤(·)的比值)为6∼12足以表征全局梯度的相关性,其中补偿误差减小到相对稳定的值。当Q值增加超过6时,相应的收敛性能进一步略有提高,甚至在较大的Q时有所下降。
Related Knowledge+
  • 雅克比矩阵

  • 装箱问题

  • 欧几里得距离

    • 指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)
    • image-20221020165626821
    • GIA攻击中用余弦相似替代欧氏距离。并对梯度的符号进行优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/9225.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CORS处理跨域问题

“前后端分离的项目必然会遇到一个典型的问题——跨域问题。” 跨域 要解决跨域问题&#xff0c;首先得知道什么是跨域&#xff1f; 首先&#xff0c;跨域是访问的域名或IP、端口三者有一不同都属于跨域。&#xff08;注意请求路径不是&#xff09;&#xff0c;即使在本地测试&…

【计算机网络】学习笔记--第一章

【计算机网络】学习笔记--第一章基本概念端系统之间的通信客户-服务器方式&#xff08;C/S方式&#xff09;对等连接方式&#xff1a;三种交换方式电路交换&#xff08;Circuit Switching&#xff09;分组交换&#xff08;Packet Switching&#xff09;报文交换&#xff08;Mes…

centos7 安装与卸载 Mysql 5.7.27(详细完整教程)

目录 卸载 安装 卸载 1、关闭MySQL服务 systemctl stop mysqld2、使用 rpm 命令查看已安装的安装包 [nameVM-20-12-centos mysql1]$ rpm -qa|grep mysql 3、使用yum卸载安装的mysql [nameVM-20-12-centos mysql1]$ sudo yum remove mysql mysql-server mysql-libs mysql…

【LeetCode每日一题:775.全局倒置与局部倒置~~~维护前缀最大值】

题目描述 给你一个长度为 n 的整数数组 nums &#xff0c;表示由范围 [0, n - 1] 内所有整数组成的一个排列。 全局倒置 的数目等于满足下述条件不同下标对 (i, j) 的数目&#xff1a; 0 < i < j < n nums[i] > nums[j] 局部倒置 的数目等于满足下述条件的下标 …

Air780E连接点灯科技-LuatOS

前面发了腾讯云点灯以后&#xff0c;有朋友提到了点灯科技&#xff0c;人家都叫点灯科技了&#xff0c;那咱们学点灯必须连一下试试呀。本文将记录如何将设备连接点灯云平台&#xff0c;并通过手机进行远程控制 先上成果演示 一、点灯云准备 下载点灯科技的app-blinker&#…

Offsets 获取该行的起始索引 start=offsets (x)

获取数据列的第 x 行&#xff0c;通过 Offsets 获取该行的起始索引 startoffsets (x) 和下一行的起始索引 endoffsets (x1)&#xff0c;然后使用这两个索引通过 Bytes 获取具体数据对应的字节流 bytes.slice (start,end)&#xff0c;最后按照字段类型做相应的转换即可。 注&am…

QGC二次开发基础

文章目录 前言一、添加文件到QGC工程二、添加界面三、QML和C++交互四、信号与槽五、测试前言 QGC 4.2.4 一、添加文件到QGC工程 在qgroundcontrol/src目录下创建SimpleTest文件夹 在文件夹中创建SimpleTest.cpp、SimpleTest.h和SimpleTest.qml三个文件 在qgroundcontrol.p…

锁竞争导致的慢sql分析

线上在同步用户时&#xff0c;经常出现简单sql的慢日志。根据方法找到代码&#xff0c;发现方法内使用redisson进行锁操作&#xff0c;waiTime和leaseTime都为3秒,数据库操作比较简单&#xff0c;只是一个简单的用户更新操作。代码简化后如下 Override Transactional(rollback…

客流分析统计摄像头可定制算法程序自动判断识别提醒

客流分析统计摄像头是一个专门为商业零售业企业开发的智能客流量统计分析系统。客流统计分析系统能实时、动态、准确、连续地记录着经营场地的客流的数据信息&#xff0c;既有当前客流又有历史客流&#xff0c;既有不同时段的&#xff0c;又有不同区域客流数据。 客流分析统计摄…

【论文】Poly-yolo: 改进anchor分配问题

文章目录Poly-yolo: higher speed,more precise detection and instance segmentation for yolov31 修改了骨干网络增加CE模块2 重写标签3、修改了输出层3.1 修改细节3.2 修改目的&#xff1a;改进anchor分配问题4 检测多边形 Instance segmentation with Poly-YOLO4.1 The pri…

【Pytorch with fastai】第 9 章 :表格建模深入探讨

&#x1f50e;大家好&#xff0c;我是Sonhhxg_柒&#xff0c;希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流&#x1f50e; &#x1f4dd;个人主页&#xff0d;Sonhhxg_柒的博客_CSDN博客 &#x1f4c3; &#x1f381;欢迎各位→点赞…

95后工程师上班哼小曲?那些愉快上班的打工人,到底怎么做到的?

特别羡慕我们公司一个画PCB板子的刘工&#xff0c;95后&#xff0c;来公司也3年多了&#xff0c;他不是我们部门赚得最多的&#xff0c;也不是人际关系处得最好的&#xff0c;却是活得最开心的。 具体表现在哪呢&#xff1f; ——他居然能每天哼着小曲上班。 怎么会有人上班…

《Linux下的进程创建》

【一】fork函数初识 在Linux中fork函数是非常重要的&#xff0c;他从已存在的进程中创建一个新进程&#xff0c;进程为子进程&#xff0c;而原进程为父进程。 返回值&#xff1a;fork函数的返回值是非常有意思的&#xff0c;他是有两个返回值的&#xff0c;对于父进程来说&…

QRegExp(正则表达式)

QRegExp 头文件&#xff1a;#include<QRegExp> 构造函数&#xff1a; 常用函数&#xff1a; indexIn()判断是否符合规则matchedLength()返回最后一个匹配字符串的长度&#xff0c;没有的话返回-1setPattern()将模式字符串设置为模式。区分大小写、通配符和最小匹配选项不…

openpnp软件的使用 - 引入坐标文件

文章目录openpnp软件的使用 - 引入坐标文件前言笔记生成符合openpnp要求的坐标文件板子在openpnp设备上摆放的规则确定openpnp设备的x,y方向确定自己板子的原点坐标和xy方向在openpnp设备平台上摆放板子在openpnp中引入坐标文件新建任务新建板子引入板子的坐标文件设置mark点Pa…

Starday影响者视频能给你提升80%的流量?

跨境电商行业随着互联网时代的推进&#xff0c;Starday跨境电商平台受到越来越多的人关注&#xff0c;许多商家受碍于疫情影响&#xff0c;为了个人商家和企业发展&#xff0c;将目光投于海外。如雨后春笋般出现的跨境电商平台&#xff0c;也为商家带来了许多困扰&#xff0c;该…

JS高级(一):类、原生tab栏切换、原型和原型链

JavaScript高级&#xff08;一&#xff09;一、类&#xff08;之前ES6学过&#xff09;1.类的用法2.类的继承2.1 extends关键字2.2 super关键字&#xff08;1&#xff09;子类属性和父类一致&#xff0c;constructor可以省略&#xff08;2&#xff09;子类要添加属性&#xff0…

axios 实现 POST/PUT接口入参是 query的形式而非JSON的形式——querystring的使用

先看下什么是query的形式入参&#xff1a; 1.常规的GET请求 一般是GET请求才会是query string parameters的形式入参 参数是query string parameters的展示&#xff0c;最终效果是拼接到url地址中&#xff0c;如下图所示&#xff1a; 2.常规的POST/PUT请求 一般是POST/PUT请…

云小课|使用SQL加密函数实现数据列的加解密

摘要&#xff1a;数据加密作为有效防止未授权访问和防护数据泄露的技术&#xff0c;在各种信息系统中广泛使用。作为信息系统的核心&#xff0c;GaussDB(DWS)数仓也提供数据加密功能&#xff0c;包括透明加密和使用SQL函数加密。本文分享自华为云社区《看GaussDB(DWS)如何使用S…

电感单位亨利H单位换算

1H 1e-18EH 1e-15PH 1e-12TH 1e-9GH 1e-6MH 0.001kH 1H 1,000mH 1,000,000uH 1,000,000,000nH 1,000,000,000,000pH 1,000,000,000,000,000fH 在线H亨利单位换算 (toolxq.com)http://www.toolxq.com/front/tools/trans/unit/H 亨利是电感的国际单位制导出单位&#xff0c;符…