FHE 之 面向小白的引导(Bootstrapping)

news2025/7/19 12:11:25

1. 引言

FHE初学者和工程师常会讨论的一个问题是;

  • 什么是引导(bootstrapping)?

从理论角度看,这个问题的答案很简单:

  • 引导就是套用 Gentry 提出的思想——在加密状态下同态地执行解密操作,并使用其私钥的加密形式来实现

但这个解释往往让人困惑,尤其是在面对如今各种 FHE(全同态加密)库所提供的不同加密方案时,这种说法并不能真正帮助理解什么是引导。

要理解引导,首先需要理解两个概念,它们适用于所有同态加密的密文:

  1. 密文的“等级”(level)
  2. 密文中的“噪声”(noise)

无论使用哪种底层加密方案(BGV、BFV、CKKS 或 TFHE),每个密文都有一个噪声值;而“等级”这个概念只适用于 BGV、BFV 和 CKKS 这类方案。

在这些方案中,每次执行同态乘法时,都会“消耗”一个等级:

  • 也就是说,密文的等级值会减少 1 1 1
  • 同时,密文中的噪声也会增加。

经过一定数量的操作后(具体数量取决于所使用的加密方案),密文就无法再继续执行操作了。这通常是因为:

  • 等级已经降到 0(执行了过多的乘法);
  • 或 噪声增长过大(如执行了大量加法);
  • 或者 两者同时发生。

在这个时候,就需要“引导(bootstrapping)”了:

  • 引导的作用是将密文的等级恢复到更高的值
  • 并且(根据不同方案)可能还能减少噪声

引导通常被认为是一个昂贵的操作(虽然目前的技术已经让它变得更快了),因此大家在实际使用中会尽量避免频繁执行引导操作

为了让情况变得更复杂一些,常常会看到同一个加密方案的同一实现,其运行时间却各不相同。这是因为“运行时间”可以从以下四个角度来看待:

  1. 最直观的方式是延迟(latency)
    也就是“执行一次引导操作需要多长时间?”
  2. 第二个角度(适用于 BGV、BFV、CKKS)是密文打包(ciphertext packing)的概念
    在这些方案中,可以将多个明文打包进一个密文中,从而实现摊销(amortization)
    换句话说:每秒可以对多少个明文槽(slot)执行引导操作?
    这衡量的是吞吐量(throughput),其计算方式大致为:
    吞吐量 = 支持的槽位数 单次引导的延迟(秒) \text{吞吐量} = \frac{\text{支持的槽位数}}{\text{单次引导的延迟(秒)}} 吞吐量=单次引导的延迟(秒)支持的槽位数
    这类摊销来自于纯粹的数学优化。
  3. 第三个角度是利用指令级并行带来的摊销
    比如使用切片策略、多线程、甚至 GPU 实现。
    这类优化不是数学上的,而是工程实现上的优化
    它同样可以用“每秒可引导的明文槽位数”来衡量。
  4. 第四种衡量方式(在2021年论文Bootstrapping for HElib 中提出)
    考虑的是:
    引导操作提供的槽位数 × 可支持的乘法深度 执行一次引导所需时间 \frac{\text{引导操作提供的槽位数 × 可支持的乘法深度}}{\text{执行一次引导所需时间}} 执行一次引导所需时间引导操作提供的槽位数 × 可支持的乘法深度
    本文不会深入讨论这种摊销方式。

不过,在大多数应用场景中,人们关注的重点并不是高吞吐量,而是低延迟——
也就是说,更希望快速完成一次函数评估,而不是慢慢完成很多次函数评估

因此,在许多实际应用中,引导性能的关键指标是:

  • 延迟

要更深入理解这个问题,就必须结合具体加密方案来研究引导操作对等级、噪声和性能的影响

而这恰恰是引发混淆的地方:

  • 一种加密方案中的引导行为,通常无法直觉性地迁移到另一种方案中去理解

现在,来总结目前主流加密库中提供的三大类 FHE(全同态加密)方案在执行引导(bootstrapping)时的行为差异:

  • BGV / BFV
  • CKKS
  • TFHE

在这里插入图片描述
其中:

  • [1] 指:2021年论文Bootstrapping for HElib
  • [3] 指:2021年论文Sine Series Approximation of the Mod Function for Bootstrapping of Approximate HE
  • [4]指:Zama团队2022年7月6日博客Announcing Concrete-core v1.0.0-gamma with GPU acceleration

2. BGV / BFV

在BGV / BFV这些方案中,引导操作的作用是:

  • 增加密文的等级(level)
  • 同时减少噪声(noise)

引导前后的密文加密的是相同的明文消息(即明文内容不发生变化)。

一个 BGV/BFV 计算通常是由一系列加法和乘法组成的:

  • 目标是尽量减少乘法的深度(multiplicative depth)
  • 乘法深度越高,所需引导次数也越多。
  • BGV/BFV 的引导操作通常非常耗时(延迟高)
  • 但由于支持密文打包(ciphertext packing),可以实现较好的摊销效果

3. CKKS

在 CKKS 中,明文本身就带有一定的噪声,因为它们表示的是实数的近似值

  • 引导操作不会减少噪声,它只是提升密文的等级

因此,CKKS引导前后的密文并不加密完全相同的明文

  • 它们分别是对同一个实数的不同近似值

不过,随着每次操作(包括引导),明文近似值的误差也会不断增大

  • 所以,如果要计算一个很深的电路,就必须使用非常大的参数;
  • 仍然需要关注长运算序列中误差的积累问题。

总体而言,CKKS 的引导延迟与 BGV/BFV 相近

4. TFHE

在 TFHE 中,引导操作在某种程度上类似于 BGV/BFV 方案的引导 —— 它能够减少噪声。但由于 TFHE 没有“等级(level)”的概念,无需考虑与等级相关的问题。

然而,TFHE 的引导具有两个重要的区别:

  1. 延迟非常低
    引导操作的延迟极小,每秒可以执行成千上万次引导,如果使用 GPU 加速,性能还会更高
  2. 支持“可编程引导(Programmable Bootstrapping)”
    在引导过程中,可以同态地评估一个查找表(LUT)函数,且几乎没有额外开销

如,假设一个密文加密的是一个 4 4 4-bit 的值,即取值范围为 [ 0 , … , 15 ] [0, \ldots, 15] [0,,15] 的整数,那么在引导的同时,可以“免费”地评估任何一个将 4 4 4-bit 输入 映射为 4-bit 输出 的函数。

这意味着在 TFHE 中,同态计算变成了 一系列的加法、乘法和查找表函数的评估。因此:

  • 引导的速度比其他方案快了若干个数量级;
  • 计算可以用更丰富的语言表达
  • 实现复杂函数所需的操作次数更少;
  • 无需像 CKKS 那样通过增加参数规模来支持深层电路

5. 总结

引导(Bootstrapping)技术使得同态计算可以持续不断地进行下去。它的实现依赖于修改密文关联的“等级(level)”与“噪声(noise)”。具体如何修改、其延迟(latency)和吞吐量(throughput)等性能指标,都取决于所采用的具体 FHE 加密方案。

为了总结各种方案下引导的表现,以下我提供了一张对比表,内容摘自目前(2022年11月)所知的相关研究论文。

在这里插入图片描述
其中:

  • [1] 指:2021年论文Bootstrapping for HElib
  • [3] 指:2021年论文Sine Series Approximation of the Mod Function for Bootstrapping of Approximate HE
  • [4]指:Zama团队2022年7月6日博客Announcing Concrete-core v1.0.0-gamma with GPU acceleration

对于表中 BGV 的时间数据(来源于2021年论文Bootstrapping for HElib),使用了 thin-bootstrapping 的计时方式:也就是说,假设每个明文槽(plaintext slot)仅包含一个基本域/环上的元素,而不是扩展域/环的元素。这种形式在实际应用中最具相关性

需要注意的是,对于 BGV,还可以考虑第四种性能度量方式

  • 即引导的摊销成本,涵盖所有明文槽以及未来可以“免费”执行的乘法次数(即无需再次引导)。
    • 在以上表格中未纳入这一项,但可以粗略理解为:将原始吞吐量乘上 15 到 30 的系数,具体取决于使用的参数集合。

2022年论文BASALISC: Flexible Asynchronous Hardware Accelerator for Fully Homomorphic Encryption 中 提出了一种用于 BGV 的硬件加速器设计,它在明文空间为 Z / ( 12 7 3 ) Z Z/(127^3)Z Z/(1273)Z、并具有 64 个明文槽的情况下,实现了 40 毫秒的引导延迟。预计如果为其他同态加密方案也设计专用硬件,加速效果也将达到3 个数量级的提升

至于 CKKS 的引导时间,采用2021年论文Sine Series Approximation of the Mod Function for Bootstrapping of Approximate HE 中的实验数据,其引导误差为 2 − 25 2^{-25} 225

参考资料

[1] Zama团队2022年11月16日博客 Bootstrapping for Dummies

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2372876.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

51单片机入门教程——AT24C02数据存储

前言 本教程基于B站江协科技课程进行个人学习整理,专为拥有C语言基础的零基础入门51单片机新手设计。既帮助解决因时间差导致的设备迭代调试难题,也助力新手快速掌握51单片机核心知识,实现从C语言理论到单片机实践应用的高效过渡 。 目录 …

M0的基础篇之PWM学习

一、困惑 上一节课就是单纯的之配置了一个基础的定时器进行计数,计到一定的数值也就是到了一定的时间就进入中断,执行中断里面的任务,也就是一个最基础的定时的功能 这一节课的定时器产生了一个pwm波。也就是我们可以改变里面高电平的持续时间…

Python----神经网络(基于AlexNet的猫狗分类项目)

一、基于AlexNet的猫狗分类 1.1、项目背景 猫和狗是我们生活中最常见的宠物,它们的图像数据大量存在于互联网上。对此进行分类不仅可以帮助开发自动化宠物识别应用,也可以应用于更广泛的计算机视觉领域。例如,训练良好的模型可以支持流浪动物…

荣耀A8互动娱乐组件部署实录(第1部分:服务端环境搭建)

作者:一位被“只支持安卓”的前端劝退过三次的技术人 前言 这一套组件我拆包已经不止一遍了,老实讲,不支持 iOS 是遗憾,但对于研究 UI 动态加载、资源分离结构和整体架构来说,A8 的这套服务还算完整,服务器…

基于Python Flask的深度学习电影评论情感分析可视化系统(2.0升级版,附源码)

博主介绍:✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&#x1f3…

计算机学习路线与编程语言选择(信息差)

——授人以鱼不如授人以渔 计算机学习公式:1/3科班思维 1/3路线选择 1/3工程能力 好工作随便找(来自B站小毛毛熊) 本文主要是路线选择!!!下面开始吧。 面向岗位学习!到招聘网站看看有哪些…

【redis】redis 手动切换主从

场景一: 测试需要,需要手动切换主从 在redis节点: $ redis-cli -h xx.xx.xx.xx -p XX -a XX shutdown 不要直接关闭redis进程,使用 shutdown ,能在进程关闭前持久化内存中的数据 待主从切换完毕后&#xff1…

第三节:Vben Admin 最新 v5.0 对接后端登录接口(下)

文章目录 前言一、处理请求头Authorization二、/auth/user/info 接口前端接口后端接口三、/auth/codes 接口1.前端2.后端四、测试接口前言 上一节内容,实现了登录的/auth/login 接口,但是登陆没有完成,还需要完成下面两个接口。才能完成登录。 一、处理请求头Authorizatio…

爬虫学习————开始

🌿自动化的思想 任何领域的发展原因————“不断追求生产方式的改革,即使得付出与耗费精力越来愈少,而收获最大化”。由此,创造出方法和设备来提升效率。 如新闻的5W原则直接让思考过程规范化、流程化。或者前端框架/后端轮子的…

Ubuntu18.04搭建samda服务器

一.什么是Samba服务器? Samba服务器是一种基于开源协议实现的网络共享服务软件,主要用于在不同操作系统(如Windows、Linux、Unix)之间实现文件和打印机共享功能。其核心目标是解决跨平台资源共享的兼容性问题,尤其是在…

2025-05-10-FFmepg库裁切有水印的视频

裁后 代码 import subprocess# 文件路径 input_video_path "bg_video.mp4" output_video_path "output_video_cropped.mp4"# 裁剪视频下方的水印 def crop_video(input_video_path, output_video_path, crop_height):# 获取视频的分辨率def get_video…

opencv+opencv_contrib+cuda和VS2022编译

本文介绍使用OpenCV和OpenCV_Contrib源码及Cuda进行编译的过程,编译过程中会用到OpenCV、OpenCV_Contrib、CUDA Toolkit、cuDNN、Cmake、VS2022等工具,最终编译OpenCV的Cuda版本。 一、OpenCV下载地址 OpenCV官网下载地址:https://opencv.org/releases…

网工实验——OSPF配置

网络拓扑图 配置 1.为每个路由器配置接口(略)(详细见RIP实验) 2.配置OSPF AR1 [AR1]ospf [AR1-ospf-1]area 1 [AR1-ospf-1-area-0.0.0.1]network 172.16.1.1 0.0.0.0 #精确配置网络,也可以像下面那条命令那样配置 …

数据库系统概论-基础理论

数据库系统概述: 1、记录:计算机中表示和存储数据的一种格式或方法。 2、数据库(DataBase, DB):数据库是长期储存在计算机内、有组织、可共享的大量数据集合。可为各种用户共享。 3、数据库管理系统(Dat…

从零开始学习人工智能(Python高级教程)Day6-Python3 正则表达式

一、Python3 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 在 Python 中,使用 re 模块来处理正则表达式。 re 模块提供了一组函数,允许你在字符串中进行模式匹配、搜索和替换操作。 r…

Qt开发:项目视图(Item Views)的介绍和使用

文章目录 一、清单视图(List View)1.1 基本概念1.2 使用示例(文字列表)1.3 图标文字(图标模式)1.4 常用设置1.5 完整示例 二、树视图(Tree View)2.1 基本概念2.2 常用类简介2.3 快速…

keepalived详细笔记

keepalived 是一种基于VRRP(虚拟路由器冗余协议)的高可用解决方案,主要是用于服务器的负载均衡和高可用性的保障,自动将服务切换到备份服务器上,确保业务的连续性。 工作原理: VRRP协议:一组路…

xLua笔记

Generate Code干了什么 肉眼可见的,在Asset文件夹生成了XLua/Gen文件夹,里面有一些脚本。然后对加了[CSharpCallLua]的变量寻找引用,发现它被XLua/Gen/DelegatesGensBridge引用了。也可以在这里查哪些类型加了[CSharpCallLua]。 public over…

一周学会Pandas2 Python数据处理与分析-Pandas2数据排序操作

锋哥原创的Pandas2 Python数据处理与分析 视频教程: 2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili Pandas 2提供了多种灵活的数据排序方法,主要针对 DataFrame 和 Series 对象。 1. 按值排序:s…

lvm详细笔记

LVM简介 逻辑卷管理器,是Linux 系统中用于管理磁盘储存的关键技术。 LVM 则打破了磁盘分区一旦确定,其大小调整往往较为复杂,且难以灵活应对业务变化这种限制,它允许用户将多个物理分区组合卷组。例如,系统中的多个物…