CipherChat：基于词元替换的端到端加密大模型对话方案解析

news2026/5/12 22:43:47

1. 项目概述当大模型对话遇上密码学最近在折腾大语言模型LLM应用开发的朋友可能都遇到过同一个头疼的问题如何保证用户和模型之间对话的隐私和安全我们辛辛苦苦搭建的智能客服、个人助理或者创意写作工具用户输入的每一句话从个人健康信息、财务数据到商业机密理论上都会经过我们的服务器。即便我们承诺“绝不查看”技术上依然存在被中间人窃听、服务器被入侵或内部人员滥用的风险。这种“信任危机”成了很多严肃应用落地的一大障碍。正是在这个背景下我注意到了 GitHub 上一个名为RobustNLP/CipherChat的开源项目。这个名字直译过来就是“鲁棒自然语言处理/加密聊天”光看标题就能猜到它的核心野心为 LLM 对话套上一件密码学的“防弹衣”。它不是另一个聊天界面也不是一个微调模型而是一套旨在实现“端到端加密大模型对话”的框架或方案。简单来说它的目标是让用户的提问在离开自己设备前就被加密以密文形式传输并在云端的大模型上完成推理最后再将加密的答案返回给用户解密。整个过程中服务提供商也就是我们开发者看到的只是一堆乱码从根本上杜绝了隐私泄露的可能。这个想法听起来有点“疯狂”毕竟大模型的运作严重依赖对明文语义的理解。但正是这种挑战性让它充满了吸引力。我花了些时间深入研究其架构和实现它不仅仅是一个学术概念验证而是试图提供一套实用的工具链。接下来我将拆解 CipherChat 是如何解决“让模型处理看不懂的密文”这一核心矛盾的并分享在尝试部署和测试过程中的一些实操心得与踩坑记录。2. 核心思路拆解密文如何与模型“对话”刚接触 CipherChat 时最大的疑问就是一个基于统计概率生成文本的大模型如何对加密后失去所有统计特征的乱码进行理解和生成如果完全不可读模型岂不是在瞎猜这里的核心奥秘在于CipherChat 采用的并非传统的、将整个句子变成一坨乱码的加密方式而是精心设计了一套“语义保留的变换”或者说“格式保留加密FPE”的变体。2.1 核心原理词元级替换与动态映射大语言模型如 GPT 系列处理文本的基本单位是“词元”Token可以粗略理解为单词或子词。CipherChat 的核心思路是在词元级别进行操作。构建加密词典首先它会基于目标大模型的词表Vocabulary创建一个“加密映射表”。这个映射表定义了每个原始词元 ID 对应到哪个加密后的词元 ID。关键在于这种映射不是固定的而是会话相关或动态的。例如可以通过一个由用户密码派生的密钥结合一个安全的伪随机数生成器为每次会话生成一个唯一的、双向可逆的映射关系。加密过程客户端用户输入明文句子客户端首先使用标准的分词器Tokenizer将句子拆分成词元序列得到一系列词元 ID。然后根据本次会话的“加密映射表”将每个原始词元 ID 替换成对应的加密词元 ID。最后将这个加密后的词元 ID 序列发送给服务器。对于服务器和模型而言它接收到的就是一个普通的词元 ID 序列只不过这些 ID 对应的“词”在它的词表里看起来是毫无意义的乱码可能对应着一些极低频或生僻的词元。模型推理服务器服务器端的模型照常运行。它接收加密的词元序列作为上下文基于其训练好的权重计算下一个词元的概率分布并生成采样出下一个加密的词元 ID。模型在这个过程中运作完全正常因为它只是在处理它见过的词元 ID 序列并预测下一个可能的 ID。它并不关心这些 ID 在人类看来代表什么单词。解密过程客户端服务器将模型生成的加密词元 ID 序列返回给客户端。客户端使用相同的“加密映射表”进行反向查找将加密 ID 还原为原始的词元 ID再通过分词器解码成人类可读的明文。注意这种方法的安全性建立在“加密映射表”的保密性上。映射表本身或生成它的密钥绝不能泄露。同时它属于一种“词元替换密码”理论上如果模型上下文足够长可能存在被统计分析攻击的风险因此实践中常需结合其他技术如添加随机扰动来增强安全性。2.2 方案选型与优势分析为什么 CipherChat 选择这条技术路径对比其他潜在方案就能看出其权衡同态加密FHE直接在密文上进行计算理论上最安全。但当前全同态加密的计算开销极其巨大将一个大型 Transformer 模型转换为 FHE 电路推理一次可能需要数小时甚至数天完全不实用。安全多方计算MPC将计算分散到多个互不信任的服务器也能保护隐私。但通信开销大协议复杂同样难以应用于百亿参数级别的大模型实时推理。可信执行环境TEE如 Intel SGX。将模型和数据放在受硬件保护的飞地中运行。这要求特定的硬件支持且 TEE 本身历史上出现过一些侧信道漏洞并非绝对可靠。相比之下CipherChat 采用的词元级替换方案其最大优势在于“对模型透明”和“近乎零开销”。模型透明服务器无需修改任何模型架构、权重或推理代码。你可以直接部署一个标准的 Hugging Face Transformers 模型或与 OpenAI API 兼容的模型。开销极低加密和解密过程仅涉及查表操作计算成本可以忽略不计。主要的额外开销仅在于客户端和服务器需要共享同一套分词器以及维护会话映射表的状态。这种设计使得 CipherChat 具备了很强的实用性和可部署性特别适合那些希望快速为现有 LLM 服务增加隐私保护能力的场景。3. 架构与核心组件解析理解了核心原理后我们来看 CipherChat 项目是如何将其工程化的。通常这类项目的架构会清晰地区分客户端和服务端职责。3.1 客户端组件加密网关与会话管理客户端不只是一个简单的网页界面它更是一个轻量的“加密网关”。其主要职责包括分词器同步必须确保客户端使用的分词器与服务器端模型的分词器完全一致同一版本、同一配置。任何细微差别都会导致加密/解密映射错乱产生乱码。项目通常会封装一个分词器模块或明确指定必须使用的分词器类型如cl100k_basefor GPT-4。密钥管理与映射生成会话密钥为每次对话生成一个唯一的会话密钥。这可以基于用户提供的密码通过 PBKDF2 等算法派生或者直接在客户端生成一个随机密钥。映射表生成使用一个密码学安全的伪随机数生成器CSPRNG以会话密钥为种子对模型的整个词表 ID 范围例如 0-100256进行随机洗牌Shuffle生成一个双向的映射表。这个洗牌算法必须是确定性的即相同的种子总是产生相同的乱序这样才能保证加解密的一致性。文本处理流水线用户输入明文 - 客户端分词器 - 明文词元ID序列 - 查加密映射表 - 加密词元ID序列 - 发送至服务器以及反向的解密流程。这个过程需要高效地处理流式输出Token-by-Token以实现打字机效果。3.2 服务端组件标准模型与透明代理服务端的设计追求极简核心是“不做多余的事”。标准模型服务就是一个常规的 LLM 推理服务。可以是加载了transformers库的 PyTorch 模型也可以是vLLM、TGI(Text Generation Inference) 这样的高性能推理服务器。关键点在于它对接收到的词元 ID 序列不进行任何解密操作直接将其视为普通的输入提示Prompt进行处理。API 兼容层为了便于集成CipherChat 的服务端通常会实现与 OpenAI API 兼容的接口如/v1/chat/completions。这样任何兼容 OpenAI 的客户端包括官方的、第三方的理论上都可以通过配置一个代理地址来使用加密服务。服务端在这里扮演了一个“透明代理”的角色接收加密请求转发给底层模型再将加密响应原样返回。状态无关性服务端应该是无状态的Stateless。所有的会话状态即加密映射表都由客户端维护。这符合云原生应用的最佳实践便于水平扩展。3.3 通信协议与数据格式为了保证互操作性需要定义清晰的通信协议。请求体除了标准的model,messages,stream等参数外可能需要一个额外的session_id或key_hint字段用于在多次请求中标识同一会话尽管映射表在客户端但服务器可能需要用它来关联日志或进行限流。更关键的是messages中的content字段传递的已经是加密后的词元 ID 序列通常需要以某种方式序列化如 Base64 编码的整数数组。响应体与标准响应一致choices[0].delta.content流式或choices[0].message.content非流式中包含的也是加密的词元 ID 序列。这种设计下网络传输中看不到任何原始文本所有隐私数据在离开用户设备时就已经被“锁”住了。4. 实操部署与核心环节实现理论讲完了我们来点实际的。如何在本地或云服务器上搭建一个可运行的 CipherChat 环境这里我以使用transformers库和 FastAPI 搭建服务端为例分享关键步骤。4.1 环境准备与依赖安装首先需要一个 Python 环境建议 3.9。创建虚拟环境后安装核心依赖pip install transformers torch fastapi uvicorn[standard] python-multipart # 如果需要更复杂的随机数操作可以安装 numpy 或 cryptography pip install numpy cryptographytransformers和torch是模型加载和推理的基础。fastapi和uvicorn用于构建高效的 Web API 服务器。cryptography库提供了更专业的密码学原语但初期用secrets和random模块Python 标准库进行确定性洗牌也足够。4.2 核心加密/解密模块实现这是客户端逻辑的核心。我们需要实现一个CipherTokenizer类它包装了原始的分词器并增加了加解密功能。import random import base64 from typing import List from transformers import AutoTokenizer class CipherTokenizer: def __init__(self, base_tokenizer: AutoTokenizer, seed_key: str): 初始化加密分词器。 :param base_tokenizer: 原始的分词器对象。 :param seed_key: 用于生成随机映射的种子密钥。 self.base_tokenizer base_tokenizer self.vocab_size base_tokenizer.vocab_size # 使用密钥派生一个整数种子用于确定性随机数生成 self.seed int.from_bytes(seed_key.encode(), big) % (2**32) # 生成加密和解密映射表 self.encrypt_map, self.decrypt_map self._generate_maps() def _generate_maps(self): 生成加密和解密映射表。 # 创建一个从0到vocab_size-1的列表 indices list(range(self.vocab_size)) # 用固定的种子初始化随机数生成器确保可重现 rng random.Random(self.seed) # 随机打乱列表 shuffled indices.copy() rng.shuffle(shuffled) # 构建映射字典 encrypt_map dict(zip(indices, shuffled)) decrypt_map dict(zip(shuffled, indices)) return encrypt_map, decrypt_map def encrypt(self, text: str) - str: 将明文加密为密文词元ID序列Base64编码。 # 1. 分词得到原始词元ID input_ids self.base_tokenizer.encode(text, add_special_tokensFalse) # 2. 通过加密映射表转换 encrypted_ids [self.encrypt_map[token_id] for token_id in input_ids] # 3. 将整数列表序列化为字符串以便传输例如使用Base64 # 先将整数列表转换为字节 byte_data b,.join([str(id_).encode() for id_ in encrypted_ids]) # 或者更紧凑的方式使用struct.pack import struct fmt f{len(encrypted_ids)}I # I表示unsigned int byte_data struct.pack(fmt, *encrypted_ids) return base64.b64encode(byte_data).decode(utf-8) def decrypt(self, encrypted_b64: str) - str: 将Base64编码的密文词元ID序列解密为明文。 # 1. Base64解码并还原为整数列表 byte_data base64.b64decode(encrypted_b64) import struct # 计算有多少个整数每个I占4字节 num_ids len(byte_data) // 4 fmt f{num_ids}I encrypted_ids list(struct.unpack(fmt, byte_data)) # 2. 通过解密映射表转换 decrypted_ids [self.decrypt_map[token_id] for token_id in encrypted_ids] # 3. 解码为文本 return self.base_tokenizer.decode(decrypted_ids, skip_special_tokensTrue)实操心得在实现映射表时务必确保random.Random(seed)的确定性。不同的 Python 版本或操作系统默认的随机数生成器行为可能略有差异。对于生产环境建议使用cryptography库中基于密码学哈希函数如 SHA256的密钥派生函数KDF和确定性随机数生成跨平台一致性更好。4.3 服务端 FastAPI 应用搭建服务端需要提供一个 API 端点接收加密的提示调用模型生成加密的回复。from fastapi import FastAPI, HTTPException from pydantic import BaseModel from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline import torch import base64 import struct app FastAPI(titleCipherChat Server) # 全局加载模型和分词器实际生产环境需考虑优化和卸载 MODEL_NAME gpt2 # 示例模型可替换为其他模型如 meta-llama/Llama-2-7b-chat-hf print(fLoading model {MODEL_NAME}...) tokenizer AutoTokenizer.from_pretrained(MODEL_NAME) model AutoModelForCausalLM.from_pretrained(MODEL_NAME, torch_dtypetorch.float16, device_mapauto) generator pipeline(text-generation, modelmodel, tokenizertokenizer, devicemodel.device) print(Model loaded.) class CipherCompletionRequest(BaseModel): encrypted_prompt_b64: str max_new_tokens: int 100 temperature: float 0.7 app.post(/v1/completions) async def create_completion(request: CipherCompletionRequest): try: # 1. 解码Base64得到加密的词元ID列表 byte_data base64.b64decode(request.encrypted_prompt_b64) num_ids len(byte_data) // 4 fmt f{num_ids}I encrypted_input_ids list(struct.unpack(fmt, byte_data)) # 转换为PyTorch张量 input_tensor torch.tensor([encrypted_input_ids], devicemodel.device) # 2. 使用模型生成注意模型看到的是加密ID with torch.no_grad(): outputs model.generate( input_tensor, max_new_tokensrequest.max_new_tokens, temperaturerequest.temperature, do_sampleTrue, pad_token_idtokenizer.eos_token_id ) # 获取新生成的词元ID排除输入部分 generated_encrypted_ids outputs[0, len(encrypted_input_ids):].tolist() # 3. 将生成的加密ID列表编码为Base64返回 fmt_resp f{len(generated_encrypted_ids)}I byte_resp struct.pack(fmt_resp, *generated_encrypted_ids) encrypted_output_b64 base64.b64encode(byte_resp).decode(utf-8) return {encrypted_completion_b64: encrypted_output_b64} except Exception as e: raise HTTPException(status_code500, detailfGeneration error: {str(e)}) if __name__ __main__: import uvicorn uvicorn.run(app, host0.0.0.0, port8000)这个服务端示例做了简化它假设客户端和服务端共享同一个分词器gpt2并且客户端会自行处理加密映射。服务端只是忠实地对加密的 ID 序列进行生成。4.4 客户端调用示例最后我们看一个简单的客户端脚本如何调用上述服务import requests from cipher_tokenizer import CipherTokenizer # 导入我们上面写的类 from transformers import AutoTokenizer # 初始化 base_tokenizer AutoTokenizer.from_pretrained(gpt2) seed_key MySecretSessionPassword123 # 这应该由用户提供且安全存储 cipher_tokenizer CipherTokenizer(base_tokenizer, seed_key) # 加密用户输入 plain_text 你好请用Python写一个快速排序函数。 encrypted_prompt cipher_tokenizer.encrypt(plain_text) print(f加密后的提示Base64: {encrypted_prompt[:50]}...) # 调用服务端API api_url http://localhost:8000/v1/completions payload { encrypted_prompt_b64: encrypted_prompt, max_new_tokens: 150, temperature: 0.8 } response requests.post(api_url, jsonpayload) if response.status_code 200: result response.json() encrypted_completion result[encrypted_completion_b64] # 解密模型回复 decrypted_text cipher_tokenizer.decrypt(encrypted_completion) print(f模型回复解密后: {decrypted_text}) else: print(f请求失败: {response.status_code}, {response.text})至此一个最基本的 CipherChat 流程就跑通了。用户输入在本地被加密服务器处理密文并返回密文最终在本地解密得到结果。5. 深入探讨安全性、局限性与增强方案在兴奋地跑通 Demo 之后我们必须冷静下来审视这种方案的安全边界和潜在问题。密码学领域有一句名言“不要自己发明密码系统”。CipherChat 的核心思路虽然巧妙但需要经过严格的安全评估。5.1 潜在的安全风险分析词频分析与统计攻击尽管每个词元被随机替换但模型生成的词元序列仍然保留了原始语言的统计特性如词元共现频率、n-gram 概率。一个拥有大量密文-明文对照样本的攻击者已知部分对话理论上可以通过统计分析尝试破解词元映射表。这类似于古典密码学中的“替换密码”虽然密钥空间巨大词表大小的阶乘但并非无条件安全。侧信道信息泄露长度泄露加密后的词元序列长度与明文序列长度完全一致。攻击者可以通过观察响应长度、生成时间流式输出时每个 Token 的间隔来推测回复的复杂程度甚至大致内容。模型行为泄露某些特定的加密 ID 序列可能会触发模型的特殊行为模式如重复、截断这些模式可能间接泄露信息。密钥管理与分发会话密钥的安全生成、存储和分发是一个经典难题。如果密钥在客户端生成如何安全地同步给多个设备如果基于用户密码派生弱密码则会导致映射表容易被暴力破解。5.2 性能与实用性考量词汇表外OOV问题分词器可能会将某些词特别是新词、专有名词或特定语言的词汇拆分成多个子词词元。加密映射是在词元级别进行的这本身没有问题。但需要确保整个系统客户端和服务端对同一文本的分词结果绝对一致否则加解密会失败。流式传输的复杂性为了实现打字机效果需要流式传输每个新生成的词元。这意味着客户端需要不断解密单个词元并实时渲染。这对前端实现和网络连接的稳定性提出了更高要求。模型兼容性该方法严重依赖于分词器的一致性。如果服务端升级了模型或分词器版本客户端必须同步升级否则整个加密通道会断裂。这增加了系统维护的复杂度。5.3 增强安全性的可行方案针对上述风险社区和研究者提出了一些增强方案引入随机填充Padding在加密前向明文词元序列中随机插入一些“哑元”Dummy Tokens在解密后再移除。这可以扰乱长度信息增加统计分析的难度。但需要设计巧妙的方案确保哑元能被正确识别和移除。分层加密或混淆不直接对原始词元 ID 进行一对一映射而是采用更复杂的变换。例如将多个词元 ID 打包成一个“块”对这个块进行加密然后再映射回词表范围内的 ID。这增加了破解的复杂度。与安全硬件结合将最敏感的解密环节甚至部分模型的前几层放置在客户端的可信执行环境TEE中。这样即使服务器完全不可信也能提供更强的保障。但这牺牲了方案的轻量性和通用性。使用经过验证的密码学库在实现随机数生成、密钥派生等核心密码学操作时务必使用像cryptography这样的成熟库避免自己实现可能引入漏洞。重要提示CipherChat 或类似方案目前更适合作为深度防御策略中的一环用于防范服务器提供商内部的数据滥用或简单的网络嗅探。如果面对的是拥有强大算力、能够收集海量对话数据的国家级攻击者其安全性仍需进一步研究和论证。在涉及极端敏感信息的场景下应咨询专业的安全审计人员。6. 典型应用场景与扩展思考尽管存在挑战CipherChat 所代表的“隐私保护型 LLM 推理”方向在多个场景下有着明确且迫切的需求。6.1 核心应用场景企业级内部知识问答与客服企业希望部署 LLM 来帮助员工查询内部文档、代码库或客服知识库。这些信息往往涉及商业机密。通过 CipherChat 方案可以确保员工的查询内容可能包含未公开的项目信息和模型的回答基于机密文档生成在传输和服务器处理过程中始终处于加密状态企业 IT 或云服务商都无法窥探。个人健康与法律咨询助手用户可以向 AI 助手咨询非常私密的健康问题或法律困境。端到端加密保证了这些敏感对话内容不会被服务提供商记录、分析或用于模型训练消除了用户最大的隐私顾虑。安全代码审查与生成开发者希望 AI 协助审查或生成包含公司核心算法、密钥逻辑的代码片段。加密通道可以防止代码片段在服务端被存储或泄露。跨组织协作两个或多个组织希望共同使用一个强大的 LLM 服务来处理涉及双方敏感数据的任务如联合合同审核。加密方案可以确保任何一方的数据都不会以明文形式暴露给另一方或服务提供商。6.2 与现有技术的结合与扩展CipherChat 不是一个孤立的方案它可以与其它隐私计算技术结合形成更强大的解决方案。与模型压缩/蒸馏结合为了进一步降低延迟和成本可以将大型模型蒸馏为更小的“学生模型”部署在服务端。加密通信保证了即使小模型被泄露攻击者也无法从模型权重中反推出原始训练数据或用户对话。作为联邦学习的前置环节在联邦学习场景中多个客户端在本地训练模型更新。CipherChat 可以用于加密客户端与中央服务器之间交换的模型更新梯度或参数增加另一层隐私保护。构建去中心化推理网络设想一个点对点的网络每个节点既可以是客户端也可以是服务端提供算力。CipherChat 可以确保节点之间相互处理请求时无法得知对方请求的具体内容保护了网络参与者的隐私。6.3 对未来发展的思考当前 CipherChat 的实现更多是一种“工程巧思”。未来的发展可能沿着以下几个方向标准化与协议化需要形成一套标准的 API 协议、密钥交换协议和加密格式以便不同的客户端和服务端能够互操作。类似于 Signal 协议对即时通讯的革新。硬件加速与专用芯片如果这类加密推理需求成为主流可能会出现专门优化了此类“密文词元处理”的 AI 加速芯片在保证安全的同时将性能损耗降到最低。形式化安全证明学术界需要对其安全性进行更严格的形式化定义和证明明确其在何种威胁模型下是安全的安全边界到底在哪里。更强大的攻击与防御研究随着方案的普及必然会出现更强大的攻击方法如利用模型注意力机制的侧信道。这将推动防御技术的不断演进形成一场“道高一尺魔高一丈”的竞赛。7. 常见问题与排查技巧实录在动手实现和测试 CipherChat 的过程中我遇到了不少坑。这里把一些典型问题和解决方法记录下来希望能帮你节省时间。7.1 加解密结果不一致或产生乱码这是最常见的问题根本原因几乎都是分词器不一致或映射表不同步。症状客户端解密后得到的是完全无意义的乱码或者部分词语错误。排查步骤确认分词器型号和版本客户端和服务端必须使用完全相同的分词器。检查AutoTokenizer.from_pretrained(MODEL_NAME)中的MODEL_NAME是否一字不差。即使是同一个模型家族如Llama-2-7b聊天版本-chat-hf和基础版本的分词器也可能有细微差别。验证分词结果在客户端和服务端分别用同一句简单文本如“Hello, world!”调用tokenizer.encode()检查得到的input_ids列表是否完全一致。检查映射表生成确保用于生成映射表的seed_key在加密和解密两端是完全相同的字符串。任何差异如空格、大小写、编码都会导致生成截然不同的随机序列。建议在调试阶段将seed_key硬编码并打印出前几对映射关系进行比对。注意特殊词元分词器会有一些特殊词元如bos_token(开始)、eos_token(结束)、pad_token(填充)。在加密时要明确决定是否对这些特殊词元进行映射。通常建议将它们排除在映射范围之外或者固定映射到自身以避免混淆模型对序列结构的理解。7.2 服务端模型生成效果变差或行为异常当模型处理加密 ID 时其生成质量可能会下降。症状回复变得不连贯、重复、偏离主题或者非常简短。可能原因与解决温度Temperature参数加密破坏了词元在嵌入空间的自然语义关联。原本“高温度”会增加多样性但在加密空间里高温度可能导致模型在毫无关联的“乱码词元”中随机跳跃输出更不可控。尝试将温度参数调低如从 0.8 降到 0.3让模型输出更确定、更“保守”的加密词元序列。重复惩罚Repetition Penalty由于加密模型可能更不容易“察觉”到自己在重复导致输出陷入循环。可以适当增加重复惩罚参数。提示工程Prompt Engineering失效我们精心设计的提示词如“你是一个有帮助的助手...”在被加密后对模型而言变成了无意义的符号序列其引导作用可能大大减弱。这是该方案的一个本质局限。一种缓解方法是在服务端解密提示词但这违背了隐私原则。折中的办法是设计一套“加密空间的提示词”即找到一组在加密后依然能有效引导模型的加密 ID 序列但这需要大量的实验和调优非常困难。7.3 性能与延迟问题症状响应速度明显慢于明文推理。排查映射表查找开销加解密过程中的字典查找encrypt_map[token_id]在序列很长时可能成为瓶颈。可以考虑将映射表存储为Python list或numpy array通过索引O(1)访问比字典更快。序列化/反序列化开销Base64 编码解码和struct.pack/unpack操作有开销。对于极高性能场景可以考虑使用更高效的二进制协议如 MessagePack直接传输整数数组。流式传输延迟在流式响应中每个词元生成后都需要立即返回。这要求服务端的推理引擎支持真正的流式生成如vLLM并且网络往返时间RTT要足够小。加密解密操作必须非常快不能成为流水线的阻塞点。7.4 安全相关注意事项密钥绝不能出现在日志中确保seed_key或任何派生的中间密钥不会被打印到应用日志、标准输出或任何可能被持久化的地方。使用安全的随机源在生成映射表种子时使用secrets.token_bytes或cryptography库的随机数生成器而不是普通的random模块。考虑前向安全性如果会话密钥泄露之前所有用该密钥加密的对话都能被解密。对于高安全需求可以考虑为每条消息或每个回合使用不同的密钥基于一个主密钥派生实现前向安全。传输层安全TLS仍是必须的CipherChat 保护的是“应用层”的数据内容防止服务端窥探。但网络传输过程中的完整性、防篡改和防中间人攻击仍然需要依赖 HTTPSTLS来保障。务必为你的 API 启用 TLS。折腾 CipherChat 的过程更像是一次在 AI 应用安全和实用主义之间的探索之旅。它向我们展示了一种在现有技术栈上快速增加隐私保护层的可能性虽然还不完美但为许多受困于数据隐私问题的 LLM 应用场景打开了一扇窗。真正的生产级部署还需要在安全性、用户体验和系统稳定性之间做大量的打磨和权衡。如果你正在开发涉及敏感数据的 AI 应用不妨从这个思路出发结合自身业务的实际威胁模型设计出最适合你的隐私保护方案。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2607427.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！