百度 Agent 安全中心：构筑企业智能体的安全底座

news2026/5/21 1:40:06

本文整理自 2026 年 5 月 14 日 Create2026 百度 AI 开发者大会 - Agent Infra 专题论坛百度智能云云安全产品总经理聂科峰的同名主题演讲。在 AI 生产力加速进化的时代Agent 正在从「会说」快速演进到「会做」。从 Chatbot、Copilot到能够自主执行任务的 Agent再到多 Agent 协同和可信 Agent 基础设施AI 的能力边界在不断扩大。此时安全也从辅助能力变成下一代 AI 基础设施的核心。因为 Agent 不只是生成内容还会调用工具、读写文件、执行命令、连接外部系统所以安全必须覆盖数据、权限、记忆和系统连接等全链路。企业真正需要的是一个可信、可控、可审计并且能持续演进的 Agent 体系。当 Agent 连接到企业生产系统后风险将从内容偏差扩展到执行链路并呈现系统性放大趋势。传统 AI 安全主要聚焦输入与输出环节例如提示词注入防护、敏感信息检测、隐私保护和输出合规但在 Agent 场景下风险已延伸到任务执行全过程。下图中展示了风险演化的五个关键阶段供应链渗透、意图劫持、工具武器化、身份与权限失控、记忆投毒与级联扩散。这意味着Agent 风险已不再是局部、孤立的问题而是会沿着整个链路持续传导。因此Agent 安全必须从传统的输入输出防护升级为覆盖身份、工具、行为、记忆与执行链路的全流程治理体系。如何设计 Agent 安全体系其核心是把安全能力嵌入 Agent 思考、行动到反馈的整个过程。在思考阶段要处理意图对齐、提示注入、上下文隔离和知识检索可信问题在行动阶段要重点保障身份可信、授权合理、调用链安全和工具访问受控在反馈阶段则要关注结果审计、内容防伪、异常检测和反馈数据准入。最后通过统一的控制面把资产、策略、风险、告警和处置集中起来推动 Agent 从效率落地走向信任落地。我们先来看 Agent 安全护栏它贯穿了整个 Agent 生命周期。与传统只关注输入输出不同Agent 护栏需要覆盖 Agent 从输入、理解、规划到工具调用、执行、输出和反馈的完整运行链路。因此我们针对 Agent 的 3 个关键阶段进行了系统的能力设计思考阶段重点解决内容识别、诱导对抗和上下文安全行动阶段重点解决工具行为校验、数据脱敏、权限检测和越权拦截反馈阶段则聚焦回答防护、内容合规、拒答机制和审计匹配。整体来看我们的 Agent 安全护栏具备全流程覆盖、实时拦截、多维防护和可观测可审计四项核心能力从而实现高召回、低误伤的防护效果并在实际场景中得到验证。供应链安全方面Agent 生态在极速扩张以 Skills 为代表的供应链风险是 Agent 生态中的另一类重大风险。Skills 是 Agent 具备执行能力的抓手也是攻击者最喜欢的攻击方式攻击者可以很容易的借助 Skills 植入攻击能力来实施包括窃取凭证、远程代码执行在内的攻击行为。对此我们防护的核心理念是来源可信行为可控 —— 不仅要确保「谁发布的」是可信的更要确保「它实际干了什么」是可控的。这需要构建一条完整的信任链从来源接入、安全检测、权限声明、上架审核、运行监控到风险处置形成六段式的闭环治理流程。在检测能力上我们实现了从静态分析、动态分析以及智能分析的全方位覆盖通过 10 余种分析引擎协同工作确保供应链 Skill 和其它工具是可控的、安全的。截至目前我们已 100% 覆盖 Skill 主流仓库源同步达到分钟级时效性月扫描次数超过 100 万次累计拦截风险超过 1 万次。百度智能云近期正式发布的 Agent 安全中心把分散的 Agent 安全能力整合为统一资产、统一风险、统一策略和统一响应。让企业看得清、管得住、敢放权。Agent 安全中心可以接入和纳管企业的各种 Agent 资产包括企业级自研 Agent 和第三方 Agent以及工具、Skills 等等。我们通过四个维度实现集中化、体系化的 Agent 安全运营从而构建企业级 Agent 安全大脑建立 Agent 与工具的全景视图减少资产盲区通过风险画像和态势分析识别整体风险对异常路径和攻击链进行分析溯源通过策略治理和响应编排推动处置落地。我们知道企业 Agent 安全不能只依赖上线前一次性检查因为 Agent 的工具、权限、数据和业务流程都会持续变化。Agent 安全中心的目标是实现长期治理。我们通过多维安全评估发现模型、指令、工具、数据等各维度风险在运行过程中持续记录活动日志和操作行为确保过程可追溯在审计阶段则围绕权限合规、数据合规、风险报告等形成复核机制。从而将安全治理从阶段性验收提升为持续评估、持续审计和持续处置实现 Agent 全生命周期的安全闭环。目前Agent 安全中心已经在百度内部持续使用并积累了丰富的实践经验。Agent 安全中心覆盖了多类员工场景、业务系统和办公链路确保了从访问、调用到执行都纳入安全保障并形成了可落地的安全运营与响应体系。同时百度智能云的 DuMate、RedClaw、百度 Claw 市场等 Agent 产品和平台也已经全面接入 Agent 安全中心确保企业和个人用得安心。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2630011.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！