企业级 Agent SKILL 最佳实践

news2026/3/28 0:59:34
最近真的是屁颠屁颠地使用Openclaw作为业务核心为客户打造智能体的工作流程包括组织、业务、技术三个全面的转型。同时由于OpenAI的Sora下线年初刚刚建立的AI漫剧工作流资产库以及提示词都需要转换成替代品。还有参加了一个专门为中小企业打造智能转型的组织当讲师。尽管看似三件事但被问到最多的是如何将自己的业务流程SOP写成Skill以及一个企业如何管理这些SKILL。为此在这里将Claude给出最佳编写和管理Skill整理一下重点的内容记录一下。详细请参考如下https://platform.claude.com/docs/zh-CN/agents-and-tools/agent-skills/best-practices在这放上两个目前的好玩SKILL案例第一Claude Skill 有哪些最佳实战编写 Agent Skills 的最佳实践涵盖了从核心原则、结构设计到代码规范和测试评估的多个方面。以下是关键的最佳实践总结1. 核心编写原则保持极致简洁 (Concise is key)上下文窗口是共享资源Skill 的内容需要与系统提示、对话历史等竞争 Token 空间。假设 Claude 已经很聪明只添加 Claude 还不具备的上下文信息避免冗余解释。保持术语一致性在整个 Skill 中选择一个术语并坚持使用例如始终使用“API endpoint”或“extract”以帮助 Claude 准确理解指令。2. 结构与内容组织使用渐进式披露模式将核心指令放在主文件SKILL.md中而将高级功能、表单填写指南、API 参考或使用示例等详细信息分离到单独的文件中如FORMS.md、reference.md等让 Claude 仅在需要时加载。控制 Token 预算为了获得最佳性能主文件SKILL.md的正文应保持在 500 行以内。避免深层嵌套文件引用应保持在“一层深度”例如让SKILL.md直接指向参考文件避免文件间的多层级嵌套指向。编写精准的 YAML 描述name字段最多 64 个字符仅限小写字母、数字和连字符description字段最多 1024 个字符。描述中必须明确说明该 Skill能做什么以及何时使用它。3. 工作流与模式设计提供默认选项与逃生出口如果涉及多种工具或库不要列出过多选项让 Claude 自行决定这会导致混淆。应直接提供一个默认推荐如使用pdfplumber并为特殊情况提供备用方案如为扫描版提供pdf2image。建立明确的工作流与反馈循环对于复杂任务应提供包含具体步骤Step 1, Step 2…的检查清单或工作流并包含验证和反馈环节例如“如果验证失败请返回步骤 2”。使用通用模式根据需求严格程度使用**模板模式Template pattern来规范输出格式或使用条件工作流模式Conditional workflow pattern**来指导 Claude 在不同场景如创建新内容与编辑现有内容下采取不同操作。4. 代码与脚本规范明确声明依赖项不要假设工具或包已经安装应明确列出需要的依赖项如pip install pypdf。脚本应直接解决问题包含清晰的错误处理机制避免出现“魔法数字/未解释的常量”并确保为关键操作提供验证步骤。避免使用 Windows 风格路径在脚本和指令中应始终使用正斜杠/。5. 测试与持续迭代优先构建评估用例至少创建三个包含明确expected_behavior预期行为的评估用例。跨模型与真实场景测试确保 Skill 在实际业务场景中经过测试并且兼容 Haiku、Sonnet 和 Opus 等多个模型。观察与迭代与 Claude 共同迭代开发并仔细观察它在执行时是如何浏览和调用 Skills 的以此来优化设计。第二如何为复杂的任务编写可验证的工作流为复杂的任务编写可验证的工作流核心在于将宏观任务拆解为结构化的步骤并在关键节点强制加入验证机制与反馈循环。根据文档以下是构建此类工作流的最佳实践1. 拆分为明确的、带编号的步骤或检查清单不要给出长篇大论的指令而是使用具体的步骤例如 Step 1, Step 2或检查清单来引导 Claude 线性、无遗漏地执行任务。例如在研究综合Research synthesis工作流中可以明确划分为阅读文档、识别关键主题、交叉验证主张、创建结构化总结以及最终验证引用这几个严谨的步骤。2. 建立可验证的中间产物 (Intermediate Outputs)对于极其复杂的流程在最终输出之前应要求生成可以被独立验证的中间文件。例如在处理复杂的 PDF 表单填写工作流时首先让模型运行分析脚本并将提取出的表单字段结构保存为fields.json。随后在映射数据后再去验证这个 JSON而不是直接生成最终的 PDF。3. 强制执行特定的验证步骤在进行下一步尤其是打包、覆盖或生成最终文件等关键性操作之前明确要求 Claude 运行验证脚本或对照标准进行检查。例如运行映射验证python scripts/validate_fields.py fields.json。文档编辑验证明确指令“立即验证python ooxml/scripts/validate.py”。4. 包含明确的反馈循环 (Feedback loops)这是确保任务“可验证且能自我修正”的最重要一环。你必须明确告诉 Claude如果验证失败该怎么办要求它在质量过关后才能进入下一步。明确的回退路径“如果输出验证失败请返回步骤 2”。强约束条件“如果验证失败仔细阅读错误信息修复 XML 中的问题再次运行验证。只有在验证通过后才继续进行。”内容审查循环“如果发现问题记录具体章节的每个问题修改内容再次回顾检查清单”。5. 针对多分支任务使用条件工作流 (Conditional workflow pattern)如果复杂任务在不同上下文中的处理方式完全不同应在工作流的起点要求模型进行判断并提供对应的工作流分支。 例如文档修改任务的步骤 1 可以是确定修改类型创建新内容→ 遵循“创建工作流”。编辑现有内容→ 遵循“编辑工作流”。通过结合步骤化结构、中间产物、明确的脚本验证以及严格的失败重试逻辑你可以为 Agent 设定清晰的边界和查错机制极大提高其完成复杂任务的准确率与可靠性。第三如何使用视觉分析来增强 Skill 的表单处理能力这两天经常遇到-核心看到不是读到根据提供的文档使用视觉分析来增强 Skill 的表单处理能力尤其是表单布局分析主要通过以下几个关键步骤实现1. 将表单转换为图像 (Convert PDF to images)在处理复杂的 PDF 表单时第一步是将 PDF 页面转换为图像格式。2. 图像分析与字段识别 (Analyze each page image to identify form fields)对转换后的每一页图像进行分析从而定位表单中的各个字段。3. 利用 Claude 的视觉功能 (Claude can see field locations and types visually)通过视觉分析模式Claude 可以直观地“看到”表单的结构直接从图像中识别出字段的具体物理位置及其类型例如文本框、复选框等。这种方式能够极大地弥补纯文本提取在复杂排版中的不足。结合实用脚本 (Utility scripts) 进一步增强为了配合视觉与布局分析最佳实践还建议为 Claude 提供配套的工具脚本来确保处理的准确性使用analyze_form.py脚本来提取 PDF 中的所有表单字段并输出结构化格式。使用validate_boxes.py脚本来检查提取出的边界框bounding boxes是否发生重叠以验证视觉和布局定位的准确度。第四创建SKILL后如何测试和评估评估和测试创建后的 Agent Skill 是确保其高效运行的关键。您可以根据以下几个主要步骤和最佳实践来进行评估1. 构建结构化的评估用例 (Build evaluations first)建议您优先构建具体的评估用例来测试 Skill。一个完整的评估用例可以采用结构化的格式例如 JSON包含以下要素skills指定需要测试的 Skill例如[pdf-processing]。query模拟用户的输入指令例如提取此 PDF 文件中的所有文本并保存到 output.txt。files提供给模型进行测试的具体文件路径例如[test-files/document.pdf]。expected_behavior明确列出多项具体且可验证的预期行为。例如“成功使用适当的库读取 PDF”、“无遗漏地提取所有页面文本”以及“以清晰易读的格式保存到 output.txt”。2. 遵循严格的测试检查清单 (Testing Checklist)在完成 Skill 编写后请对照以下测试标准进行验证用例数量至少创建3 个评估用例。多模型兼容使用您计划使用的所有模型进行测试确保 Skill 在Haiku、Sonnet 和 Opus模型上都能正常工作。真实场景必须在真实的使用场景real usage scenarios下进行测试而不仅仅是简单的理想环境。团队反馈如果适用收集并整合团队人员的反馈意见。3. 持续观察与迭代 (Evaluation and iteration)与 Claude 共同迭代Skill 的开发不是一蹴而就的建议在测试过程中与 Claude 一起不断迭代优化。观察导航行为在测试时仔细观察 Claude 是如何浏览和调用这些 Skill 的。如果发现 Claude 在查找特定文件或执行步骤时遇到困难您就需要回过头去优化 Skill 的描述、文件结构例如检查是否过度嵌套或工作流设计。第五企业级部署SKILL需要有哪些注意在企业级部署 Agent SKILL 时需要从安全治理、质量评估、生命周期管理以及版本控制等多个维度进行严格的把控。以下是企业级部署时需要特别注意的核心事项1. 严格的安全审查与风险控制将 SKILL 部署到生产环境前必须像对待生产系统软件一样进行安全审计特别是对待来自第三方或不受信任来源的 SKILL。风险指标评估重点关注是否包含代码执行脚本如.py,.sh等、网络访问模式获取外部 URL 或 API 调用、硬编码凭据API 密钥或密码、越权的文件系统访问以及对 MCP 服务器和系统工具的调用。审查清单在沙箱环境中运行验证脚本行为检查是否存在要求 Claude 忽略安全规则、隐藏操作或泄露数据的对抗性指令并确保所有凭据都通过环境变量安全管理绝不能硬编码在文件中。2. 建立部署前的全面评估关卡不当的 SKILL 可能会错误触发或干扰其他 SKILL 的运行。在部署前必须对以下维度进行测试关卡审批评估维度验证触发准确性是否在正确的查询时激活、隔离行为、共存性是否会降低其他活跃 SKILL 的性能、指令遵循度以及输出质量。评估要求要求作者为每个 SKILL 提交包含 3-5 个代表性查询的评估套件涵盖应当触发、不应当触发以及模糊边界的情况并在组织使用的多个模型Haiku、Sonnet、Opus上进行充分测试。3. 大规模组织的召回限制与角色化捆绑当系统中有大量 SKILL 活跃时可能会导致模型无法选择正确的 SKILL 或遗漏相关的 SKILL。召回限制每次 API 请求最多支持加载 8 个 SKILL。如果超出单次请求支持的数量应考虑将狭窄的 SKILL 合并为更广泛的 SKILL或基于任务动态路由请求。从具体到合并鼓励最初建立针对特定工作流的狭窄 SKILL当经过评估确认合并后性能不下降时再将其打包合并。基于角色的捆绑包将相关的 SKILL 按照组织角色如销售团队、工程团队、财务团队进行分组打包使每个用户的活跃 SKILL 集保持高度聚焦。为每个 SKILL 建立内部注册表记录其用途、负责人、版本、依赖和评估状态。4. 版本控制与跨平台分发策略单一事实来源将所有的 SKILL 目录自然映射到 Git 中进行源代码控制以实现历史跟踪、拉取请求PR审查和回滚。版本管理在生产环境中应将 SKILL 固定到特定版本。任何更新都应视为需要完整安全审查的新部署并保留上一版本作为备用以便在评估失败时立即回滚。在部署时可计算已审查 SKILL 的校验和进行完整性验证。跨平台注意事项自定义 SKILL不会在各个平台间自动同步例如上传到 API 的 SKILL 在 claude.ai 或 Claude Code 中不可用。如果企业跨多平台部署需依托 Git 作为唯一事实来源建立自己的同步机制来保持各平台一致性。Skill 生命周期管理学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2456253.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…