第47篇:AI提示工程高级技巧——思维链、少样本学习与角色扮演(操作教程)
文章目录前言环境准备分步操作技巧一思维链 (Chain-of-Thought, CoT)技巧二少样本学习 (Few-Shot Learning)技巧三角色扮演 (Role Playing)完整代码示例综合应用踩坑提示总结前言在AI应用开发中我们常常遇到这样的困境给模型的指令明明很清晰但输出的结果却总是差那么点意思要么逻辑混乱要么答非所问。我早期做聊天机器人时就经常被这种“看似懂了实际没懂”的情况折磨。后来才发现问题往往不在模型本身而在于我们与模型“对话”的方式。今天我们就来深入聊聊三个能显著提升大语言模型LLM表现的高级提示技巧思维链、少样本学习和角色扮演。掌握它们你就能像调教一位聪明的实习生一样让AI的输出质量产生质的飞跃。环境准备本文的示例将主要使用 OpenAI 的 GPT 系列模型 API 进行演示。你需要准备一个 OpenAI API Key这是调用模型的基础。Python 环境建议使用 Python 3.8。必要的库主要使用openai官方库。通过pip install openai安装。首先让我们设置好基础环境importopenaiimportos# 请将你的 API Key 设置在环境变量中或直接替换字符串不推荐有安全风险openai.api_keyos.getenv(OPENAI_API_KEY)# 定义一个简单的调用函数方便后续演示defget_completion(prompt,modelgpt-3.5-turbo):messages[{role:user,content:prompt}]responseopenai.ChatCompletion.create(modelmodel,messagesmessages,temperature0,# 温度设为0使输出更确定便于调试)returnresponse.choices[0].message[content]分步操作技巧一思维链 (Chain-of-Thought, CoT)核心思想引导模型像人一样将复杂问题分解为多个推理步骤而不是直接给出最终答案。这对于数学、逻辑推理、复杂分析类任务效果拔群。基础用法在提示词中明确要求模型“逐步思考”。# 一个糟糕的提示示例直接提问bad_prompt Q一个市场有苹果和橘子。苹果比橘子多5个。如果总共有23个水果苹果有多少个 A print(get_completion(bad_prompt))# 输出可能直接是“苹果有14个。” 模型可能蒙对但过程不可靠。# 使用思维链的提示cot_prompt Q一个市场有苹果和橘子。苹果比橘子多5个。如果总共有23个水果苹果有多少个 请逐步推理。 A让我们一步步思考。 print(get_completion(cot_prompt))输出示例设橘子的数量为 O。那么苹果的数量就是 O 5。水果总数是苹果和橘子之和 (O 5) O 23。合并同类项 2O 5 23。两边减去5 2O 18。两边除以2 O 9。所以苹果的数量是 O 5 9 5 14。答案苹果有14个。进阶用法——零样本思维链对于足够强大的模型如 GPT-4你甚至可以在指令中直接加入“让我们一步步思考”这句话就能激发其思维链能力无需提供示例。zero_shot_cot_prompt Q小明每天存2元钱。他存了10天后用一半的钱买了一本书然后又每天存3元。再过5天他一共有多少钱 让我们一步步思考。 print(get_completion(zero_shot_cot_prompt,modelgpt-4))技巧二少样本学习 (Few-Shot Learning)核心思想通过给模型提供少量的输入-输出示例让它“照葫芦画瓢”理解任务的具体格式、风格和规则。这在模型需要遵循特定格式或处理它不熟悉的任务时特别有效。操作步骤在提示词中先提供几个例子再给出你的新问题。few_shot_prompt 请将以下中文电商评论的情感分类为“正面”、“负面”或“中性”。 示例1 评论 “手机拍照效果太惊艳了夜景模式很强。” 情感 正面 示例2 评论 “物流慢得离谱一周才到包装还破了。” 情感 负面 示例3 评论 “商品和描述的一样没什么特别的感受。” 情感 中性 现在请分类新的评论 评论 “电池续航没有宣传的那么久但屏幕素质确实不错。” 情感 print(get_completion(few_shot_prompt))输出示例中性或混合偏中性模型能理解其中的矛盾点。关键点示例的选择至关重要。它们应该覆盖多样性涵盖任务可能的不同情况。明确清晰输入和输出的对应关系要一目了然。与目标一致示例的格式就是你希望得到的格式。技巧三角色扮演 (Role Playing)核心思想为模型赋予一个特定的角色或身份约束其回答的角度、知识范围和语言风格。这能让回答更具专业性、沉浸感或符合特定需求。基础用法在提示词开头明确指定角色。role_play_prompt 你是一位资深、幽默的科技产品测评博主擅长用生动比喻和日常场景讲解复杂参数。请用你的风格评价以下手机特性 “这款手机采用了最新的骁龙8 Gen 2处理器和LPDDR5X内存。” print(get_completion(role_play_prompt))输出示例“好家伙这心脏和血管可够顶的骁龙8 Gen 2就好比请了F1赛车手来给你跑外卖甭管是狂野飙车大型游戏还是同时接八个单多任务处理它都能给你安排得丝滑流畅还省电相对而言。配上LPDDR5X这条‘高速公路’数据吞吐量堪比春运高铁站App秒开、照片秒处理那种‘等’的感觉基本上可以告别了。”进阶用法——结合系统消息在使用ChatCompletion API时system消息是设定角色的绝佳位置能更稳定地塑造模型行为。defget_completion_with_role(system_role,user_input,modelgpt-3.5-turbo):messages[{role:system,content:system_role},{role:user,content:user_input}]responseopenai.ChatCompletion.create(modelmodel,messagesmessages,temperature0.7,# 适当调高温度让风格更生动)returnresponse.choices[0].message[content]# 定义角色system_prompt你是一位言辞犀利、观点独到的古典文学教授喜欢引经据典对学生要求严格。user_input请简要评价《三国演义》中曹操这个人物。print(get_completion_with_role(system_prompt,user_input))完整代码示例综合应用让我们设计一个综合应用场景一个AI商业顾问需要分析一段简短的用户评论并以结构化、专业的报告形式输出。我们将结合少样本学习教它报告格式、角色扮演赋予顾问身份和思维链要求分步分析。defai_business_consultant_analysis(comment): 综合运用三种提示技巧的商业评论分析函数。 system_role你是“智策”咨询公司的资深AI商业顾问。你的任务是冷静、客观地分析客户提供的市场文本信息并生成简短的专业分析报告。你思维严谨注重数据逻辑。few_shot_examples 请根据以下示例格式进行分析 示例评论 “最近‘即食燕窝’在短视频平台广告很多但评论区有人说性价比低怀疑功效。” 分析报告 【趋势观察】即食燕窝品类正通过短视频渠道进行密集营销推广。 【潜在风险】1. 产品价值功效受到消费者质疑可能存在信任危机。2. “性价比低”的反馈可能影响复购率。 【行动建议】1. 进行透明的成分与功效认证沟通。2. 评估定价策略或推出小规格试用装降低初次体验门槛。 示例评论 “我们办公室最近有3个同事都买了同一款国产电动升降桌说健康办公。” 分析报告 【趋势观察】健康办公理念在特定职场群体如白领中渗透带动电动升降桌等产品需求。 【潜在机会】1. 该产品可能通过口碑同事推荐在封闭社群中快速传播。2. “国产”标签可能暗示其具备价格或供应链优势。 【行动建议】1. 研究职场社群营销策略。2. 突出产品的健康收益与国产性价比优势进行宣传。 cot_instruction请按以下步骤思考1. 提取关键事实与情绪。 2. 推断背后的商业现象或模式。 3. 分析可能的原因或影响。 4. 形成建议。user_promptf{few_shot_examples}{cot_instruction}现在请分析以下新的评论 评论“{comment}” 分析报告 messages[{role:system,content:system_role},{role:user,content:user_prompt}]responseopenai.ChatCompletion.create(modelgpt-4,messagesmessages,temperature0.2,# 较低温度保证报告风格稳定专业)returnresponse.choices[0].message[content]# 测试test_comment“我发现家附近新开了两家‘宠物烘焙店’主打宠物生日蛋糕生意看起来不错。”print(ai_business_consultant_analysis(test_comment))预期输出结构【趋势观察】宠物拟人化消费升级宠物食品向精致化、仪式化生日场景发展。【潜在机会】1. “线下店”形式增强了体验与信任感。2. 聚焦细分场景生日打造爆款。3. 社区店模式可能拥有稳定客源。【行动建议】1. 调研本地养宠人群密度与消费能力。2. 考虑“烘焙轻医疗/美容”的复合业态增加粘性。3. 开发线上预订、定制化服务。踩坑提示思维链的过度使用对于极其简单的任务要求逐步思考反而可能让输出变得冗长甚至引入不必要的错误。技巧根据任务复杂度决定是否使用CoT。少样本示例的偏见你提供的示例会极大影响模型。如果示例全是正面模型可能倾向于预测正面。技巧确保示例集平衡且具有代表性。角色冲突同时赋予模型多个矛盾的角色如“严谨的科学家”和“搞笑段子手”会导致输出混乱。技巧一次只定义一个核心角色保持指令一致性。Token消耗少样本学习和详细的思维链会显著增加提示词的长度从而增加API调用成本和可能触及上下文长度限制。技巧精炼示例对于长上下文模型如GPT-4-128k可以放入更多示例对于短上下文模型要精选核心示例。温度Temperature参数思维链和少样本学习通常需要确定性更高的输出temperature0~0.3而角色扮演为了风格多样可以适当调高temperature0.7~0.9。需要根据目标灵活调整。总结提示工程不是玄学而是与大型语言模型高效协作的“编程语言”。思维链赋予了模型推理的逻辑骨架少样本学习提供了模仿的具体样板角色扮演则设定了表达的边界和风格。三者结合你就能从“向一个黑盒提问”转变为“指导一个高度可定制的智能体工作”。在实际项目中我通常这样开始先尝试角色扮演零样本思维链如果效果不理想再加入一两个精挑细选的少样本示例。多实验、多迭代记录下哪些提示模式对你的特定任务最有效逐渐形成你自己的“提示词工具箱”。如有问题欢迎评论区交流持续更新中…
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2549346.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!