收藏备用!小白程序员必看:从基础到进阶,彻底吃透Prompt与提示工程

news2026/4/7 10:00:47
本文将从基础入门到进阶实操全面拆解Prompt的核心知识点涵盖概念定义、分类维度、核心要素、工作原理以及可直接套用的实用提示工程方法。全程避开晦涩术语用程序员易懂的表述搭配具体案例适配刚接触大模型的小白无论是日常用AI提效还是后续深入学习大模型交互都能快速上手、直接复用建议收藏备用避免用到时找不到Prompt作为引导AI生成目标响应的核心载体是我们与大模型沟通的“关键桥梁”而提示工程则是优化这份“沟通话术”、让AI精准get需求的核心技巧。对于程序员而言掌握Prompt不仅能提升日常开发、文档撰写的效率更是后续深入大模型应用的基础。本文专为小白程序员打造用通俗语言实操案例把Prompt相关知识点讲透助力大家高效利用大模型提升学习和工作效率。什么是PromptPrompt提示是模型接收以生成响应或完成任务的初始文本输入。给AI一组Prompt输入用于指导模型生成响应以执行任务。这个输入可以是一个问题、一段描述、一组关键词或任何其他形式文本用于引导模型产生特定内容的响应。根据可解释性、交互方式和应用领域三个方面可对Prompt 进行分类。可解释性分类硬提示和软提示硬提示hard prompt 是手工制作的、预定义的带有离散输入标记的文本或者文本模板。在很大程度上是静态的一种硬编码的提示它指示代理(Agent或模型)执行哪些操作。一般来说模板包括: 定义了可以访问哪些工具何时应该调用这些工具以及一般的用户输入。软提示soft prompt 是在提示调优过程中创建的,不能在文本中查看和编辑其包含一个嵌入或一串数字代表从大模型中获得的知识。软提示可以替代额外的训练数据。交互方式分类在线提示和离线提示在线提示Online prompt 是在与模型的实时互动中提供的提示通常用于即时的交互式应用。用户可以逐步输入、编辑或更改提示在在线聊天、语音助手、实时问题回答等应用中常见。离线提示Offline prompt 是预先准备好的提示通常在用户与模型的实际互动之前创建。在离线文本生成、文章写作、大规模数据处理等应用中常见。应用领域分类以下是一些常见的类别•Information Retrieval (信息检索): 这些 prompt 用于从模型中检索特定信息如回答问题、提供事实或解释概念。•Text Generation (文本生成):用于指导模型生成文本可能是文章、故事、评论等。•Translation (翻译):用于将文本从一种语言翻译成另一种语言。•Sentiment Analysis (情感分析):用于评估文本的情感倾向如正面、负面或中性。•Programming and Code Generation (编程和代码生成):用于生成计算机程序代码或解决编程问题。•Conversation (对话):用于模拟对话或聊天并回应用户提出的问题或评论。•Task-Specific (特定任务):针对特定应用或任务如制定旅行计划、编写营销文案、生成报告等。•Custom Applications (自定义应用):针对特定领域或自定义应用具体用途由用户定义。Prompt 的一般要素一个Prompt 基本包含6个要素任务上下文示例角色格式和语气而且这些要素是按重要性降序排列的。示例3个月训练计划任务生成一份个性化3个月体能训练计划每周5天包含力量、有氧和柔韧性训练上下文目标是减重8公斤并提升马拉松完赛能力。我是一名32岁男性身高175cm体重78公斤有基础健身经验但膝盖曾受伤。每周可支配训练时间约6小时家中有一对哑铃和跑步机示例第1-4周基础期- 周一上肢力量俯卧撑3组×12次哑铃划船3组×15次 拉伸15分钟- 周三有氧慢跑30分钟心率140-150次/分- 周五核心训练平板支撑3组×60秒 瑜伽20分钟...角色专业运动教练擅长伤病预防和个性化方案设计格式Markdown表格列包括周期/周次、“训练日”、“训练内容”、“强度(RPE)”、“注意事项”语气专业但鼓励强调循序渐进和安全第一1. 任务任务描述是由动词引导例如generate, drive, write, analyze等而且需要明确任务目标。例如2. 上下文一般描述背景信息希望结果是什么样子以及处于怎样的环境中例如3. 示例在提示中包含例子能产生更高质量的答案。 例如4. 角色希望AI所扮演的角色。例如5. 格式比如希望得到要点、段落、标记、代码块等格式。6. 语气如音调类型。在这6个要素中任务是必须的上下文和示例非常重要而且最好也要有角色、格式和语气。下面是一个电子邮件示例任务 (Task)撰写一封邮件向CEO汇报Apple Car预售成绩上下文 (Context)你是苹果高级产品营销经理Apple Car与特斯拉合作发布预售量12,000台超目标200%收件人是Tim Cook示例 (Exemplar)必须包含tl;dr摘要、项目背景、量化业务结果、致谢产品/工程团队角色 (Persona)苹果高级产品营销经理格式 (Format)一封邮件语气 (Tone)清晰简洁自信且友好Prompt 的工作原理在理解Prompt工作原理之前需要理解大模型是如何生成文本的。例如假设想让“Paris is the city…”这句话继续写下去。如下图先把输入语句通过分词器转为向量表示然后给到LLMLLM根据学习到的词库数据预测下一个单词的逻辑值逻辑值通过函数变换为概率值最后根据选择策略选出合适的单词。其中token表示词元(可以简单理解为某个单词或字符的向量表示)logits表示逻辑值(可以理解为token的逻辑值)logits可以使用softmax函数转换生成token的概率也就是把logits利用softmax变为概率值用来表示某个token出现的概率。假设选择top 5的输出token如下Paris is the city of love.Paris is the city that never sleeps.Paris is the city where art and culture flourish.Paris is the city with iconic landmarks.Paris is the city in which history has a unique charm.然后 有不同的策略来选择token。贪婪采样 (greedy sampling)简单来说贪婪采样的模型在每一步都选择概率最高的词语并基于选择的词语继续生成文本。如示例中生成的输出可能是Paris is the city of the future.束搜索 (Beam Search)在beam搜索中模型假设一组最有可能的前“k”个token这组k个token被称为“beam”。模型通过为每个token生成可能的序列并通过扩展每个beam在文本生成的每个步骤中跟踪它们的概率来生成可能的序列直到达到生成文本的所需长度或者每个beam遇到一个“终止”标记。模型会从所有beam中选择具有最高整体概率的序列作为最终输出。从算法的角度来看创建beam就是扩展一个k叉树。在创建beam之后选择具有最高整体概率的分支作为最终输出。示例中生成的输出可能是Paris is the city of history and culture.随机采样 (probability sampling)简单来说就是通过选择一个随机值并将其映射到所选的词汇来选择下一个词。可以将其想象为旋转轮盘每个词汇的区域由其概率决定。概率越高选中该词的机会越大。带温度的随机采样 (ramdom sampling with temperature)一般使用softmax函数将logit转换为概率。在这个时候为随机采样引入了温度参数(一种影响文本生成随机性的超参数)。在引入温度之后与典型的softmax不同于分母除以了温度T。温度越高趋向1输出结果会更加多样化而温度越低趋向0输出结果则更加集中并更具确定性。当T 1的时候演变为最初使用的softmax函数。TopK采样 (Top-k sampling)只对前k个token进行温度下的随机抽样。TopP采样 (Top-P sampling)top-p采样不是指定一个固定的“k”个令牌数而是使用一个概率阈值“p”。该阈值代表希望在采样中包括的累积概率。模型在每个步骤中计算所有可能令牌的概率然后按照降序的方式对它们进行排序直到它们的概率之和超过指定的阈值。top-p采样的优势在于它允许根据上下文进行更动态和自适应的标记选择。每步选择的标记数量可以根据该上下文中token的概率而变化这可以产生更多样化和更高质量的输出。Prompt 工作机制在预训练语言模型中解码策略对于文本生成非常重要。有多种方法来定义概率又有多种方法来使用这些概率。温度控制了解码过程中token选择的随机性。较高的温度增强了创造力而较低的温度则关注连贯性和结构。Prompt 的本质是语义特征的显式表达 Prompt 的工作机制很可能只是影响大模型所选择生成文本token的概率。由于大模型在很大程度上是一个黑盒子其涌现特性具有难解释性而海量的数据关系很难抽象出确定性的特征只能是概率性结果。用户的需求千变万化并且对于需求的表达更是极具多样性。因此 Prompt 在某些限定领域才存在一些通用的表达方式。什么是提示工程提示工程Prompt Engingering是指如何与 LLM 通信的方法以引导其行为向所期望的结果而无需更新模型权重。提示工程关注提示词的开发和优化帮助用户将大模型用于各场景和研究领域。提示工程包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性也可以赋能大语言模型比如借助专业领域知识和外部工具来增强大语言模型能力。提示工程Prompt Engingeering基本方式1、Zero-shot Prompting即没有任何示例说明所需(期望)的输出。例如可以向模型提供一个句子并期望它输出该句子的情感- Prompt: Classify the text into neutral, negative, or positive.- Text: I think the vacation is okay.- Output: Neutral2、Few-shot Prompting是提供给模型少量高质量的示例这些示例包括目标任务的输入和期望输出。few-shot 通过在提示中提供演示来指导模型执行任务。示例- Prompt: A whatpu is a small, furry animal native to Tanzania.An example of a sentence that uses the word whatpu is:We were traveling in Africa and we saw these very cute whatpus.3、instruction Prompting指令提示旨在向模型提供指令提示示例。指令提示使用任务说明输入真实输出元组对预训练模型进行微调以使模型更好地与用户意图对齐并遵循说明。示例- Prompt: Define Onomatopoeia in one sentence.- Output: Onomatopoeia is the use of words that imitate or suggest the natural sound of a thing or action.Prompt Engingeering的组合方式主要包括思维链CoT 和 递归提示 Recursive Prompting等。1、Chain-of-Thought Prompting CoTCoT提示生成一系列短句即被称为推理链的句子。这些句子描述了逐步推理逻辑导致最终答案对于复杂推理的任务和较大的模型可获得更多的好处。常见的两种基本CoT提示包括Few-shot CoT 和 Zero-Shot CoT。Few-shot CoT 允许模型查看一些高质量推理链的演示。例子Zero-shot CoT在提示中添加了“让我们逐步思考”有助于提高模型性能。例子Prompt:I went to the market and bought 10 apples. I gave 2 apples to the neighbor and 2 to the repairman. I then went and bought 5 more apples and ate 1. How many apples did I remain with?- **Lets think step by step.**Output:- First, you started with 10 apples.-You gave away 2 apples to the neighbor and 2 to the repairman, so you had 6 apples left.-Then you bought 5 more apples, so now you had 11 apples.-Finally, you ate 1 apple, so you would remain with 10 apples.2、 Recursive Prompting递归提示可以使用少量提示方法将复杂问题分解为子问题然后顺序解决提取的子问题使用前一个子问题的解决方案来回答下一个子问题。这种方法可以用于数学问题或问答等任务其中语言模型需要能够将复杂问题分解为更小、更易管理的部分以得出解决方案。例如Calculate the product of the length and width:prompt: What is the product of 8 and 6?answer: 48Substitute the given values for length and width into the equation:prompt: What is the area of a rectangle with length 8 and width 6?answer: The area of a rectangle with length 8 and width 6 is 48.recursive prompting 的更多示例 如下3、思维树Tree of Thought思维树Tree of Thought通过探索每一步的多种推理可能性来扩展 CoT。首先将问题分解为多个思维步骤并在每个步骤中生成多个思维实质上是创建一个树形结构。搜索过程可以是广度优先过程或深度优先的过程而每个节点的评估分类器可以通过Prompt提示的方式完成。4、自动提示设计一般而言Prompt 相当于一系列前缀令牌它们增加了在给定输入时获得所需输出的概率。因此可以将它们视为可训练的参数并通过梯度下降法直接在嵌入空间上对它们进行优化例如 AutoPrompt Prefix-Tuning P 微调和 Prompt-Tuning从自动提示到提示微调的趋势是设置的逐渐简化。自动提示工程(APE)是一种在模型生成的Prompt候选集中搜索的方法然后根据选择的得分函数过滤候选集以最终选择得分最高的最佳候选提示。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2476383.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…