agent实习面经(十一)

news2026/3/27 3:35:08
来自网络侵删先完成再完美 某东某节1.LLM 为什么有幻觉如何减少 LLM 幻觉1.1概率生成机制LLM 本质是基于统计概率预测下一个 token而非检索事实数据库。当训练数据中缺乏确切信息或模式模糊时模型会“脑补”最可能的序列导致事实性错误。训练目标偏差预训练和微调阶段通常奖励“流畅且看似合理”的回答惩罚“我不知道”迫使模型在不确定时强行生成内容。上下文窗口限制长文本中关键信息可能被遗忘或注意力分散导致模型基于不完整信息推理。数据噪声训练数据本身包含的错误、矛盾或虚构内容被模型学习并内化。1.2检索增强生成 (RAG)、思维链 (CoT、负提示 (Negative Prompting) 与约束解码在提示词中明确禁止编造或在解码阶段限制输出空间如仅允许从给定选项中选择2.模型效果怎么评估自动化指标 (Automated Metrics)传统 NLP 指标BLEU, ROUGE (用于翻译/摘要)Perplexity (困惑度衡量语言建模能力)。语义相似度BERTScore, Embedding Cosine Similarity。特定任务基准MMLU (综合知识), GSM8K (数学推理), HumanEval (代码生成), HELM (综合评测)。幻觉检测指标Factuality Score (如 Vectara HHEM), Self-Consistency Rate。Agent 能力指标任务成功率 (Success Rate), 步骤效率 (Step Efficiency)。人工评估 (Human Evaluation)维度准确性 (Accuracy)、相关性 (Relevance)、流畅度 (Fluency)、安全性 (Safety)、有用性 (Helpfulness)。方法Likert 量表打分、成对比较 (A/B Testing)、红队测试 (Red Teaming专门寻找漏洞和有害输出)。LLM-as-a-Judge使用更强的模型如 GPT-4/Claude 3作为裁判来评估弱模型的输出需校准偏差。3.MCP底层协议是什么MCP 的底层通信协议主要基于JSON-RPC 2.0。传输层 (Transport)支持多种传输方式最常见的是Stdio(标准输入输出用于本地进程间通信) 和SSE(Server-Sent Events用于远程 HTTP 流式通信)。数据层 (Data Layer)遵循 JSON-RPC 2.0 规范定义了request,response,notification三种消息类型。核心原语定义了Tools(工具调用),Resources(资源读取),Prompts(预设提示词) 的标准 Schema。生命周期管理包含初始化 (initialize)、能力协商、以及会话终止流程。特点无状态设计依赖上下文传递、双向通信服务器可主动推送通知、强调权限分离和用户确认机制。4.skill本质在 AI Agent 语境下Skills (技能)的本质是结构化、可调用的功能单元 (Structured, Callable Functional Units)。封装性它将复杂的底层操作如 API 调用、代码执行、数据库查询、工具使用封装成一个模型可理解的接口通常包含名称、描述、参数 Schema。映射桥梁它是 LLM 的“意图”与现实世界“行动”之间的桥梁。LLM 输出自然语言指令通过 Function Calling 机制映射到具体的 Skill 执行。动态扩展Skills 使得模型能力不再局限于训练数据而是可以通过加载新的 Skill 插件无限扩展即“模型即操作系统Skill 即应用”。标准化协议在 MCP 等协议中Skill 对应于Tool原语遵循统一的发现 (list) 和调用 (call) 规范。5.如何设计一个AI IDE结合MCP ACP架构分层UI 层提供沉浸式对话、行内建议 (Ghost Text)、可视化依赖图。编排层 (Orchestrator)负责任务拆解、路由决定调用哪个 Skill/MCP Server、并发控制。协议层集成MCP Client统一连接各类工具调试器、终端、外部 API、知识库。实现ACP (Agent Communication Protocol)或类似标准处理多 Agent 间的协作与状态同步如果涉及多智能体。上下文引擎维护代码库的向量索引 符号表 (Symbol Table)实现毫秒级检索。核心工作流用户指令 - 意图识别 -锁定当前代码快照- 检索相关上下文 - 调用 MCP Tools (如运行测试、查阅文档) - 生成代码 Plan -二次校验文件状态- 应用 Diff - 自动运行 Linter/Test - 反馈结果。安全与信任所有高危操作如删除文件、执行 Shell必须经过用户显式确认MCP 的用户监督机制。提供“撤销栈”和“时间旅行”功能随时回滚到 AI 介入前的状态。3.agent的编排是怎么做的运用到了什么样的模式呢如何调度的核心模式中心化编排 (Centralized Orchestrator)一个“主脑”AgentPlanner/Manager负责拆解任务、分配子任务给专用 Agent如 coder, tester, researcher并汇总结果。适合复杂、多步骤任务。代表框架AutoGen (Group Chat), LangGraph (State Graph)。去中心化协作 (Decentralized/Swarm)多个 Agent 基于共享状态或消息总线自主交互通过预设规则或协商机制完成任务无单一控制点。适合动态、开放环境。代表概念Swarm Intelligence, Peer-to-Peer Agent Networks。工作流引擎 (Workflow Engine)将任务定义为有向无环图 (DAG)节点是 Agent 或工具边是数据流。执行引擎按拓扑顺序调度。适合确定性高、流程固定的场景。代表技术LangChain Expression Language (LCEL), Prefect/Airflow for AI。调度策略基于意图路由 (Intent-based Routing)根据用户请求的语义动态选择最合适的 Agent 或工具链。基于能力注册 (Capability Registry)维护一个所有可用 Agent/Tool 的能力描述库编排器根据任务需求查询并调用。动态优先级队列根据任务紧急度、依赖关系和资源占用情况动态调整执行顺序。反馈闭环调度子 Agent 执行失败或返回不确定结果时触发重试、切换策略或上报主 Agent 决策。4.你说的混合记忆架构短期记忆长期记忆记忆槽位是如何做的呢里面用的什么数据结构存的具体是什么数据。短期记忆 (Short-Term Memory, STM)实现通常直接利用 LLM 的Context Window。数据结构线性列表或滑动窗口存储最近 N 轮对话的[{role: user, content: ...}, {role: assistant, content: ...}]。内容当前会话的即时上下文、临时变量、未完成的思维链。优化使用摘要压缩 (Summarization)或关键信息提取来延长有效上下文。长期记忆 (Long-Term Memory, LTM)实现外部存储系统向量数据库 关系型/图数据库。数据结构向量索引 (Vector Index)用于语义检索如 FAISS, Milvus, Pinecone。存储 Embedding 向量。键值对/文档存储 (Key-Value/Document Store)用于精确查找如 Redis, MongoDB。存储结构化事实。图结构 (Graph Structure)用于存储实体关系如 Neo4j。内容用户偏好、历史任务总结、领域知识库、代码库符号表、过往错误日志。记忆槽位 (Memory Slots)本质一种结构化的记忆单元类似编程中的“变量”或“对象属性”。实现在 LTM 中定义特定的 Schema如UserPreference,ProjectStatus,SkillProfile。操作支持Read Slot,Write Slot,Update Slot,Delete Slot。Agent 可以显式地更新某个槽位例如Slot[current_language] Python以便在后续对话中快速读取无需重新推理。5.那数据库存储和rag是咋做的向量库存 Embedding 和原始文本块用于 RAG。关系型/NoSQL 库存结构化数据用户信息、任务状态、配置、记忆槽位。图数据库存实体关系用于复杂推理和多跳检索。缓存层 (Redis)存高频访问的检索结果、会话状态、API 响应减少延迟和 Token 消耗。6.项目有什么问题么遇到过比较难的问题(注此处基于通用 AI 工程实践总结常见难点)幻觉与事实一致性即使有 RAG模型仍可能忽略检索内容或过度推断。难点如何在保持回答流畅性的同时强制模型严格遵循检索事实长上下文的“迷失中间” (Lost in the Middle)当上下文极长时模型对中间信息的注意力下降。难点如何设计更高效的上下文压缩和摘要策略工具调用的准确性模型可能选错工具、参数构造错误或无法处理复杂依赖。难点如何通过 Few-shot 示例、Schema 约束或验证循环提高准确率状态管理与并发多 Agent 协作时共享状态易冲突任务执行顺序难以协调。难点设计鲁棒的锁机制和事务模型。评估困难自动化指标难以全面反映 Agent 的真实能力尤其是复杂任务的成功率。难点构建高质量的基准测试集和自动化评估流水线。6.1.讲到token消耗和mcp类似的上下文协议占用token的问题以及如何减少这样的消耗呢按需加载 (On-Demand Loading)不一次性加载所有 Tools/Resources。仅在用户意图明确或 Agent 规划到某一步时动态加载相关子集。渐进式披露 (Progressive Disclosure)先提供工具的简要描述名称 一句话功能当 Agent 决定调用时再获取详细参数 Schema。摘要与缓存 (Summarization Caching)对长对话历史进行定期摘要只保留核心事实和结论。缓存常用工具的 Embedding 和描述避免重复传输。使用差分更新 (Diff Update)仅传输上下文的变化部分而非全量重传。小模型路由用低成本小模型做意图识别和上下文筛选只有复杂任务才调用大模型并携带完整上下文。6.2.子agent在动态分配的过程当中如何做呢通过什么技术来实现一种调度和分配如何提高子agent的执行任务和工具调用的准确率。动态分配技术基于能力的路由表 (Capability Routing Table)维护一个{Task_Type: [Agent_List]}的映射根据任务标签动态选择。强化学习 (RL) 调度器训练一个轻量级 RL 模型根据历史成功率、延迟、成本等指标学习最优的 Agent 分配策略。竞价机制 (Auction Mechanism)子 Agent 根据自身负载和能力对任务进行“投标”主 Agent 选择最优者。7.图数据库引入解决了什么样的问题给我讲讲。多跳推理 (Multi-hop Reasoning)传统向量检索擅长找“相似”但不擅长找“关系”。图数据库能轻松处理“A 的朋友的同事是谁”这类多步关联查询。结构化知识表示将非结构化文本中的实体人、地点、代码类、函数及其关系继承、调用、依赖显式建模形成知识图谱。消除歧义与上下文增强通过实体链接 (Entity Linking)区分同名不同义的实体如“Apple”是公司还是水果提供更精准的上下文给 LLM。可解释性推理路径可视化。用户可以清楚看到 AI 是基于哪条关系链得出的结论便于调试和信任建立。动态更新与一致性当代码库或知识库变更时只需更新图中的节点和边无需重新向量化整个文档保证知识的实时性和一致性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2453129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…