Helloagents-13travel agent学习笔记

news2026/4/6 16:14:50
承接上文Helloagents-13.智能旅行助手学习笔记 _helloagents旅游项目-CSDN博客1.全链路架构梳理1. 订单接入用户输入 - 后端接收前端 (Vue)用户在网页上填好目的地如“悉尼”、天数、出发日期等点击“生成”。数据打包成一个 HTTP POST 请求发给后端。后端的看门大爷 (Pydantic)FastAPI 接收到请求后第一时间交给Pydantic。它会检查数据格式对不对比如天数必须是整数目的地不能为空。如果不符合直接打回符合则放行进入核心车间。2. 原材料采购绕过 LLMPython 强行“截胡”调 API这是我改的原本的开源设计是让大模型自己去看工具说明书Function Calling调高德地图。但因为 MCP 工具链传参丢失空字典{}问题大模型不会用工具了。重构了架构Python 后端直接接管了“采购权”。修改amap_service用硬编码直接去请求高德 API稳定地拿到了最真实的目的地天气、POI兴趣点和路线原生 JSON 数据。3.图片素材补充Serper 搜图引擎有了高德的文字数据还不够由于 Unsplash 对中文景点支持极差改用serper替代unsplash搜图。新建了serper_service.py根据高德给出的景点名称通过 Serper API 精准抓取真实的景点图片 URL。4.翻译官与排版员调度大模型 LLMPython 后端把从高德拿到的真实地理数据、从 Serper 拿到的景点图片链接以及用户的输入打包塞进设定好的 Prompt 里。大模型根据这些原材料生成一份标准的长 JSON。里面包含了每日的行程安排、交通推荐和基础的费用估算。5. 结构质检JSON 解析与响应组装后端用 Pydantic 校验大模型吐出的中文行程 JSON。检查它是否严格包含前端所需的字段如days,attractions,location等。如果解析成功就把这串标准的 JSON 响应发送给前端。6. 页面渲染前端展示Vue 页面接单前端拿到数据后进行解析。地图联动提取出 JSON 里的经纬度或地点信息传给高德地图前端组件Map.vue在右侧渲染出真实的交互式地图路线。图文排版在左侧将每日行程、Serper 抓取到的真实景点图片、以及基础的预算信息渲染成网页列表。2.Bug总结1.MCP 工具链瘫痪bug:在让大模型生成旅行计划时系统直接报错大模型回复“抱歉工具不可用”。深层根本原因是LLM的依赖性:底层的amap-mcp-server存在 Bug在向大模型注册工具时传递的参数说明书是个空字典{}。大模型虽然聪明但它没有参数说明它根本不知道怎么构造高德地图的 API 请求导致 Function Calling 整个流程直接断裂。解决方案放弃了让 LLM 自主调度工具。用 Python 代码做拦截直接硬编码去调用高德 API 获取真实的 JSON 气象和地理数据然后将这些数据作为“上下文知识”拼接在 Prompt 里喂给大模型。大模型从“手握方向盘的司机”降级成了“专业的翻译官和排版员”从架构上消除了工具调度的不稳定性。2.Unsplash 的“语言隔离”与翻译拦截bug:在前端页面上行程列表渲染出来了高德地图也显示了但是像“夫子庙”、“玄武湖”这样的景点配图要么完全空白要么显示默认的错误图片。深层根本原因是API 语境偏差:系统原本调用的是国外的 Unsplash 免费图库。这个图库的检索引擎是纯英文语境的。当系统傻乎乎地把高德地图返回的中文景点名如“夫子庙”直接当作参数塞给 Unsplash API 时对方根本无法解析直接返回空结果0 hits。解决方案在poi.py调用图片 API 之前强行插入了一个翻译层数据预处理。先调用大模型或翻译工具将中文 POI 翻译成准确的英文地名然后再去请求 Unsplash。这体现了在对接第三方跨国 API 时必须做的数据标准化处理。3.图库“幻觉”与 Serper 引擎的彻底替换bug翻译层加上之后图片确实出来了。但是当搜索南京“水游城”时前端显示了一张北京“水立方”的照片搜索某些小众景点时出来的全是风马牛不相及的风景图。深层根本原因是数据源覆盖率缺陷这是第三方数据源先天不足。Unsplash 作为一个海外的无版权图库它对中国本土化垂直场景尤其是具体的地理 POI的覆盖率极低。当它找不到精确匹配时它的底层搜索算法会进行“宽泛匹配”比如看到“水”就推水立方导致前端出现幻觉。解决方案改用了Serper。新建了serper_service.py并在config.py中重构了环境变量。在poi.py中切断了旧图库的引用实现了业务代码的无缝切换。3.核心代码-伪代码总结逻辑1.Prompt 的动态编排层backend/app/agents/trip_planner_agent.py拦截llm硬编码调用高德api# 提取自 _search_attractions 等工具调用函数 # 我们不再把工具丢给 agent.run而是直接用 self.amap_tool.run 传死参数 result self.amap_tool.run({ action: call_tool, tool_name: maps_text_search, arguments: { keywords: keywords, city: request.city, citylimit: true } })prompt拼装# 提取自 _generate_plan_with_llm # Python 用 f-string 把真实的高德 JSON 强行嵌入到了用户的上下文中 query f请根据以下真实数据生成{request.city}的{request.travel_days}天旅行计划: ... **景点数据 (JSON):** {json.dumps(attraction_data, ensure_asciiFalse, indent2)} **天气数据 (JSON):** {json.dumps(weather_data, ensure_asciiFalse, indent2)} ... # 最后直接 invoke 裸调大模型没有 agent 调度只有最纯粹的对话 messages [ {role: system, content: PLANNER_PROMPT}, {role: user, content: query} ] response self.llm.invoke(messages)planner_prompt1少样本提示代码体现 直接给了大模型一个完整的带缩进的 JSON 结构模板如 location: {longitude: 116.397128, latitude: 39.916527}。架构意义 相比于用自然语言说“请输出包含经纬度的地点信息”直接给一个模板能让大模型的 JSON 输出准确率提升 90% 以上。2防御性边界指令代码体现 温度必须是纯数字(不要带°C等单位)架构意义 因为后端的 Pydantic Schema 里温度的类型大概率定义成了 int。如果大模型输出 25°C后端就会直接报格式验证错误。这句 Prompt 从源头上掐断了解析崩溃的风险。3密集的显式约束代码体现 每天安排2-3个景点、每天必须包含早中晚三餐架构意义 防止大模型“偷懒”或“产生幻觉”。大模型经常会省略输出通过明确的数量限制逼迫大模型进行充分的上下文推理保证行程内容的饱满度。trip_planner_agent.py的架构trip_planner_agent.py (多智能体旅行规划器核心逻辑) │ ├── 顶层常量与配置 │ └── PLANNER_PROMPT (全局常量定义系统级人设与极严谨的 JSON 模板约束) │ ├── class MultiAgentTripPlanner (核心业务类) │ │ │ ├── 1. 初始化层 │ │ └── __init__ (加载大模型 llm并注册绑定 amap_mcp_server) │ │ │ ├── 2. 核心调度主流程 (Facade 模式) │ │ └── plan_trip (对外唯一公开的方法像指挥官一样调度下面的私有方法) │ │ ├── 调用 _search_attractions (抓取景点) │ │ ├── 调用 _get_weather (抓取天气) │ │ ├── 调用 _search_hotels (抓取酒店) │ │ ├── 调用 _generate_plan_with_llm (丢给大模型翻译) │ │ └── 调用 _parse_response (解析返回结果) │ │ │ ├── 3. 工具拦截调用层 (硬编码拿数据) │ │ ├── _search_attractions (调高德地点搜索) │ │ ├── _get_weather (调高德天气 API) │ │ └── _search_hotels (调高德搜酒店) │ │ │ ├── 4. 数据预处理层 │ │ └── _parse_mcp_result (剥离工具返回的无效字符只提取 JSON) │ │ │ ├── 5. 核心推理层 │ │ └── _generate_plan_with_llm (组装 System 模板 User 真实数据调 LLM) │ │ │ └── 6. 兜底与容错层 │ ├── _parse_response (正则剥离大模型返回的 json 等脏数据) │ └── _create_fallback_plan (如果大模型罢工强行用 Python 写死一个兜底行程) │ └── 全局单例实例化 ├── _multi_agent_planner (全局缓存变量) └── get_trip_planner_agent() (单例模式入口确保全局只初始化一次高德工具)2.外部API的调度与清洗层backend/app/services/amap_service.py清洗烂字符串修复 Pydantic 报错在服务层做了一层正则拦截。利用 re.search(r\{.*\}) 配合 re.DOTALL允许匹配换行符把中间真正的 JSON 块抠了出来再用 json.loads 转成标准的 Python 字典。import json import re # 核心清洗逻辑使用正则表达式强行提取大括号包裹的内容 json_match re.search(r\{.*\}, result, re.DOTALL) if json_match: # 提取纯净的 JSON 字符串并转化为 Python 字典 data json.loads(json_match.group()) return data # 如果怎么都提不出来返回一个带 raw 标记的字典兜底 return {raw: result}只初始化一次高德地图MCP工具global _amap_mcp_tool if _amap_mcp_tool is None: _amap_mcp_tool MCPTool(...)backend/app/services/serper_service.py和backend/app/api/routes/poi.py多级搜索策略。通过动态追加 Context如‘景点’、‘landmark’进行多轮重试。如果三轮都查不到程序会果断返回 None# 策略1: 原名直搜 photos self.search_photos(name, num3) # 策略2: 加 景点 限定词Query Expansion photos self.search_photos(f{name} 景点, num3) # 策略3: 跨语言限定词 photos self.search_photos(f{name} landmark China, num3) # 终极防御宁缺毋滥 return None路由与服务解耦poi.py 里面只有 router.get它自己绝对不去发 HTTP 请求而是老老实实调用 serper_service.get_photo_url(name)。这叫职责分离。poi.pyController 层只负责接客和参数校验serper_service.pyService 层专心干苦力查数据。以后如果要换百度识图只需要改 Service 层完全不需要动 API 路由层。数据清洗# 没有直接 return response.json() for photo in results: photos.append({ url: photo.get(imageUrl), title: photo.get(title) })标准化的统一响应结构poi.py中。所有的 API 接口都必须遵守{success: bool, message: str, data: Any}的结构。这样前端在写 Axios 拦截器时就能非常轻松地全局处理成功和失败的弹窗不用每个接口都去猜数据在哪一层。return { success: True, message: 获取图片成功, data: { ... } }3.大模型输出的兜底与解析层backend/app/api/routes/trip.py控制器lan_trip 函数内部几乎没有写任何具体的 if-else 业务逻辑它只是打印了日志然后直接把请求扔给了 agent.plan_trip(request)拿到结果后立马包装返回。真正的“炒菜”全在后面的 Agent 和 Service 层。这样写代码清爽维护时一目了然。GET /health接口它不仅返回了 status: healthy还主动去试探了一下底层的 agent 能不能正常获取len(agent.agent.list_tools())。如果底层 MCP 工具挂了这个接口会立刻抛出503 (Service Unavailable)。backend/app/model/schemas.py之前在 Prompt 里嘱咐大模型“温度必须是纯数字”。但是 它还是可能由于幻觉输出了 day_temp: 25°C。如果不用 field_validatorPydantic 看到字符串 25°C 而不是整数会当场抛出 ValidationError整个行程规划直接崩溃。modebefore在 Pydantic 原生类型检查之前拦截相当于在海关门口放了一个“自动清洗机”不管大模型吐出来带什么单位全给你扒干净转成整数。柔性容错机制field_validator(day_temp, night_temp, modebefore) classmethod def parse_temperature(cls, v): 解析温度,移除°C等单位 if isinstance(v, str): v v.replace(°C, ).replace(℃, ).replace(°, ).strip() try: return int(v) except ValueError: return 0 return v自定义数据清洗器大模型在生成超长 JSON 时极度容易**“丢三落四”。如果没有Optional和default缺少一个字段就会导致整体验证失败。使用了这些特性后系统实现了优雅降级—— 核心字段带...的必填项比如名字、日期必须有非核心字段没有就塞个默认值0或者None绝不影响主流程。前端拿不到rating大不了就不显示星星但绝不会白屏。rating: Optional[float] Field(defaultNone, description评分) photos: Optional[List[str]] Field(default_factorylist, description景点图片URL列表) ticket_price: int Field(default0, description门票价格(元))嵌套树状契约 代码体现从下往上组装Location - Attraction/Hotel/Meal - DayPlan - TripPlan - TripPlanResponse。架构意义不要企图用一个几百行的巨大字典去约束复杂的返回值。这种一层套一层的组合模式不仅让代码可读性极强更重要的是当大模型的某一行 JSON 出错时Pydantic 报错堆栈会极其精准地告诉你“是 TripPlan 里的第 2 个 DayPlan 里的第 1 个 Attraction 的 Location 格式错了”。这极大地降低了后期的 Debug 成本。API 的“自说明”与 Swagger 集成这是标准的大厂 API 规范。加上example和详细的description之后FastAPI 会在/docs路径下自动生成一个可以直接进行调试、并且自带样例数据的炫酷 Swagger 接口文档。前后端联调时前端只需要看这个自动生成的文档根本不用问“这个字段是干嘛的”。class Config: json_schema_extra { example: { city: 北京, travel_days: 3, # ... } }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2489615.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…