WebCanvas:在线网页智能体评测框架,从实验室到真实网络环境

news2026/4/28 22:19:16
1. 项目概述一个为真实网络世界而生的智能体评测框架如果你正在研究或开发基于大语言模型的网页智能体那你一定遇到过这个核心痛点在实验室里跑得飞快的智能体一到真实、动态、充满不确定性的互联网上就变得“水土不服”频频出错。问题出在哪里很大程度上是因为我们缺少一个能真正模拟线上环境、提供实时反馈的评测基准。大多数现有的网页智能体框架要么是离线的、静态的要么运行在一个高度可控、可复现的“温室”环境中这与真实互联网的复杂性和动态性相去甚远。今天要深入探讨的WebCanvas正是为了解决这个问题而生。它不是一个简单的工具包而是一个一体化、开源的网页智能体构建、训练与评测框架其核心目标是在真实的在线网络环境中对智能体进行开发、训练和评估。简单来说WebCanvas 把评测场从“温室”搬到了“野外”让你的智能体直面网络延迟、验证码、动态加载、网站反爬机制等真实挑战。我花了相当长的时间研究并实践了 WebCanvas发现它的设计理念非常务实。它引入了“关键节点”的概念将复杂的网页任务分解为一系列可评估的中间状态从而提供过程性反馈和细粒度的分阶段评估。这就像给智能体的每一步操作都设置了检查点不仅能告诉你任务最终是否成功更能清晰地揭示出失败究竟发生在哪个环节是因为点击错了按钮还是没找到搜索框或是被验证码拦住了去路。对于研究者而言它提供了标准化的数据集如 Mind2Web-Live和严谨的评估指标对于开发者而言它提供了模块化、可插拔的智能体基础框架让你能快速集成自己的算法进行测试。接下来我将从设计思路、核心模块、实操部署到避坑经验为你完整拆解 WebCanvas分享如何利用这个框架让你的网页智能体真正具备“野外生存”能力。2. 核心设计思路与架构解析2.1 为何需要“在线”评测在深入代码之前我们必须理解 WebCanvas 最根本的出发点。传统的离线评测通常使用预先抓取的静态 HTML 快照或录制好的交互序列。这种方式虽然稳定、可复现但存在几个致命缺陷环境失真静态页面无法模拟网络请求、JavaScript 动态渲染、弹窗、验证码等实时交互。反馈滞后智能体的错误操作如点击一个已失效的链接在静态环境中可能无法被即时检测到导致评估失真。无法处理异常真实浏览中常见的网络错误、超时、反机器人检测等在离线环境中完全无法体现。WebCanvas 的“在线”评测意味着智能体直接与真实的、正在运行的网站进行交互。它的浏览器环境是“活”的页面状态是实时变化的。这种设计带来了巨大的价值真实性评估结果直接反映了智能体在真实世界中的表现。鲁棒性测试智能体必须学会处理各种非理想情况和边缘案例。持续学习潜力在线交互产生的数据成功或失败的轨迹可以不断积累用于后续的训练和优化。2.2 “关键节点”评估法从结果导向到过程监控这是 WebCanvas 在评估方法论上的一大创新。传统的任务成功率Task Success Rate是一个二元指标成功/失败但它过于粗糙。一个任务可能包含10个步骤智能体在第9步失败和在第1步失败其体现的能力水平是天差地别的。WebCanvas 提出的“关键节点”评估将任务分解为多个必须达成的中间目标状态。例如任务“在 Steam 上找到《Dota 2》并添加所有 DLC 到购物车”可能被分解为成功访问 Steam 商店首页。在搜索框输入“Dota 2”并执行搜索。从搜索结果中正确识别并进入《Dota 2》游戏主页。在游戏主页找到“DLC”或“附加内容”区域。遍历所有 DLC 项目并逐一加入购物车。最终进入购物车页面确认所有 DLC 已添加。每一个步骤都是一个“关键节点”。智能体每完成一个节点就能获得相应的分数完成率Completion Rate。这种评估方式提供细粒度反馈精准定位智能体的薄弱环节。鼓励渐进式学习即使任务最终失败部分完成的节点也能提供正向信号。更符合人类评估逻辑我们评价一个人完成一项复杂工作时也会看其关键步骤是否到位。2.3 模块化智能体框架像搭积木一样构建智能体WebCanvas 的智能体框架采用了高度模块化的设计清晰地将智能体的核心功能解耦。这让你可以像更换积木一样轻松测试不同模块的实现方案。其主要模块包括规划模块核心的“大脑”接收任务指令和当前环境观察DOM、截图等决定下一步要执行的动作如click,type,scroll。你可以在这里接入不同的 LLMGPT-4, Claude, Gemini或开源模型来测试其规划能力。观察模块智能体的“眼睛”负责从实时浏览器环境中捕获信息。WebCanvas 支持多种观察模式如纯文本 DOM、视觉截图通过计算机视觉模型解析、或两者结合。这决定了智能体感知世界的方式。记忆模块存储交互历史帮助智能体避免重复操作、理解任务上下文。可以是简单的对话历史也可以是更复杂的向量数据库。奖励模块提供学习信号。除了最终的任务成功奖励WebCanvas 的关键节点评估天然提供了稀疏奖励。你还可以实现密集奖励例如为每次向目标状态靠近的操作给予小奖励。动作执行模块智能体的“手”将规划模块输出的抽象指令如click(id‘submit-btn’)转化为浏览器可执行的具体操作如模拟鼠标点击事件。评估模块独立于智能体运行根据预设的“关键节点”定义判断智能体当前是否达到了某个节点状态并计算各项评估指标。这种架构的最大好处是可复用性和可实验性。你可以保留其他模块不变只替换规划模块的 LLM就能快速对比 GPT-4 和 Claude 在相同任务上的表现或者你可以尝试不同的观察输入纯文本 vs. 多模态研究哪种感知方式对网页导航更有效。3. 环境部署与核心配置实战理论讲得再多不如亲手跑一遍。下面我将带你一步步搭建 WebCanvas 环境并重点讲解那些官方文档可能一笔带过但实际操作中极易出错的配置细节。3.1 基础环境搭建与依赖安装首先确保你的系统满足基础要求。WebCanvas 主要基于 Python 3.11 和 Node.js。我强烈建议使用 Conda 或 venv 创建独立的虚拟环境避免包冲突。# 1. 创建并激活 Conda 环境 conda create -n webcanvas python3.11 -y conda activate webcanvas # 2. 克隆仓库 git clone https://github.com/iMeanAI/WebCanvas.git cd WebCanvas # 3. 安装 Python 依赖 pip install -r requirements.txt注意requirements.txt中的某些包可能有特定版本要求。如果安装过程中出现冲突可以尝试先安装基础包如selenium,playwright,openai再根据错误提示手动调整版本。我遇到过protobuf版本冲突的问题通过pip install protobuf3.20.3降级解决。接下来是 Node.js 依赖。WebCanvas 的某些功能如与浏览器深度交互需要 Node 环境。# 在项目根目录下初始化并安装 axios npm init -y npm install axios3.2 关键 API 密钥配置绕过“拦路虎”这是整个部署过程中最容易卡住的一步。WebCanvas 的运行依赖于多个外部服务你需要正确配置它们的 API 密钥。1. 大语言模型 API 密钥你需要准备至少一个 LLM 服务的 API 密钥。编辑项目根目录下的.env文件如果不存在则创建根据你选择的模型服务商添加对应的密钥。# 例如使用 OpenAI OPENAI_API_KEYsk-your-openai-api-key-here # 或者使用 Anthropic Claude ANTHROPIC_API_KEYyour-claude-api-key-here # 或者使用 Google Gemini GOOGLE_API_KEYyour-google-api-key-here # 注意这个和下面的搜索API不同实操心得.env文件务必添加到.gitignore中切勿提交到代码仓库。对于团队协作建议使用类似dotenv的库来管理或在 CI/CD 环境中配置为保密变量。2. 谷歌自定义搜索 API 密钥由于谷歌近期加强了对自动化脚本GUI Agent搜索的限制WebCanvas 的google_search动作需要通过官方 API 实现。这需要两个参数GOOGLE_API_KEY谷歌云平台的 API 密钥。GOOGLE_CX自定义搜索引擎 ID。设置环境变量export GOOGLE_API_KEYyour_google_search_api_key export GOOGLE_CXyour_custom_search_engine_id如何获取这两个参数前往 Google Cloud Console 创建一个项目并启用“Custom Search JSON API”。在“凭据”页面创建 API 密钥这就是你的GOOGLE_API_KEY。前往 Programmable Search Engine 创建一个新的搜索引擎。创建完成后在控制面板的“基本信息”里找到“搜索引擎 ID”这就是你的GOOGLE_CX。3. Browserbase 云浏览器 API 密钥可选但推荐为了获得更稳定、一致的评测环境尤其是在批量评测时WebCanvas 集成了 Browserbase。这能避免因本地网络、浏览器版本差异导致的结果波动。注册 Browserbase 并获取 API 密钥。在.env文件中添加BROWSERBASE_API_KEYyour_browserbase_api_key。3.3 配置文件详解掌控评估行为核心的评估行为由configs/setting.toml文件控制。理解并正确配置这个文件至关重要。# setting.toml 关键配置节选 [general] task_mode batch # 或 single。batch模式用于在数据集上批量评估single模式用于交互式测试单个任务。 test_file_path data/mind2web_live_test.json # 批量评估时使用的数据集路径 [evaluation] interaction_mode auto # 或 human_in_the_loop。设置为human_in_the_loop时当遇到验证码等阻塞性问题会暂停并等待人工干预。 headless true # 是否以无头模式运行浏览器。调试时建议设为false便于观察。 [llm] planning_model gpt-4o-mini # 规划模块使用的模型 global_reward_model gpt-4o-mini # 全局奖励推理使用的模型如果启用 [token_pricing] # 用于计算token消耗和美元效率的模型单价美元/每千token gpt-4o-mini_input_price 0.00015 gpt-4o-mini_output_price 0.0006task_mode如果你是第一次使用强烈建议先从single模式开始跑一个简单的任务观察智能体的完整交互流程和日志输出理解其工作方式。interaction_mode在真实评测中网站的反爬措施如验证码是智能体的“天敌”。设置为human_in_the_loop后当系统检测到此类阻塞时会暂停执行并给出提示等待你手动解决如输入验证码后继续。这能保证评测流程不被意外中断但会引入人工成本。auto模式则完全自动化失败即失败。headless调试时设为false浏览器窗口会弹出你可以亲眼看到智能体是如何操作页面的这对于理解错误和优化提示词Prompt有巨大帮助。4. 运行评估与结果分析环境配置妥当后就可以开始运行评估了。WebCanvas 提供了灵活的启动命令。4.1 启动你的第一次评估我们以评估 Mind2Web-Live 测试集中的一个任务为例。假设我们使用 GPT-4o-mini 作为规划模型并采用基于 DOM 的全局奖励计算方式。python evaluate.py \ --global_reward_mode dom_reward \ --index 0 \ # 从数据集的第0个任务开始评估 --planning_text_model gpt-4o-mini \ --global_reward_text_model gpt-4o-mini参数解析--global_reward_mode: 定义如何计算“全局奖励”。dom_reward表示仅基于页面 DOM 的变化来判断是否达成关键节点成本低但可能不准确vision_reward则基于屏幕截图需要多模态模型如 GPT-4V成本高更接近人类判断dom_vision_reward是两者的结合。--index: 指定从数据集的哪个索引开始运行。可以是单个数字如0也可以是一个范围如0,5表示评估索引 0 到 5 的任务。--planning_text_model: 指定用于规划决定下一步动作的文本模型。--global_reward_text_model: 指定用于全局奖励推理的文本模型当global_reward_mode为dom_reward时生效。运行后控制台会输出详细的日志包括智能体观察到的页面摘要、规划出的动作、执行结果以及是否达成关键节点。最终会在outputs目录下生成一个结果文件如eval_results_*.json。4.2 理解评估指标与结果文件评估完成后我们需要看懂结果。WebCanvas 主要报告以下几个核心指标完成率在所有关键节点中智能体成功完成了多少比例。这衡量了智能体执行任务步骤的能力。任务成功率智能体完全、正确地完成整个任务的比例。这是最严格的指标。美元效率分数这是一个非常实用的指标计算公式为总花费美元 / 完成的关键节点数。它直观地反映了智能体的“性价比”。在相同完成率下消耗成本越低的智能体效率分数越高值越小越好。结果 JSON 文件包含了每个任务的详细轨迹信息对于分析失败原因至关重要。你可以看到智能体在每一步观察到了什么DOM 片段或截图描述。计划做什么动作。实际执行了什么动作。环境状态发生了什么变化。是否触发了关键节点。4.3 提交结果到排行榜如果你想在 WebCanvas 平台的官方排行榜上与其他研究者和开发者一较高下需要将你的评估结果上传。首先你需要在 WebCanvas 平台 上注册并获取挑战 ID。然后设置你的 GraphQL 认证信息用于平台 API 调用export GRAPHQL_USERNAMEyour_platform_username export GRAPHQL_PASSWORDyour_platform_password注意如果你使用谷歌账号注册需要先在平台的个人资料页面设置一个密码。使用上传命令python data/dataset_io.py upload \ --file-path ./outputs/your_eval_result.json \ --challenge-id WjVIjPfpa-psiltU3oD2W \ # 例如 Mind2Web-Live 测试集的挑战ID --name MyAwesomeAgent-v1.0 \ --base-model gpt-4o-mini上传后你的结果会经过平台验证然后显示在对应挑战的公开排行榜上。这不仅是展示成果的好方式也能通过对比了解当前业界的最佳水平。5. 创建自定义评测数据集与挑战WebCanvas 的强大之处在于你不仅可以评测现有基准还可以为自己关心的特定领域任务创建定制化的评测数据集。这通过iMean Builder工具链完成。5.1 使用 iMean Builder 录制轨迹iMean Builder 是一个图形化工具用于定义任务和标注关键节点。其工作流程如下任务定义明确描述你要评测的任务例如“在 Airbnb 上搜索纽约 12 月 20 日至 25 日期间评分高于 4.5 的公寓并按价格从低到高排序”。轨迹录制你以“专家演示者”的身份手动在真实网站上完成这个任务。在此过程中iMean Builder 会录制你的所有操作点击、输入、滚动等以及每一步对应的完整页面状态HTML、截图、可访问性树等。关键节点标注在录制的轨迹中标记出你认为对于完成任务至关重要的步骤。例如“成功进入 Airbnb 首页”、“在搜索表单中正确填入地点和日期”、“点击‘搜索’按钮”、“在结果页面成功应用‘评分4.5’筛选器”、“成功点击‘价格排序’按钮”。每一个标记点就是一个“关键节点”。生成挑战将标注好的轨迹发布到 WebCanvas 平台形成一个私有的或公开的挑战。你会获得一个唯一的challenge_id。5.2 下载与处理自定义数据集创建挑战后你可以使用 WebCanvas 提供的工具下载原始的轨迹数据用于训练或深度分析。python data/dataset_io.py download \ --challenge-id your_custom_challenge_id \ --save-path ./data/my_custom_dataset_raw.zip下载的数据包是原始的、未经处理的包含了每一步的完整信息数据量可能很大。你可以使用raw_data_processor.py脚本对其进行处理提取出评估所需的结构化信息。python data/raw_data_processor.py \ --input-file ./data/my_custom_dataset_raw.zip \ --output-file ./data/my_custom_dataset_processed.json处理后的 JSON 文件格式将与 Mind2Web-Live 数据集类似可以直接被evaluate.py脚本加载用于评估你的智能体。5.3 自定义评估逻辑的扩展潜力WebCanvas 的评估体系是开放的。除了内置的基于关键节点匹配的静态评估函数其路线图也规划了支持动态评估函数。这意味着你可以实现更复杂的评估逻辑例如基于模型的评估使用另一个 LLM 来评判智能体在某个步骤的行为是否合理或最终输出是否符合要求。业务规则评估对于电商任务检查最终购物车里的商品SKU、价格是否正确。多模态匹配评估对比智能体最终生成的截图与专家演示的截图在视觉上是否一致。这为评测更开放、更复杂的网页任务如“写一篇博客并发布”提供了可能。6. 常见问题排查与性能优化经验在实际使用 WebCanvas 的过程中你一定会遇到各种问题。以下是我总结的一些常见坑点及其解决方案。6.1 环境与网络问题问题现象可能原因解决方案浏览器启动失败或页面无法加载1. 本地浏览器驱动ChromeDriver/GeckoDriver版本与浏览器不匹配。2. 网络连接问题尤其是访问国外网站。3. 本地防火墙或代理设置阻止了连接。1. 使用playwright install或webdriver-manager更新驱动到匹配版本。2. 考虑使用位于目标网站主要服务区的云服务器如评测美国网站使用美国服务器。官方推荐美国 Windows 服务器搭配 Chrome。3. 检查代理设置确保selenium或playwright能正确使用系统代理或无代理访问。评估过程中频繁超时1. 网站响应慢。2. LLM API 调用延迟高。3. 智能体陷入死循环如反复点击同一无效元素。1. 在配置文件中适当增加timeout参数。2. 为 LLM 调用设置合理的超时和重试机制。3. 在智能体的记忆模块中引入防呆设计记录已尝试过的无效操作避免重复。遇到验证码CAPTCHA网站的反机器人检测。1. 将interaction_mode设为human_in_the_loop人工解决。2. 考虑集成第三方验证码识别服务需自行开发集成。3. 在数据收集阶段尽量选择验证码出现频率低的网站或任务。6.2 智能体行为异常问题问题现象可能原因解决方案智能体“发呆”不执行动作或动作无效1. 观察模块未能捕获到有效信息如页面未加载完。2. 规划模块的 Prompt 设计不佳未能理解任务或观察。3. 动作执行模块定位元素失败元素ID/选择器已变化。1. 在动作执行前增加显式等待wait_for_selector确保页面元素稳定。2. 优化规划模块的 Prompt加入更明确的指令和示例Few-shot。3. 采用更鲁棒的元素定位策略如结合 XPath、CSS 选择器和文本内容而非依赖易变的 ID。智能体执行偏离目标的动作1. 任务指令描述模糊。2. 观察信息过多导致 LLM 注意力分散。3. 关键节点定义不够清晰奖励信号有误。1. 将复杂任务拆解为更原子化的子指令。2. 在观察模块中引入信息过滤或摘要只传递与当前步骤最相关的页面部分给规划模块。3. 复审并细化关键节点的定义确保其能准确反映任务进展。Token 消耗过高成本失控1. 观察信息如完整 DOM过于冗长每次规划都消耗大量 Token。2. 智能体规划效率低需要多次尝试才能完成一步。3. 使用了昂贵的大模型如 GPT-4。1.压缩观察使用 LLM 或启发式规则对 DOM 进行摘要只保留交互性元素按钮、链接、输入框。2.改进规划提供更好的示例或在上下文中加入常见操作模式减少试错。3.模型选型在保证效果的前提下优先使用成本更低的模型如 GPT-4o-mini。官方数据显示GPT-4o-mini 在成本效率上极具优势。6.3 性能优化技巧观察优化是重中之重DOM 树通常非常庞大直接塞给 LLM 会极大增加成本和延迟。实践表明使用简单的基于规则的过滤器如只保留带有onclick、href、role”button”等属性的元素或只保留可见区域内的元素能显著提升规划速度和准确性。实现动作缓存对于常见的、确定性的操作如“点击登录按钮”如果页面状态符合预期可以直接执行无需每次都调用 LLM 规划。这能大幅减少 API 调用。利用会话保持使用 Browserbase 等云浏览器服务时确保在多次评估间复用浏览器会话避免每次都要重新登录或处理 Cookie 弹窗可以节省大量时间。并行化评估对于大规模数据集可以修改评估脚本利用多进程或多线程同时运行多个任务实例充分利用计算资源。注意要管理好浏览器实例和 API 调用频率避免被封禁。WebCanvas 为我们打开了一扇门让网页智能体的研发和评测从理想的实验室走向了复杂的真实网络环境。它提供的不仅是一套工具更是一种方法论以关键节点分解任务以在线交互获取真实反馈以模块化设计促进快速迭代。从我个人的使用体验来看最大的挑战并非来自框架本身而是来自于真实网络环境的不确定性。你的智能体需要像一名经验丰富的用户一样处理页面加载失败、元素定位失效、意外弹窗等各种状况。这迫使研究者必须思考智能体的鲁棒性和错误恢复能力而不仅仅是规划准确性。对于想要入手的同行我的建议是不要一开始就追求在完整基准上取得高分。先从single模式开始选择一个你非常熟悉的简单网站和任务例如在百度搜索一个词观察智能体的每一步分析其成功或失败的原因。然后尝试修改 Prompt、调整观察范围、甚至修改基础框架的某个模块。这个“观察-分析-修改-验证”的循环才是利用 WebCanvas 提升智能体能力的核心路径。这个领域正在飞速发展WebCanvas 的路线图也规划了更多激动人心的功能如动态评估函数、更多领域的数据集、以及更好的可视化分析工具。投身其中你不仅是在使用一个框架更是在参与塑造下一代网页智能体的评估标准与实践。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2555916.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…