如何将Scrapeless MCP服务器集成到ZeroClaw中：逐步指南

news2026/5/21 12:42:21

关键要点一个TOML块将云浏览器连接到本地Rust代理。ZeroClaw是一个单一二进制AI代理运行时它与LLM提供者通信监听30多个频道并通过工具进行操作。只需在~/.zeroclaw/config.toml中添加四行[mcp]块即可添加Scrapeless MCP服务器——无需SDK安装无需管理守护进程无需在代理端更改代码。二十个MCP工具两个表面。Scrapeless MCP服务器公开了google_search、google_trends、完整的browser_*云浏览器原始工具集以及scrape_html/scrape_markdown/scrape_screenshot。Stdio传输通过npx -y scrapeless-mcp-server在本地运行可流式传输的HTTP指向https://api.scrapeless.com/mcp。MCP和代理技能是互补的而不是替代品。MCP服务器为ZeroClaw提供了工具Scrapeless OpenClaw技能——webunlocker-skill和llm-chat-scraper-skill——为其提供了底层Scrapeless API的使用方法。ZeroClaw从OpenClaw迁移并读取相同的SKILL.md格式因此技能可以放入~/.zeroclaw/workspace/skills/并通过zeroclaw skills list调用。反检测云浏览器195多个国家的住宅代理。Scrapeless处理JavaScript渲染、住宅代理出口、指纹随机化UA、时区、WebGL、画布和会话持久性因此ZeroClaw代理可以专注于任务而不是规避细节。发现→提取适用于任何网站。使用google_search定位页面使用scrape_markdown从JS渲染的SPA中提取干净文本使用browser_*工具处理分页或交互流程以及使用google_trends获取时间序列上下文。代理将它们组合在一起协议中的内容并不针对特定目标。免费开始。新的Scrapeless账户包括免费的MCP运行时——在app.scrapeless.com注册。介绍从本地Rust代理到实时网络访问ZeroClaw是一个完全在操作员机器上运行的Rust代理运行时。一个二进制一个TOML配置操作员的密钥操作员的工作区。它与~20个LLM提供者通信通过Discord、Telegram、Matrix、电子邮件、语音、网络钩子和CLI接入世界并通过shell、浏览器、HTTP、硬件和MCP服务器工具进行操作。该31k星级的仓库构建了一个基于监督自治、操作系统级沙箱Landlock、Bubblewrap、Seatbelt、Docker和每个操作的加密工具凭证的安全模型。任何本地代理运行时的基本限制与每个LLM面临的限制相同模型的知识在训练截止时被冻结。对于研究、监控、潜在客户生成、竞争情报和针对实时发布者数据的RAG这一限制在代理必须读取一个在模型训练时不存在的页面时显现出来。ZeroClaw内置的浏览器和HTTP工具覆盖了良性页面和文档查找在Cloudflare、Akamai、reCAPTCHA或IP声誉过滤后面的商业页面则是这些工具未针对的不同表面。这篇文章将讨论如何通过运行时支持的两种集成表面将Scrapeless连接到ZeroClawScrapeless MCP服务器向代理公开新工具的标准方式和Scrapeless OpenClaw技能代理加载的标准知识文件以有效驱动这些工具。两者相辅相成——MCP服务器是代理调用的内容技能是告知它何时以及如何调用底层Scrapeless API的内容。对于通过其他客户端公开的相同Scrapeless原语MCP服务器教程介绍了Claude Desktop / Cursor / Codex CLI而Hermes集成文章涵盖了已经使用Chrome开发者工具协议的代理的直接CDP路径。什么是ZeroClawZeroClaw是一个单一的Rust二进制文件可以在操作员自己的机器上启动代理运行时。维护者将其描述为“你拥有代理你拥有数据你拥有它运行的机器。”该运行时围绕四个移动部分结构化通道30多个适配器。来自Discord、Telegram、Matrix、电子邮件、语音、网络钩子、CLI和ACP IDE桥的输入消息——所有消息都路由到相同的代理循环。提供者~20个LLM后端。Anthropic、OpenAI、Ollama任何与OpenAI兼容的端点。后备链和路由确保在提供者出问题时代理能够正常运行。工具shell、浏览器、HTTP、硬件、MCP。操作表面。MCP服务器作为一流工具与内置工具一起注册。安全政策和标准操作程序引擎。默认自主权为监督中风险操作需要批准高风险操作被阻止。标准操作程序会在 MQTT、webhook、cron 或外部事件发生时触发并带有批准门和可恢复运行。配置存储在一个地方~/.zeroclaw/config.toml。工作区——技能、内存、日志、MCP 状态——存储在~/.zeroclaw/workspace/下。来自 OpenClaw 的操作员可以直接导入工作区技能格式是相同的。为什么要为您的 ZeroClaw 代理添加网络访问驱动 ZeroClaw 的 LLM 具有相同的限制训练截止。在一个快速变化的环境中产生三种可观察的故障模式——过时的答案、幻觉事实和对 URL 的工具调用这些 URL 之后已经变更或返回 404。ZeroClaw 内置了http和browser工具涵盖了广泛的应用场景。它们并未针对商业网页进行优化JS 渲染的 SPA、反机器人插页、验证码挑战和地理限制内容位于代理与操作员所需数据之间。将 Scrapeless 接入后这些故障模式转变为正常的工具调用通过google_searchGoogle带本地化glhl参数和google_trends时间序列兴趣数据进行实时研究。通过scrape_markdown对多个结果 URL 进行跨源验证在单个代理回合中完成。通过browser_*云浏览器原语进行实时数据收集来自 JS 密集型网站——定价页面、市场列表、评论页面、公共目录。通过在特定国家分配会话进行地理绑定查询使代理看到本地用户所见的内容。如何使用 Scrapeless 扩展 ZeroClaw两个接口Scrapeless 通过两个接口支持 ZeroClaw并可同时使用Scrapeless MCP 服务器— 官方服务器通过模型上下文协议暴露 20 种云浏览器、SERP 和抓取工具。Scrapeless OpenClaw 技能— 格式为SKILL.md的知识文件教会代理如何有效地驱动 Scrapeless 通用抓取 API 和 LLM 聊天抓取器。ZeroClaw 可以直接导入 OpenClaw 技能。MCP 服务器是代理调用的对象而技能是代理读取以决定何时以及如何调用的内容。它们不是替代品——一起安装时代理同时拥有工具和操作手册。Scrapeless MCP 服务器MCP 服务器开箱即用提供 20 种工具。核心工具集如下工具功能google_search使用gl/hl本地化参数进行 SERP 检索。google_trends流行搜索和时间序列兴趣数据。scrape_markdown通过云浏览器呈现 URL并返回 Markdown。scrape_html同上返回完整的渲染 HTML。scrape_screenshot捕获任何页面的高质量截图。browser_create分配或重用云浏览器会话。browser_goto导航会话至某个 URL。browser_click/browser_type/browser_press_key驱动交互式页面元素。browser_scroll/browser_scroll_to触发懒加载内容。browser_get_html/browser_get_text从当前云浏览器页面提取。browser_screenshot/browser_snapshot捕获状态以供审查或后续处理。browser_wait_for/browser_wait等待选择器或固定持续时间。browser_close释放会话。支持两种传输方式。标准输入npx -y scrapeless-mcp-server是本地运行 ZeroClaw 的工作站的默认方式可流式传输的 HTTPhttps://api.scrapeless.com/mcp是当代理在远程主机上运行并且操作员希望由 Scrapeless 托管 MCP 服务器而不是每次调用时创建时的默认方式。Scrapeless OpenClaw 技能这些技能是具有小型 Python 运行时的SKILL.md文件封装了特定的 Scrapeless API。二者都在官方 Scrapeless GitHub 组织中发布技能教导代理的内容webunlocker-skill驱动 Scrapeless 通用抓取 API——抓取 HTML / 普通文本 / Markdown / 截图 / 结构化内容并自动解决验证码reCAPTCHA、Cloudflare Turnstile、Cloudflare Challenge、JS 渲染、住宅代理出口带--country重试以及支持 POST 自定义头。llm-chat-scraper-skill收集来自 ChatGPT、Gemini、Perplexity 和 Grok 的结构化聊天响应——用于 AI 搜索监测和 GEO 测量工作流。ZeroClaw 继承了 OpenClaw 技能格式。技能被克隆到~/.zeroclaw/workspace/skills/中通过zeroclaw skills list列出并在下次zeroclaw agent会话中对代理可用。你可以用它做什么每日监控代理。安排一个每天早上运行的 ZeroClaw SOPgoogle_search跟踪的关键词scrape_markdown三个最好的结果进行总结通过 Discord 渠道适配器发送。AI 搜索可见性跟踪。使用 LLM Chat Scraper 技能按节奏提取 ChatGPT、Gemini、Perplexity 和 Grok 对品牌相关提示的响应跟踪随时间变化的存在感和情绪。来自公共目录的潜在客户生成。通过分页公共目录驱动云浏览器通过域名去重将记录交给代理的内存存储。有人工参与的身份验证表单填写。将供应商入职或职位申请表驱动到最终审查屏幕拍摄全页屏幕截图在提交前停止以便人工批准。与地理限制的竞争对手定价对比。在特定国家分配会话呈现本地化定价页面与之前的快照进行比较当阈值触发时向频道发送消息。基于实时出版商数据的 RAG。渲染出版商页面通过scrape_markdown清理文本嵌入到 ZeroClaw 的 SQLite 嵌入内存中以便将来检索。绕过 Cloudflare 针对良性研究目标。Web Unlocker 技能自动处理 Turnstile 和 Challenge 页面代理只看到干净的 Markdown 有效载荷。在 Scrapeless我们只访问公开可用的数据并严格遵守适用的法律、法规和网站隐私政策。本文内容仅供演示用途。为什么选择 ScrapelessScrapeless 是一个抗检测的云浏览器加上一个通用抓取 API加上一个 SERP API再加上一个 LLM Chat Scraper所有这一切都通过一个 API 密钥进行。具体到 ZeroClaw它提供一个本地的 MCP 服务器— 无需安装 SDK无需适配器代码。~/.zeroclaw/config.toml中的 MCP 块即是整个集成。云端 JavaScript 渲染使单页应用SPA、无限滚动 feeds 和懒加载面板成为browser_*工具和scrape_markdown的优先目标。覆盖195个以上国家的住宅代理使得与地理相关的查询返回当地用户看到的列表。每个会话的抗检测指纹识别— UA、时区、语言、屏幕分辨率、WebGL、画布每个会话随机化。自动 CAPTCHA 解决支持 reCAPTCHA、Cloudflare Turnstile 和 Cloudflare Challenge 通过 Web Unlocker 界面。一个统一的管理界面— 一个 API 密钥一个仪表板新的账户计划中有免费运行时间积分。在 app.scrapeless.com 上获取免费计划的 API 密钥。完整的 MCP 工具界面文档在 github.com/scrapeless-ai/scrapeless-mcp-serverAPI 接口文档在 docs.scrapeless.com。先决条件类 UNIX 主机。Linux、macOS 或 Windows 上的 WSL2。ZeroClaw 发布 Windows 版本但安装脚本和技能脚本假设为 POSIX shell因此最佳路径是 Linux / macOS / WSL2。Node.js 18 或更新版本用于 MCP stdio 传输npx -y scrapeless-mcp-server。Python 3.10 或更新版本用于 OpenClaw 技能它们作为 Python 脚本在scripts/中提供。Rust 工具链如果从源代码安装预构建的二进制路径不需要额外内容。Scrapeless 账户和 API 密钥— 在 app.scrapeless.com 注册并从设置 → API 密钥管理中复制密钥。LLM 提供者密钥— Anthropic、OpenAI、Ollama 或任何兼容 OpenAI 的端点。ZeroClaw 的入职向导会将其接入。git用于克隆技能代码库。jq是可选的 — 在管道 CLI 输出时很方便但 MCP 路径并不需要。安装 ZeroClaw完整设置分为两个子步骤。1. 运行安装程序bashCopycurl -fsSL https://raw.githubusercontent.com/zeroclaw-labs/zeroclaw/master/install.sh | bash安装程序会询问是否获取预构建的二进制文件约几秒或从源代码构建速度较慢可定制。两者最终都会以相同方式结束 —zeroclaw onboard会自动启动。要跳过最后的向导请传递--skip-onboard并在之后运行zeroclaw onboard。验证二进制文件是否在路径上bashCopyzeroclaw --version输出应类似于zeroclaw 0.7.5或更新版本。2. 完成入职向导bashCopyzeroclaw onboard向导将引导您选择提供者、线路通道、自主模式和个性化。对于此集成有两个设置很重要提供者— 选择已经配置的 LLM 提供者OpenAI、Anthropic、Ollama、兼容 OpenAI 的网关。在提示时粘贴 API 密钥。自主性—受监督是安全的默认设置代理将在调用中风险工具之前提示。MCP工具默认计算为中等风险。对于提示造成摩擦的开发环境向导还提供yolo模式操作员仅应在信任的机器上开启。通过启动聊天确认运行时已启动bashCopyzeroclaw agent如果返回“嘿”则应正常完成。如果是则运行时健康下一步是连接MCP服务器。将ZeroClaw连接到Scrapeless MCP服务器1. 在ZeroClaw外部进行MCP服务器的烟雾测试在将MCP块添加到config.toml之前确认服务器能够独立启动。ZeroClaw在代理启动时懒加载MCP服务器因此只有在代理第一次运行时错误的配置才会暴露——最好现在就捕捉它bashCopySCRAPELESS_KEYYOUR_SCRAPELESS_KEY npx -y scrapeless-mcp-server在第一次运行时npx从注册表下载scrapeless-mcp-server并通过标准输入启动服务器。该进程保持附加状态按Ctrl-C释放它。如果它打印了启动横幅并等待MCP请求则凭证和包都有效。在免费计划中获取您的API密钥app.scrapeless.com2. 将MCP块添加到~/.zeroclaw/config.tomlZeroClaw从全局配置中的[mcp]块读取MCP服务器配置。添加或合并以下内容tomlCopy# ~/.zeroclaw/config.toml [mcp] enabled true deferred_loading true servers [ { name scrapeless, command npx, transport stdio, args [-y, scrapeless-mcp-server], env { SCRAPELESS_KEY YOUR_SCRAPELESS_KEY }, headers {} } ]注意enabled true激活MCP子系统。最近的ZeroClaw版本默认为关闭状态。deferred_loading true保持守护进程启动快速ZeroClaw仅在代理实际启动会话时生成npx。env.SCRAPELESS_KEY是身份验证表面——与步骤1中的烟雾测试使用的密钥相同。对于托管的可流式HTTP传输而不是标准输入交换条目为tomlCopy{ name scrapeless, transport http, url https://api.scrapeless.com/mcp, headers { x-api-token YOUR_SCRAPELESS_KEY } }ZeroClaw的MCP客户端堆栈支持三种传输值——stdio、http和sse——通过验证强制执行标准输入的command/args以及远程传输的url/headers根据ZeroClaw问题#1380。当ZeroClaw在远程主机VPS或容器上运行且操作员不希望npx在其中运行时HTTP传输是正确的默认值。3. 从ZeroClaw内部验证连接重新启动代理会话以使其获取新配置并懒加载MCP服务器bashCopyzeroclaw agent在新聊天中询问Copy您可以访问哪些Scrapeless MCP工具代理应列出之前提到的20个工具 ——google_search、google_trends、browser_*集合、scrape_html、scrape_markdown、scrape_screenshot。如果答案说没有工具最常见的原因是[mcp]中的enabled false第二常见原因是SCRAPELESS_KEY中的拼写错误。安装Scrapeless OpenClaw技能MCP服务器是工具。技能是剧本。两个Scrapeless技能与ZeroClaw配合使用因为运行时直接支持OpenClaw技能格式。1. 在~/.zeroclaw/config.toml中允许技能脚本两个Scrapeless技能都提供scripts/目录代理将在其中执行。设置[skills]部分中的allow_scripts truetomlCopy# ~/.zeroclaw/config.toml [skills] allow_scripts trueallow_scripts默认关闭以确保安全。开启它则允许ZeroClaw根据已经实施的自主权政策运行技能打包的脚本中风险的脚本调用仍会在受监督模式下请求批准。2. 克隆技能库bashCopymkdir -p ~/.zeroclaw/workspace/skills git clone https://github.com/scrapeless-ai/webunlocker-skill ~/.zeroclaw/workspace/skills/webunlocker-skill git clone https://github.com/scrapeless-ai/llm-chat-scraper-skill ~/.zeroclaw/workspace/skills/llm-chat-scraper-skill3. 安装Python依赖和API令牌Web Unlocker技能提供requirements.txtbashCopycd ~/.zeroclaw/workspace/skills/webunlocker-skill pip install -r requirements.txt cp .env.example .env # 然后编辑 .env 并设置 X_API_TOKENYOUR_SCRAPELESS_KEY如果在代理的范围内也对LLM Chat Scraper技能重复执行此操作。4. 验证技能是否在ZeroClaw中可见bashCopyzeroclaw skills list输出应包括webunlocker-skill和llm-chat-scraper-skill。如果缺少它们最常见的原因是克隆落在~/.zeroclaw/skills/下而不是~/.zeroclaw/workspace/skills/— 后者是运行时监视的路径。ZeroClaw Scrapeless 实践案例一个现实的示例运营者跟踪的主题的每日竞争情报简报。代理定位新鲜来源提取内容并生成结构化摘要通过代理绑定的任一渠道发送。在zeroclaw agent中粘贴Copy为我生成关于“AI 代理框架”的过去 7 天的竞争情报简报。 1. 使用 Scrapeless MCP google_search 工具找到本周发布的 5 条最相关的新闻/博客文章。使用 glus, hlen。 2. 对于每个结果 URL使用 scrape_markdown 提取文章正文。丢弃导航内容和广告。 3. 使用 google_trends 获取查询 “AI 代理框架”的 7 天兴趣曲线以便我能够将需求信号与供应信号结合起来。 4. 生成结构化的 Markdown 报告包含 - 5 篇文章中的前三大主题每个主题附有一段总结和来源 URL。 - 7 天的趋势方向上升/平稳/下降及峰值日期。 - 一条“本周的变化”提示——相较于上周的简报有什么新内容。如果目标页面阻止云浏览器退回到 browser_create browser_goto browser_get_text 仅针对该 URL。不要替换合成内容如果无法检索来源将其列在“未检索来源”下。代理的计划通俗易懂调用google_search(qAI agent frameworks, glus, hlen)并选择看起来像主要来源的五个最新结果跳过聚合页面。通过scrape_markdown处理 URLs并将清理后的正文文本保存在工作内存中。调用google_trends(qAI agent frameworks, datenow 7-d)获取兴趣曲线。汇总成 Markdown 简报。对于任何通过scrape_markdown返回反机器人插页的 URL通过browser_create→browser_goto→browser_get_text链进行重试以启动车载浏览器会话并等待加载后再提取。在每次工具调用之前ZeroClaw 的supervised自主模式会提示确认 —Y表示一次性确认A表示在同一会话中记住该权限以供将来工具调用使用。要发送提示而无需进入交互聊天bashCopyzeroclaw agent --message 为我生成关于 AI 代理框架的过去 7 天的竞争情报简报……要将此转变为计划运行而非临时提示请在 cron 日程上注册 SOP并将其绑定到代理应通过的任一信道适配器Discord、Telegram、电子邮件交付简报。MCP 工具和技能保持不变只有触发器发生更改。您将收到的内容简报将以 Markdown 格式返回内容如下 — 摘自以上提示对五个实时 SERP 结果AI agent frameworks 2026的实际运行markdownCopy# AI 代理框架 — 每周简报2026年5月12日当周 ## 主题过去 7 天 1. **LangGraph 是共识生产标准。** 本周发布的所有三篇深入比较Towards AI、GuruSup、Alice Labs均将 LangGraph 排在生产工作负载的第一位。引用的原因趋同确定性图形执行、原生的人机交互检查点以及通过 LangSmith 提供的一流可观察性。来源: https://pub.towardsai.net/top-ai-agent-frameworks-in-2026-a-production-ready-comparison-7ba5e39ad56d 2. **MCP 正在成为跨框架工具集成标准。** Anthropic 的模型上下文协议 — 现由 Linux 基金会管理 OpenAI、Google、Microsoft、AWS 和 Salesforce 均在支持者名单上 — 在三篇比较中的两篇中被引用为代理与工具的标准。来源: https://gurusup.com/blog/best-multi-agent-frameworks-2026 3. **AutoGen / AG2 分裂是 2025–2026 年的主要发展。** Microsoft 已将 AutoGen 重写为 v0.4 并提供了新 API社区继续使用 v0.2 系列作为 AG2 (ag2.ai)。无论是 Alice Labs 还是 GuruSup 都指出这是团队评估多代理争辩框架时的“刻意选择”时刻。来源: https://alicelabs.ai/en/insights/best-ai-agent-frameworks-2026 ## 需求信号 - 7 天趋势不可用google_trends 在此运行中返回了暂时的上游错误 — 在下一个调度中重试 ## 本周变化 - Alice Labs 添加 Claude Agent SDK 作为新进入者排名第 2取代 CrewAI 排名第 3 — 这是我们见过的第一个将 Anthropic 官方 SDK 提升至多代理通用者之上的排名。 - AutoGen / AG2 分叉状态在三篇文章中提及 2 次较上周的 0 次有所增加。 ## 未检索来源 - 无 — alicelabs.ai SPA 要求使用 browser_* 回退路径已恢复结构遵循提示值是经过验证的工具链在简报运行当天实际返回的结果。一些基于实况运行的诚实观察scrape_markdown很好地清理了大多数出版商页面。在第一次尝试中Towards AI 和 GuruSup 返回了干净的 Markdown 正文。高度 JavaScript 渲染的单页应用在此运行中alicelabs.ai 是一个 Webflow / Vite SPA则返回了渲染后的 HTML 外壳 — 代理通过browser_create→browser_goto→browser_get_text链完成恢复返回了包括排名列表、关键要点、FAQ 和 2026年5月的更新时间戳在内的完整结构化页面快照。google_trends反映兴趣而非量 — 有时呈现短暂性。在验证运行中上游 Trends 调用返回了load failed错误该提示通过报告缺口而不是替换合成数据来处理这一情况。正确的重试策略是下一个计划运行而不是在同一代理回合内部进行热重试。每个来源的新鲜度各不相同。一些出版商在更新文章时会补充时间戳如果“新鲜度”绝对重要请交叉检查文章正文中的发布日期而不是SERP摘要。在此运行中的 Alice Labs 页面显示了2026年4月的发布日期和2026年5月的更新日期。反机器人插页和 SPA 外壳是正常现象而非例外。在任何涉及大规模商业网站的提示中都要为browser_*回退预留预算验证运行在三分之一的 URL 中遇到了一个恢复过程没有事件发生。结论一个读取实时网络的代理ZeroClaw Scrapeless 集成将操作员运行的步骤减少到四个安装 ZeroClaw在~/.zeroclaw/config.toml中注册 Scrapeless MCP 服务器将 OpenClaw 技能放入~/.zeroclaw/workspace/skills/并通过zeroclaw skills list和在zeroclaw agent中的工具列表提示进行验证。之后每一个接触网络的代理回合 — 研究、监控、潜在客户生成、RAG 摄取、AI 搜索可见性跟踪 — 都通过云浏览器、住宅代理和一个 API 密钥背后的 SERP API。对于其他客户端中的相同 Scrapeless 原语MCP 服务器教程涉及 Claude Desktop / Cursor / Codex CLIHermes 集成帖子涉及直接 CDPLangChain 集成帖子涉及 Python 代理。它们之间的模式是相同的固定一个住宅区域在多步骤流程中保持会话活跃将反机器人插页视为重试案例而非例外并让代理组合google_search→scrape_markdown→browser_*以满足提示的实际要求。准备构建您的 AI 驱动数据管道了吗加入我们的社区以领取免费计划并与在 Scrapeless 上构建本地代理管道的开发者联系Discord · Telegram。在 app.scrapeless.com 注册以获得免费的 MCP 运行时并将上述模式适应于 ZeroClaw 代理已经运行的任何工作流。常见问题解答Q1. Scrapeless MCP 服务器在 Windows 上工作还是仅在 Linux / macOS 上MCP 服务器是一个 Node.js 包 — 它可以在任何运行 Node 18 的地方运行包括 Windows。ZeroClaw 的安装程序假设使用 POSIX shell因此在 Windows 上最顺畅的路径是 WSL2。HTTP 传输变体将 ZeroClaw 指向https://api.scrapeless.com/mcp完全消除了本地npx依赖并且对于托管的 ZeroClaw 部署是最简单的选择。Q2. Stdio 还是可流式 HTTP — 哪种传输是正确的默认选择对于本地运行 ZeroClaw 的工作站使用 stdio。生命周期很简单ZeroClaw 在代理启动时生成npx -y scrapeless-mcp-server在代理停止时终止它。对于在 VPS 上或在容器中运行的 ZeroClaw使用 HTTP。Scrapeless 托管的端点消除了将npx和 Node 打包到运行时镜像中的需求。Q3. 抓取公共网络数据是否合法通常是合法的当数据是公开可见的并且工作流遵循每个网站的服务条款和适用的法律管辖区。法律立场因国家、网站和使用案例研究、商业转售、训练数据而异。在针对目标网站扩大工作流之前请审查其服务条款并咨询法律顾问以应对高容量或受监管的使用案例。Q4. MCP 服务器和 OpenClaw 技能是否重叠它们是互补的。MCP 服务器给代理提供工具— 具体的、可调用的接口google_search、scrape_markdown、browser_*。技能则赋予代理知识— Scrapeless 通用抓取 API 的行为何时回退到 JS 渲染应该请求何种响应类型如何将 CAPTCHA 解决与国家选择链式连接。一起安装代理同时拥有这两者。Q5. 当目标页面返回反机器人中介页面时会发生什么对于大多数页面的scrape_markdown云浏览器透明地解决挑战。对于仍然返回中介页面的页面标准的回退是browser_create→browser_goto→browser_wait_for一个已知的后挑战选择器 →browser_get_text。在任何接触商业网站的提示中为此回退留出预算上面的提示示例展示了其形态。Q6. ZeroClaw 的自主模式如何与 MCP 工具调用互动在supervised默认模式下代理在首次调用每个 MCP 工具之前会提示一次。操作员可以授予一次性批准Y或记住此工具批准A。在yolo模式下代理在没有提示的情况下调用工具该模式仅适用于受信任的开发盒子。Q7. 代理可以在单个回合中将 Scrapeless 调用组合成多步骤流程吗可以 — 这是设计的要点。单个代理回合通常链式连接google_search定位、scrape_markdown从规范 URL 提取和browser_*回退到互动或反机器人保护页面。ZeroClaw 将中间的工具调用流入同一对话上下文中。Q8. Scrapeless API 密钥存放在哪里对于 MCP 路径在~/.zeroclaw/config.toml中的env.SCRAPELESS_KEY或在可流式传输的 HTTPx-api-token头中。对于技能路径在每个技能目录中的.env文件里作为X_API_TOKEN。这两条路径是独立的轮换密钥意味着需要更新两个位置。Q9. ZeroClaw SOP 可以按计划触发相同的提示吗可以。使用 cron 触发器注册一个 SOP该触发器运行操作员会粘贴到zeroclaw agent --message ...中的相同提示。将 SOP 绑定到一个通道适配器Discord、Telegram、电子邮件简报将自动发送。supervised模式下的 SOP 仍然需要在批准后再进行中等风险的工具调用对于无人值守的定期运行SOP 需要在更宽松的自主模式下配置或预先授予工具权限。Q10. 关于 Scrapeless 的其他产品 — 抓取浏览器、通用抓取 API、SERP API 呢MCP 服务器将最常见的云浏览器、SERP 和抓取基础组件打包成一个 MCP 接口。对于需要直接使用完整抓取浏览器基础组件集的工作流CDP、自定义指纹、以session_ttl粒度的会话持久性请将抓取浏览器 CDP 端点接入 ZeroClaw 的内置browser工具中。两种方法是组合的它们并不冲突。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2631520.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！