BrowserOS:本地优先的AI浏览器,用自然语言实现网页自动化

news2026/5/3 10:08:46
1. 项目概述当浏览器遇上AI一个本地优先的智能工作流革命如果你和我一样每天的工作都离不开浏览器——查资料、填表单、监控数据、管理多个SaaS后台那你一定也幻想过要是能有个“数字员工”帮我自动处理这些重复的网页操作就好了。过去几年AI Agent智能体的概念很火但大多数要么是云端服务你的数据得先上传要么就是独立的脚本工具和浏览器本身是割裂的用起来总感觉隔了一层。直到我深度体验了BrowserOS。这不仅仅是一个“内置了AI的浏览器”它是一个从根本上重新思考了“浏览器作为操作系统”可能性的开源项目。简单来说BrowserOS是一个基于Chromium深度定制的开源浏览器但它最核心的“灵魂”是一个原生运行在你电脑上的、拥有53种浏览器自动化工具的AI智能体平台。你可以用自然语言告诉它“帮我把GitHub上这个仓库最近一周的issue整理成表格并总结出高频关键词”它就能在浏览器里自动完成导航、点击、滚动、提取数据、分析并生成报告的全过程。最关键的是这一切都发生在你的本地机器上你可以使用自己的OpenAI、Claude、Gemini的API密钥甚至完全离线运行Ollama或LM Studio的本地模型你的浏览数据、操作记录、提取的信息从头到尾都不会离开你的电脑。这解决了我的一个核心痛点隐私与效能的平衡。我不想把敏感的网页数据比如公司内部系统、含个人信息的页面发送到不知名的云端AI服务但又渴望AI带来的自动化效率。BrowserOS的“本地优先”架构正好踩在了这个痛点上。它不像ChatGPT Atlas或Perplexity Comet那样是封闭的云端黑盒而是一个你可以完全掌控、审计甚至自行修改的开源工具。对于开发者、研究员、数据工作者以及任何需要高频处理网页信息的人来说这无疑打开了一扇新的大门。2. 核心架构解析Chromium的“心脏”与AI的“大脑”如何协同BrowserOS的架构设计清晰地体现了其“两层融合”的理念理解这一点对于后续的深度使用和问题排查至关重要。2.1 底层深度定制的Chromium“心脏”BrowserOS并非简单地在Chrome浏览器上套一个扩展。它直接fork分叉了Chromium的源代码并进行了深度修改。这意味着它从底层就拥有了对浏览器核心行为的完全控制权。为什么选择fork Chromium而不是开发一个扩展这是一个关键的设计决策。普通的浏览器扩展运行在沙盒环境中权限受到严格限制尤其是对于自动化操作如模拟点击、拦截网络请求、注入脚本的精细控制。通过fork ChromiumBrowserOS团队可以移除谷歌服务应用了类似ungoogled-chromium项目的补丁从源头切断与Google服务器通信奠定了隐私基础。深度集成MCP Server模型上下文协议Model Context Protocol MCP是Anthropic提出的一种让AI模型安全、结构化地使用工具的标准。BrowserOS将MCP Server直接内置于浏览器进程使得AI智能体可以以极低的延迟、最高的权限调用浏览器自动化工具如navigate_to,click_element,extract_text这比通过扩展API桥接的方式要高效和稳定得多。支持Manifest V2扩展这是一个对高级用户非常友好的特性。尽管Chrome已强推Manifest V3并限制了广告拦截器等扩展的能力但BrowserOS保留了V2支持。这意味着你可以继续使用功能完整的uBlock Origin等经典扩展获得比Chrome更强的广告与跟踪器拦截能力。实现真正的“垂直标签页”等原生功能这些UI/UX的改进是浏览器级别的体验更流畅而非扩展模拟的。实操心得这种架构带来的直接好处是性能和无感集成。当你启动BrowserOS时它就是一个完整的、独立的浏览器。AI侧边栏、聊天界面、工作流编辑器都是其原生界面的一部分而不是浮于表面的插件。这避免了扩展与浏览器之间常见的通信延迟和兼容性问题。2.2 上层TypeScript/Go构建的AI智能体“大脑”这是BrowserOS的“灵魂”所在一个独立的、模块化的智能体平台通过进程间通信与底层的Chromium“心脏”对话。Apps/Server (Bun)这是核心的AI智能体运行时。它是一个用Bun一个快速的JavaScript运行时编写的服务器暴露了超过53个MCP工具。当你通过聊天界面或CLI发出指令时就是这里的逻辑在解析你的自然语言规划步骤并通过Chrome DevTools Protocol (CDP) 调用底层浏览器执行操作。它同时管理着对话记忆、工作流执行和定时任务。Apps/Agent (WXT React)这是用户直接交互的浏览器扩展部分提供了新标签页、侧边栏聊天窗口、设置页面等。它使用现代框架WXT基于Vite的浏览器扩展开发框架和React构建负责将用户的指令传递给Server并展示执行结果。Apps/CLI (Go)一个用Go编写的命令行工具。这是为高级用户和开发者准备的“后门”。你可以通过终端直接启动BrowserOS、控制标签页、触发智能体任务更重要的是它可以作为一个MCP Server被Claude Code、Cursor等AI编程助手直接调用实现“用AI编程助手来控制AI浏览器智能体”的套娃式自动化。Agent SDK (Node.js)对于想要二次开发的用户BrowserOS提供了browseros-ai/agent-sdk这个npm包。你可以用它在你自己的Node.js项目中创建自定义的浏览器自动化智能体复用BrowserOS的核心能力。架构优势总结这种“厚客户端本地服务”的架构在提供强大AI能力的同时确保了响应速度和数据隐私。所有的AI推理无论是调用云端API还是本地模型和浏览器自动化逻辑都在你的电脑上完成网络仅在你使用云端LLM时用于传输加密的API请求。3. 从零开始实战安装、配置与核心功能上手理论说得再多不如亲手操作一遍。下面我将带你完成从安装到实现第一个自动化任务的完整流程。3.1 系统准备与安装BrowserOS提供了各主流平台的安装包过程非常直观。下载安装包macOS直接下载.dmg文件打开后拖拽到“应用程序”文件夹即可。Windows下载.exe安装程序以管理员身份运行跟随向导完成安装。Linux推荐使用.AppImage文件下载后赋予执行权限 (chmod x BrowserOS.AppImage) 即可双击运行。对于Debian/Ubuntu用户.deb包能提供更好的系统集成。注意首次启动时系统可能会提示“无法验证开发者”。在macOS上你需要进入“系统设置”-“隐私与安全性”找到并允许运行。这是因为它尚未获得苹果的公证对于开源项目早期版本是正常现象。初始设置与数据迁移 首次启动BrowserOS会贴心询问你是否从Chrome或Edge导入书签、历史记录、密码和扩展。我强烈建议你进行导入这能让你无缝切换几乎感觉不到使用习惯的中断。导入过程在本地完成数据不会上传。3.2 连接你的AI“引擎”BrowserOS本身不提供AI能力它是一个卓越的“执行者”需要你为它配备“大脑”。访问AI设置点击浏览器右上角的BrowserOS图标或在新标签页中进入设置找到“AI Providers”选项。选择并配置提供商云端API推荐初学者最方便的是配置Kimi K2.5默认提供无需额外操作或OpenAI (GPT-4o)。你只需要填入从OpenAI官网获取的API Key即可。对于Claude (Anthropic)和Gemini (Google)同理。OAuth便捷登录对于ChatGPT Plus/Pro和GitHub Copilot用户BrowserOS支持OAuth授权。点击对应按钮会跳转到官方登录页面授权后即可使用无需手动复制密钥更安全便捷。本地模型隐私至上Ollama确保你已在本地安装并运行了Ollama例如在终端运行ollama run llama3.2下载并运行一个模型。然后在BrowserOS的设置中将AI提供商选为“Ollama”并填入本地API地址通常是http://localhost:11434。之后你就可以在模型下拉列表中看到你本地拉取的所有模型。LM Studio过程类似确保LM Studio的本地服务器在运行并填入正确的地址和模型名称。配置技巧你可以配置多个AI提供商并在聊天时随时切换。例如我通常将Claude设置为默认擅长复杂推理同时配置好本地的Qwen2.5-Coder用于代码相关任务根据任务类型灵活选择。3.3 初探核心功能你的第一个AI自动化任务让我们从一个最简单的实用场景开始自动提取网页文章的核心内容并总结。打开侧边栏聊天在任意网页点击浏览器右侧边栏的BrowserOS图标打开聊天界面。发出指令假设你正在浏览一篇长文技术博客。在聊天框中输入“请阅读当前页面的主要内容并为我总结出三个关键要点。”观察执行BrowserOS的智能体会自动开始工作。你会在屏幕上看到高亮显示它正在“阅读”的区域状态栏会显示“正在分析页面内容...”。大约几秒到十几秒后取决于模型速度它就会在聊天窗口输出清晰的要点总结。深入探索工具完成总结后你可以继续对话“将这三个要点保存到一个新的Markdown文件中并以‘技术总结-日期.md’的格式命名存放在我的桌面。” 这时智能体会调用cowork协同工作功能在本地创建文件并写入内容。这个简单流程背后智能体可能调用了多个MCP工具get_page_content获取页面文本、analyze_and_summarize调用LLM总结、create_file创建文件、write_to_file写入内容。而你全程只需要用自然语言沟通。3.4 进阶功能可视化工作流与定时任务当你发现某个自动化流程需要反复执行时就该用到Workflows工作流功能了。场景每天上午9点自动检查GitHub上指定仓库的新Issue提取标题和链接并发送到Slack的某个频道。创建工作流在BrowserOS的新标签页或侧边栏中找到“Workflows”并点击创建。可视化编排你会看到一个画布。从左侧拖拽节点触发节点选择“定时任务”设置为“每天 09:00”。浏览器节点选择“导航到”输入你的GitHub仓库Issues页面URL。AI节点选择“提取数据”在指令中描述“提取所有状态为‘open’的issue的标题和链接”。数据处理节点选择“格式化数据”将其整理成清晰的列表。应用节点选择“发送Slack消息”配置好你的Slack Webhook和频道。连接节点用连线将节点按逻辑顺序连接起来形成一个有向无环图。保存并启用给工作流命名保存后将其状态切换为“启用”。从此这个流程就会在后台自动运行。你可以在“Scheduled Tasks”中查看执行历史和日志。实操心得工作流编辑器目前可能还有些粗糙但它的逻辑非常直观。对于复杂的多步骤任务先用工作流画出来能极大地帮助你理清逻辑也便于后续的修改和维护。它比写代码更快速比单纯用语言描述更结构化。4. 开发者视角CLI、MCP集成与二次开发对于开发者和技术爱好者BrowserOS提供了更强大的编程式控制接口。4.1 使用BrowserOS-CLI用命令行驾驭浏览器browseros-cli是一个独立的命令行工具让你可以脱离GUI通过脚本控制浏览器。安装CLI# macOS/Linux curl -fsSL https://cdn.browseros.com/cli/install.sh | bash # Windows (PowerShell) irm https://cdn.browseros.com/cli/install.ps1 | iex初始化连接确保BrowserOS正在运行然后在终端执行browseros-cli init。CLI会自动发现本地运行的BrowserOS实例并建立连接。基础命令体验# 打开一个新标签页并访问网址 browseros-cli tabs open --url https://github.com/trending # 获取当前所有标签页信息 browseros-cli tabs list # 在指定标签页执行AI指令 browseros-cli agent execute --tab-id TAB_ID --instruction 提取当前页面所有仓库的名字和star数输出为JSON # 启动一个预定义的工作流 browseros-cli workflows run --name 我的日报收集流程应用场景你可以将CLI命令写入Shell脚本结合cronLinux/macOS或任务计划程序Windows实现更复杂的、与系统深度集成的自动化。例如在每日构建服务器完成后自动打开BrowserOS导航到部署页面点击部署按钮并截图发送通知。4.2 作为MCP Server集成与AI编程助手深度联动这是我认为BrowserOS最“未来感”的特性。你可以将它配置为Claude Code、Cursor等AI编程助手的MCP服务器。在Claude Code中配置编辑Claude Code的MCP配置文件通常是~/.config/claude-code/mcp.json或%APPDATA%\Claude Code\mcp.json。添加BrowserOS Server将BrowserOS的MCP服务器地址通常是http://localhost:5173或运行browseros-cli mcp-server-info获取添加到配置中。{ mcpServers: { browseros: { command: npx, args: [-y, browseros-ai/agent-sdk, mcp-server], env: { BROWSEROS_URL: http://localhost:5173 } } } }重启并体验重启Claude Code。现在当你在代码编辑器中向AI助手描述一个与网页相关的任务时比如“帮我去W3C官网查一下最新的CSS Grid规范并把例子复制过来”AI助手可以直接调用BrowserOS的工具去执行并将结果插入到你的编辑器中。这彻底改变了人机协作范式你不再需要自己切换窗口、复制粘贴。AI编程助手成为了一个能直接操作现实世界浏览器的超级副驾。4.3 基于Agent SDK进行二次开发如果你有更定制化的需求可以直接使用其Node.js SDK。import { BrowserOSAgent } from browseros-ai/agent-sdk; async function scrapeProductPrices() { const agent new BrowserOSAgent({ // 指向本地运行的BrowserOS MCP服务器 serverUrl: http://localhost:5173, llmConfig: { provider: openai, apiKey: process.env.OPENAI_API_KEY } }); // 启动一个新浏览器会话 const session await agent.createSession(); // 导航到电商网站 await session.navigateTo(https://example-store.com/laptops); // 使用自然语言指令提取数据 const products await session.extractData({ instruction: 找出页面上所有笔记本电脑的产品名称、价格和评分按价格从低到高排序。 }); console.log(products); // 关闭会话 await session.close(); }这为你将BrowserOS的自动化能力嵌入到自己的Node.js应用如数据爬虫、自动化测试、监控报警系统中提供了可能。5. 深入功能矩阵如何最大化你的生产力BrowserOS的功能非常丰富下表梳理了其核心功能模块及对应的最佳实践场景帮助你按图索骥功能模块核心价值典型应用场景实操技巧与避坑指南AI Agent (53 Tools)自然语言驱动浏览器自动化数据抓取、表单填写、内容监控、竞品分析、重复性网页操作。技巧指令越具体越好。与其说“查一下天气”不如说“导航到weather.com在搜索框输入‘San Francisco’获取今天和明天的气温与降水概率”。避坑动态加载的网页如无限滚动、SPA需要让智能体“滚动页面”或“等待元素出现”。MCP Server被其他AI工具调用实现工具链联动在Claude Code中编程时直接让AI助手操作浏览器获取资料在自动化脚本中集成浏览器能力。技巧确保BrowserOS在后台运行且MCP服务器已启用默认开启。避坑防火墙或安全软件可能会阻止本地回环地址localhost的通信如遇连接问题请检查。Workflows可视化、可重复的自动化流程每日/每周数据报表自动生成、社交媒体跨平台发布、价格监控与报警、定期网站健康检查。技巧复杂工作流先画草图。利用“变量”节点在不同步骤间传递数据。避坑网页结构变化会导致基于元素选择器的步骤失败建议在关键步骤后加入“条件判断”或“错误处理”节点。Cowork打通浏览器与本地文件系统网页研究后自动保存资料到指定文件夹将网页表格导出为本地CSV批量下载图片并重命名。技巧使用绝对路径或配合~家目录来指定文件位置避免权限问题。避坑文件操作有风险首次使用建议先在一个临时文件夹测试避免误覆盖重要文件。Scheduled Tasks让自动化在后台无人值守运行定时签到、定时抢购、定时备份网页内容、定时发送监控报告。技巧为定时任务设置合理的执行间隔避免过于频繁请求对目标网站造成压力。避坑电脑休眠或锁屏可能导致任务暂停对于关键任务请确保系统设置允许在后台运行。LLM Hub多模型响应对比撰写重要邮件或文案时同时获取Claude、GPT-4、Gemini的版本择优选用或融合。技巧可以针对不同模型微调同样的指令如对Claude强调文采对GPT强调简洁观察其差异。SOUL.md定义AI助手的人格与专长创建一个“学术研究助手”人格指令它优先使用谷歌学术并以严谨的格式输出参考文献或创建一个“社交媒体小编”人格语气活泼擅长提炼爆点。技巧SOUL.md支持Markdown。用清晰的章节如# Personality,# Capabilities,# Constraints来组织。在Constraints中明确禁止事项非常重要。6. 常见问题与故障排查实录在实际使用中你可能会遇到一些问题。以下是我和社区用户遇到的一些典型情况及解决方法。6.1 安装与启动问题问题在macOS上启动时提示“文件已损坏”或“无法验证开发者”。解决这是macOS Gatekeeper的安全机制。前往“系统设置” “隐私与安全性”在“安全性”部分你应该能看到关于BrowserOS的拦截信息点击“仍要打开”即可。如果没看到可以尝试在终端执行sudo xattr -cr /Applications/BrowserOS.app请谨慎操作确保路径正确。问题Linux下AppImage文件无法运行。解决首先确保文件有执行权限chmod x BrowserOS.AppImage。某些发行版可能需要安装FUSE库来支持AppImage运行sudo apt install libfuse2Ubuntu/Debian系。6.2 AI功能相关问题已配置API Key但AI聊天没有反应或一直显示“思考中”。排查步骤检查网络如果是云端模型确认网络通畅特别是能否访问对应API服务如api.openai.com。检查密钥确认API Key输入正确且未过期。对于OpenAI可以在其平台检查额度。检查本地模型如果使用Ollama在终端运行ollama list确认模型已下载并运行ollama run 模型名测试模型是否能正常响应。查看日志在BrowserOS的设置中通常有“高级”或“日志”选项查看是否有具体的错误信息。问题智能体执行网页操作时失败例如“找不到元素”。解决这是网页自动化最常见的问题。网页结构可能已更新。使用更通用的指令避免使用“点击第三个蓝色按钮”这种依赖视觉的描述改用“点击‘提交’按钮”或“点击id为‘submit-btn’的元素”。分步调试先让智能体“获取当前页面的所有按钮文本”或“描述当前页面的主要区域”了解它“看到”了什么再发出精确指令。加入等待在操作前可以要求智能体“等待2秒直到页面加载完成”。6.3 性能与资源问题BrowserOS感觉比Chrome更占用内存。分析这是正常的。BrowserOS在运行一个完整的Chromium实例的同时还运行着一个Node.js/Bun服务AI智能体服务器。内存占用会比纯浏览器高。你可以通过其内置的任务管理器类似Chrome的ShiftEsc查看具体进程的资源消耗。优化建议如果内存紧张可以尝试禁用一些暂时不用的浏览器扩展或者减少同时打开的标签页数量。对于定时任务可以考虑在非工作时间运行。6.4 社区与支持问题遇到了文档中没有的Bug或有新功能想法。最佳路径查阅现有Issue首先去GitHub仓库的 Issues 页面搜索很可能已经有人提出。提交新Issue如果是Bug请详细描述复现步骤、操作系统版本、BrowserOS版本和错误信息。如果是功能请求可以去专门的 Feature Requests 讨论。加入社区Discord和Slack频道是获取实时帮助、与开发者和其他用户交流的绝佳场所。很多使用技巧和临时解决方案都是在社区里最先分享出来的。7. 横向对比与选型思考它真的适合你吗在决定是否将BrowserOS作为主力工具前不妨将其与主流方案进行对比。需求维度BrowserOS传统浏览器 扩展 (如Selenium, Puppeteer脚本)云端AI浏览器助手 (如Perplexity Comet)RPA工具 (如UiPath, Power Automate)上手难度低。自然语言交互无需编程。高。需要学习编程语言和浏览器自动化框架。极低。开箱即用。中高。需要图形化编排或脚本学习曲线较陡。定制灵活性中高。支持工作流、SDK、CLI可深度定制。极高。代码实现理论上无所不能。极低。功能封闭无法定制。高。企业级工具功能强大可集成各种系统。数据隐私极高。本地优先数据不出设备。高。脚本在本地运行。低。所有浏览数据需上传至服务商。取决于部署。可本地部署但云版同样有隐私顾虑。成本免费。开源自备API Key。免费工具本身。订阅制。通常按月付费。昂贵。通常是企业级付费软件。维护成本中。网页结构变化需调整指令但比维护代码简单。高。网页任何改动都可能导致脚本失效需要持续维护代码。低。由服务商维护。中高。需要维护自动化流程。适合人群技术爱好者、效率追求者、隐私敏感者、轻度开发者。希望用AI提升网页操作效率又不愿牺牲隐私或学习复杂编程。软件开发者、测试工程师。需要高度可控、可集成的自动化解决方案。普通用户。只需要简单的网页问答和摘要功能对隐私不敏感。企业IT、业务部门。需要构建复杂、稳定、跨应用的企业级自动化流程。我的个人体会是BrowserOS填补了一个关键的市场空白——一个以隐私为核心、以自然语言为交互界面、同时保持高度可扩展性的个人生产力工具。它不是要取代专业的开发框架或企业级RPA而是让AI驱动的浏览器自动化变得像使用搜索引擎一样简单真正赋能每一个非技术背景的用户。如果你厌倦了在重复的网页操作上浪费时间又对将数据交给云端AI心存疑虑那么BrowserOS绝对值得你花上一个下午的时间深度体验。它的开源属性也意味着你可以亲眼见证并参与塑造这个工具的未來。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2577924.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…