想要将AI Agent完全应用到自动化测试中,我们还需要做哪些努力?

news2026/5/1 7:50:09
过去一年AI Agent的概念在测试领域被反复讨论。从Open-AutoGLM、AppAgent到Midscene、Mobile-Agent各种开源方案和商业产品层出不穷。在各类技术分享和PR稿里我们看到了太多跑通了一个登录流程、成功点击了三个按钮的Demo。不可谓不炫酷不可谓不吸引眼球。但冷静下来想想这些Demo距离真正的工程化落地到底还有多远说实话现在的AI Agent做自动化测试能力上限确实在不断刷新。单步操作的准确率在提升视觉理解能力在进步多模态模型让看懂界面这件事变得不再那么困难。然而与此同时我们看到的更多问题却来自于能力下限——稳定性不足、执行路径不确定、业务理解浮于表面、可控性几乎为零。这篇文章不想画饼也不想泼冷水。我只想聊聊现实AI Agent在自动化测试领域到底走到了哪一步那些Demo展示不了的能力下限问题是什么以及如果真的想把这个技术用起来我们还需要做哪些努力一、现状AI Agent做自动化测试到底走到了哪一步主流方案的能力边界目前市面上能看到的AI Agent自动化测试方案大致可以分为几类通用GUI Agent方案以Open-AutoGLM、AppAgent、Mobile-Agent为代表。这类方案的核心能力是看懂界面并操作——通过视觉模型理解当前页面状态然后决定下一步操作。这类方案的优势在于通用性不依赖特定的应用结构可以适配各种GUI界面。测试专用方案以Midscene为代表。这类方案针对测试场景做了优化内置了断言、等待、数据提取等测试专用能力使用门槛相对更低。平台型方案通常是商业产品将Agent能力封装成完整的测试平台提供录制回放、用例管理、报告分析等配套功能。这些方案能做什么简单流程跑通登录、搜索、下单、退出这类单链路操作的成功率已经比较可观单步操作准确率不错点击、输入、滑动等基础UI操作多模态模型已经能准确识别视觉理解有进步相比纯坐标定位视觉理解让脚本对UI变化的适应性提升了不少但与此同时不能做什么同样明显复杂业务逻辑理解多条件分支、状态流转、异常处理这些需要业务上下文的内容Agent基本无能为力长时间稳定性跑10次和跑1000次是两回事随着执行时间拉长失败率会显著上升跨应用协作很多测试场景需要跨越多个应用的协作比如从App跳转到微信支付Agent目前很难处理核心判断当前阶段AI Agent在自动化测试领域处于能用但不敢用的状态。从能用到敢用中间还差一个量级——这个量级差在哪里后面的章节会详细展开。二、准确率这道坎95%还不够很多人觉得95%的准确率已经很高了差不多够用了。但这个认知在测试场景下往往是致命的。测试场景对准确率的要求与其他AI应用场景有本质区别。在其他场景里一次翻译错了大不了再翻一次一个推荐不准用户也不会追着客服投诉。95%的准确率意味着5%的体验下降但总体可用。在测试场景里一次断言误判可能就是一次误报——让开发浪费宝贵的时间去排查一个根本不存在的bug。更可怕的是误报会磨损团队对自动化测试的信任久而久之大家看到测试失败的第一反应不是去修bug而是去怀疑测试本身是不是又抽风了。反过来如果断言漏判了——也就是看起来没问题但其实有问题——那就是漏测是质量事故。而且95%的数字本身就有迷惑性。让我们拆开看看模型幻觉问题大模型的幻觉问题在测试场景下会以一种非常隐蔽的方式体现出来。比如你让Agent去验证用户已登录这个状态Agent可能会看到页面上有欢迎MODEL_A用户的字样于是判断登录成功。但实际情况可能是这个字样是从缓存里读取的用户实际上已经掉线了刷新一下页面就会露馅。这种case的可怕之处在于Agent的执行过程看起来完全正常输出日志也头头是道但结论是错的。更要命的是这类问题很难通过多跑几次来发现因为它只在特定条件下才会触发。环境敏感问题测试环境从来都不是一个稳定的存在。网络延迟、分辨率差异、动画过渡期、字体渲染差异……这些在人工测试时几乎不会被注意到的因素在Agent执行时却可能成为致命杀手。我见过最离谱的case是因为测试服务器负载波动页面加载时间从1秒变成了1.5秒Agent在等待过程中看到了loading动画于是判断页面加载失败实际上刷新一下就好了。这类问题的本质是Agent缺乏对可接受延迟的判断能力。人类测试工程师知道等一下就好但Agent可能会选择放弃或者把loading状态误识别为其他元素。关键观点测试场景对准确率的容忍度远低于其他AI应用。在其他领域95%意味着基本可用在测试领域95%意味着还有5%的概率把团队带进沟里。这不是一个可以接受的失败率。三、稳定性从能跑通到能持续跑如果准确率问题解决的是做对了吗那么稳定性问题解决的是能一直做对吗。这两件事其实是独立的——一个Agent可以每次都执行正确的操作但执行路径不稳定也可以每次都走相同的路径但操作本身是错的。执行路径不确定当前大多数Agent方案都存在路径不确定性问题。简单来说同样的指令今天执行可能走A路径明天执行可能走B路径最终都能完成任务但中间的过程不一样。这在测试场景下是个大麻烦。因为测试的核心价值之一恰恰在于可重复性——如果每次执行的路径都不一样那怎么保证测试覆盖的一致性怎么定位问题怎么计算代码变更对测试的影响更实际的问题是当测试失败时你需要一个确定的复现路径来定位问题。但如果Agent每次走的路径都不一样那上次能跑这次不能跑就会变成常态排查成本会急剧上升。资源消耗问题多模态推理的成本远比大多数人想象的要高。一次完整的GUI页面理解需要把截图编码后送入模型再经过推理得到结果。这个过程的token消耗和耗时都远超纯文本操作。当测试用例规模扩大Agent需要反复理解页面、反复决策时资源消耗会成为一个不可忽视的问题。更糟糕的是这种消耗与测试用例的复杂度不一定是线性关系——一个复杂的测试用例可能需要几十次页面理解和决策消耗的资源可能抵得上几十个简单用例。恢复能力问题当Agent执行过程中遇到错误时它能自己恢复吗答案是大多数情况下不能。当前Agent的容错机制通常比较简单失败了要么重试要么直接退出。在简单的Demo场景下这可能够用但在真实业务场景里错误是多种多样的有些是临时性的如网络抖动有些是环境问题如测试数据被污染有些是产品bug如按钮位置偏移。Agent很难区分这些情况并采取正确的应对措施。关键观点稳定性测试本身就需要稳定性。如果用来做测试的工具本身就不稳定那用它来保证产品质量无异于缘木求鱼。从能跑通到能持续跑中间隔着的不只是技术问题更是对测试工程本质的理解。四、可控性Agent做了什么你能说清楚吗这一章可能是整个文章里最不酷的部分因为它不讨论能力而是讨论约束。但恰恰是这部分决定了AI Agent能否在企业级场景落地。执行黑盒大模型的决策过程是一个黑盒。你知道Agent点击了提交订单按钮但你不知道它为什么点击——是因为识别到了按钮上的文字还是因为按钮在某个特定位置还是纯粹随机这种黑盒特性带来的问题是当测试结果不符合预期时你很难判断是Agent理解错了还是产品本身有问题。在传统自动化测试里如果测试失败了工程师可以通过查看截图、日志、执行记录来定位问题。但Agent的执行过程可能涉及大量的隐式推理这些推理记录通常不会出现在测试报告里导致问题排查变得困难。操作审计在一些对合规性要求较高的行业如金融、医疗测试记录需要满足审计要求。这意味着你需要能够证明Agent确实执行了预期的操作执行的时间、顺序、环境都是确定的操作结果被正确记录这些要求对于传统自动化测试来说不算难但对于Agent来说需要额外的设计才能满足。比如需要记录Agent每一步的推理过程和决策依据而不仅仅是最终的操作结果。安全边界Agent有没有可能误操作敏感功能答案是有可能。现在的Agent方案通常会提供一些危险操作的配置项如删除数据、发起支付让用户可以选择是否允许Agent执行这些操作。但在实际使用中敏感操作的边界往往很难界定。比如删除一条测试数据算不算敏感操作在某些场景下这可能是测试的必要步骤在另一些场景下这可能造成严重后果。更麻烦的是Agent的行为边界往往是动态的——同样的指令在不同的上下文下可能触发不同的操作。如果Agent学会了执行某个危险操作通过Prompt注入或其他方式它可能会绕过安全限制。关键观点企业级落地可控性比能力更重要。一个能力90分但完全不可控的方案可能还不如一个能力70分但每一步都可追溯的方案。对于测试这种需要高度确定性的工作来说可控性是底线要求。五、业务理解Agent懂操作但不懂业务让Agent去点击登录按钮这件事大多数方案都能做到。让Agent去验证用户登录后的权限是否正确这件事大多数方案都做不到。这不是技术能力的差距而是认知层次的差距。操作vs业务Agent能理解的是操作——点击、输入、滑动、等待。这些是UI层面的行为有明确的视觉表征。Agent难以理解的是业务——为什么要登录登录后应该有什么权限不同角色的用户在登录后能看到不同的内容吗这些是业务层面的规则需要业务上下文才能理解。举个例子测试一个电商App的我的订单页面。Agent可以轻松地点击我的tab然后点击订单tab然后验证页面标题是’我的订单’“。但Agent很难回答为什么要验证页面标题我的订单’和’全部订单’的区别是什么如果用户没有订单页面应该显示什么”测试用例的业务上下文测试用例从来不是孤立的操作步骤。每个用例背后都有前置条件比如用户已登录或用户已完成实名认证数据依赖比如该用户有3笔历史订单或商品MODEL_X的库存为0业务规则比如订单超过30分钟未支付自动取消或会员用户享受9折优惠预期结果不是页面显示订单列表而是订单列表按时间倒序排列包含商品名称、价格、数量等信息这些上下文信息对于人类测试工程师来说是常识但对于Agent来说是缺失的。除非你把这些信息显式地告诉它——而这往往意味着大量的额外工作。断言的语义深度断言是测试用例的核心。一个好的断言应该验证业务状态是否正确而不仅仅是UI元素是否存在。比如对于一个登录功能浅层断言“页面有’登录成功’字样”深层断言“用户session已创建后端返回了正确的用户信息本地存储了token用户信息被正确展示”Agent擅长的是浅层断言——它可以轻松识别UI元素。但深层断言需要理解业务逻辑需要访问系统内部状态这是Agent的短板。测试策略的制定更进一步的问题是测试策略本身需要业务理解。哪些功能需要优先测试哪些场景容易出问题哪些边界条件需要重点覆盖这些问题的答案来自于对业务的深刻理解而不是对UI的观察。一个好的测试工程师会根据自己对业务的理解来制定测试策略会知道哪些地方容易出bug会在关键路径上投入更多精力。但Agent目前还做不到这一点——它只能被动地执行给定任务无法主动判断这个功能很关键需要多测几个case。关键观点测试的核心从来不是操作是判断。操作是可以自动化的但判断需要业务理解。当前AI Agent的能力边界恰好卡在了操作这一层而无法深入到判断。这是一个需要长期努力才能突破的瓶颈。六、工程化从PoC到产品化的鸿沟聊完技术问题让我们来看看工程化层面的挑战。框架集成大多数测试团队都有自己的测试框架——可能是Pytest Allure可能是TestNG ExtentReports可能是自研的测试平台。把AI Agent集成到现有体系里不是简单地把Agent包装成一个可以执行测试的工具而是需要Agent的执行结果能被现有框架理解如JUnit格式的报告Agent能读取现有框架的配置如环境变量、测试数据Agent的执行能被现有CI/CD流程调度Agent生成的报告能与现有报告体系合并这些集成工作听起来不复杂但实际做起来会发现Agent的输出格式往往是定制化的与标准测试框架的兼容性并不好。用例管理传统自动化测试的用例管理已经比较成熟用例版本控制、评审流程、优先级分类、用例与代码的关联……这些机制在AI Agent方案里都需要重新设计。核心问题是Agent执行的用例是什么如果是一条自然语言指令如帮我测试MODEL_A的登录功能那怎么对它进行版本控制怎么评审它的覆盖度怎么把它和具体的代码变更关联起来目前还没有成熟的最佳实践很多团队都是摸着石头过河。环境适配AI Agent对测试环境的敏感程度远超传统自动化脚本。测试环境通常配置简单负载不稳定Agent在这里的表现可能和预期有差异预发环境更接近生产但可能有一些特殊的配置或数据Agent需要适应生产监控虽然一般不会在生产环境执行完整的测试但有些团队会用Agent做生产巡检Agent在这三种环境下的表现可能差异很大需要分别调优和适配。团队协作AI Agent的使用对团队成员的能力提出了新的要求。传统测试工程师可能擅长的是用例设计、缺陷分析、业务理解。但如果要使用Agent方案还需要理解Agent的工作原理和局限性能够写出清晰、无歧义的指令知道如何设计Agent友好的测试场景能够排查Agent执行异常的原因这些能力不是一夜之间能培养出来的需要持续的学习和实践。成本核算最后也是最现实的问题钱。AI Agent方案的成本主要来自于大模型的推理费用。目前主流的多模态模型每千次推理的成本在几美元到几十美元不等。对于一个中大型项目来说如果每天需要执行数千次测试用例费用会是一个不可忽视的数字。相比之下传统自动化脚本的执行成本几乎为零——它只需要计算资源不需要外部API调用。因此在评估AI Agent方案时不能只看能不能用还要看划不划算。对于高频、大规模的回归测试传统脚本可能仍然是最优解对于低频、需要探索新场景的测试Agent的价值更明显。七、我们还需要做哪些努力说了这么多问题并不是要否定AI Agent的价值而是要清醒地认识现状把有限的精力投入到真正需要突破的方向上。以下是我认为在不同时间阶段需要重点努力的方向。短期可突破6个月内1. 建立Agent操作的安全沙箱敏感操作必须有人工确认机制。这不是限制Agent的能力而是确保Agent不会做出不可挽回的操作。沙箱应该提供操作拦截、延迟执行、人工审批等能力让Agent在安全边界内发挥价值。2. 构建业务知识库让Agent有上下文可查。知识库应该包含业务流程文档、数据字典、业务规则说明、历史缺陷记录等。Agent在执行测试时可以从知识库中获取必要的业务上下文减少对背诵的依赖。3. 设计混合架构Agent负责探索脚本负责回归。这是最务实的分工方式用Agent去发现新问题、探索未知场景、验证边界case用传统脚本执行高频率、高确定性的回归测试两者各司其职互补而非替代。4. 完善执行日志和可解释性每一步操作都应该可追溯。日志不应该是简单的操作记录而应该包含Agent的推理过程和决策依据。这样当测试失败时工程师可以快速定位问题——是Agent理解错了还是产品本身有问题。中期需攻克1-2年5. 小模型微调用测试场景数据训练专属模型在特定领域内降低幻觉率、提升准确率。相比通用大模型专属小模型的成本更低、响应更快、针对特定任务的效果更好。6. Agent编排框架多Agent协作处理复杂测试流程。不同的Agent可以负责不同的职责理解测试需求规划测试路径执行具体操作验证执行结果生成测试报告通过合理的编排让专业的人做专业的事。7. 自愈机制UI变化后Agent自动适配。当页面布局调整、元素位置移动、控件样式变更时Agent应该能够自动识别这些变化并调整操作策略而不是直接失败。这需要结合视觉理解、元素定位历史、异常检测等多种技术。8. 测试用例的标准化描述语言人和Agent都能理解的语言。设计一套标准化的测试用例描述语言既能被人类理解和编写又能被Agent解析和执行。这需要在测试工程和AI两个领域都有深入的理解。长期待解决2年以上9. 业务理解的深度突破从操作到策略。Agent不仅要能执行操作还要能理解为什么需要这些操作什么情况下需要调整策略。这需要AI在业务理解方面有质的飞跃可能依赖于更先进的模型架构或训练方法。10. 行业标准与合规框架AI Agent做测试的认证体系。什么样的Agent方案可以用于生产环境需要满足哪些标准这些问题需要行业协会、标准化组织、甚至监管机构的参与。11. Agent自我进化根据历史执行数据优化策略。好的测试工程师会从历史经验中学习知道哪些地方容易出问题、哪些case容易漏测。Agent也应该具备这种能力能够从过去的执行记录中提取有价值的信息持续优化自己的策略。八、写在最后写这篇文章的过程中我一直在提醒自己不要过度悲观也不要盲目乐观。悲观没有意义。AI技术的发展速度远超我们的想象今天觉得不可能的事情可能两年后就变成了标配。而且测试工作的本质是保证质量而不是证明某项技术不行。如果AI Agent真的能帮我们提升测试效率、减少漏测我们应该张开双臂拥抱它。盲目乐观同样危险。技术Demo和工程化落地之间往往隔着意想不到的鸿沟。那些在Demo里看起来完美无缺的方案到了真实环境里可能会遇到各种各样的小问题——环境差异、数据复杂性、边界case、团队能力……每一个细节都可能成为拦路虎。我的建议是把Agent当工具而不是替代品。AI Agent不会取代测试工程师就像Excel没有取代会计、CAD没有取代工程师一样。工具会改变工作的方式但不会消除对专业人才的需求。真正会被取代的是那些不愿意学习新工具、不愿意适应新方式的测试工程师。当前最务实的做法是先在Agent能做好的场景用起来。哪些场景适合Agent通常是那些人类执行成本高、重复性低失败后果可接受有兜底方案对准确率要求相对宽松允许一定程度的误报比如探索性测试、新功能的冒烟验证、边界case的发现……这些场景Agent能发挥价值同时不会因为Agent的失误造成严重后果。在实践中积累经验在经验中迭代认知这才是推进AI Agent在测试领域落地的正确姿势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2571362.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…