AI 会取代测试工程师吗?来看看最新“AI程序员”Devine的翻车现场
引言:一条被炒得过热的赛道2024年3月,Cognition Labs发布了Devin——一款被官方冠以“世界首位AI软件工程师”头衔的产品。演示视频中,Devin自主浏览文档、编写代码、运行测试、提交PR,甚至能在Upwork上接单挣钱。资本市场迅速反应:Cognition Labs在A轮融资中拿到了2100万美元,公司估值一路飙升至20亿美元。一时间,“程序员即将失业”的论调铺天盖地。然而,就在Devin发布后的几个月中,一系列独立测试报告陆续曝光,结果比宣传视频所展示的“惨烈”得多。2025年1月,AI研发实验室Answer.AI的三名数据科学家公开发表了一篇名为《与Devin共度一个月的感想》的博客,系统记录了他们对Devin长达一个月的真实测试体验。测试结果震惊了整个开发者社区:在提交给Devin的20项真实任务中,它只圆满完成了3项,14项彻底失败,成功率仅为15%。更为讽刺的是,分析者亲自复现了Devin在演示视频中完成的任务,结果只用了大约36分钟就完成了,而Devin在演示中却花费了至少6个小时,甚至可能超过一天。人类效率远超AI——这就是被称为“世界首位AI软件工程师”的真实水平。但这篇文章不想停留在“嘲笑AI翻车”的层面。我们真正想探讨的问题是:当AI程序员的“翻车”成为常态,软件测试工程师这个职业究竟会走向何方?AI到底会取代测试工程师,还是会重新定义测试的价值?为了回答这个问题,我们将从Devin的架构设计出发,对比当前主流AI编程工具的能力边界,深入剖析AI生成代码的
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2631971.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!