CLI-Anything 实战评测
CLI-Anything 实战评测给 GIMP 生成 CLI 接口Agent 操控专业软件的新思路本文基于实际使用和源码调试分析 CLI-Anything 项目的技术实现、存在的问题及适用场景。背景最近 GitHub 上有个叫 CLI-Anything 的项目https://github.com/HKUDS/CLI-Anything引起了我的注意。它的目标很明确为任意软件生成 CLI 接口让 AI Agent 能够操控专业软件。项目声称已经为 10 款软件生成了完整的 CLI包括 GIMP、Blender、LibreOffice、OBS Studio 等并且有 1458 项测试用例。这听起来很诱人但实际效果如何我决定亲自测试一下。环境准备# 克隆仓库gitclone https://github.com/HKUDS/CLI-Anything.gitcdCLI-Anything# 安装 GIMP CLI以 GIMP 为例cdgimp/agent-harness pipinstall-e.依赖项Python 3.10Pillow图像处理后端ClickCLI 框架prompt_toolkitREPL 支持初步测试创建项目python3-mcli_anything.gimp.gimp_cli project new\--width1920--height1080\-oposter.json输出Created project: untitled name: untitled version: 1.0 canvas: width: 1920 height: 1080 color_mode: RGB background: #ffffff dpi: 72项目文件格式是 JSON结构清晰{version:1.0,name:untitled,canvas:{width:1920,height:1080,color_mode:RGB,background:#ffffff,dpi:72},layers:[],metadata:{created:2026-03-11T23:05:20.298550,modified:2026-03-11T23:05:20.298566,software:gimp-cli 1.0}}到这里一切正常。发现问题Bug 1图层操作后不保存继续添加图层python3-mcli_anything.gimp.gimp_cli\--projectposter.json\layer new--nameBackground--typesolid--fill#1a1a2e命令执行成功输出显示图层已添加。但检查poster.json文件发现layers数组仍然是空的。问题分析查看源码cli_anything/gimp/gimp_cli.py第 235-245 行deflayer_new(name,layer_type,width,height,fill,opacity,mode,position):Create a new blank layer.sessget_session()sess.snapshot(fAdd layer:{name})projsess.get_project()layerlayer_mod.add_layer(proj,namename,layer_typelayer_type,widthwidth,heightheight,fillfill,opacityopacity,blend_modemode,positionposition,)output(layer,fAdded layer:{name})问题很明显snapshot()只是把当前状态保存到内存中的 undo 栈但没有调用save_session()保存到文件。Session 类的save_session()方法位于session.py第 88-103 行负责将项目写入磁盘但在layer_new等修改操作中从未被调用。修复方案在修改操作后添加自动保存逻辑deflayer_new(name,layer_type,width,height,fill,opacity,mode,position):Create a new blank layer.sessget_session()sess.snapshot(fAdd layer:{name})projsess.get_project()layerlayer_mod.add_layer(proj,namename,layer_typelayer_type,widthwidth,heightheight,fillfill,opacityopacity,blend_modemode,positionposition,)# 如果项目路径已设置自动保存ifsess.project_path:sess.save_session()output(layer,fAdded layer:{name})同样的问题也存在于draw_text、layer_remove等多个修改操作中需要逐一修复。Bug 2文字层设置后不保存python3-mcli_anything.gimp.gimp_cli\--projectposter.json\draw text-tAI 打工人--size120--color#ffffff--x660--y400命令执行成功但 JSON 文件中的文字内容没有更新。问题分析draw_text函数gimp_cli.py第 655-678 行修改了图层属性但同样缺少保存操作。修复方式与 Bug 1 相同。修复后测试应用上述修复后重新测试完整流程# 1. 创建项目python3-mcli_anything.gimp.gimp_cli project new\--width1920--height1080-oposter_final.json# 2. 添加背景层python3-mcli_anything.gimp.gimp_cli\--projectposter_final.json\layer new--nameBackground--typesolid--fill#1a1a2e# 3. 添加文字层python3-mcli_anything.gimp.gimp_cli\--projectposter_final.json\layer new--nameTitle--typetext# 4. 设置文字内容python3-mcli_anything.gimp.gimp_cli\--projectposter_final.json\draw text-tAI 打工人--size120--color#ffffff--x660--y400# 5. 导出图像python3-mcli_anything.gimp.gimp_cli\--projectposter_final.json\exportrender poster_cli_final.png输出Rendered to: poster_cli_final.png output: poster_cli_final.png format: PNG size: 1920x1080 file_size: 13665 file_size_human: 13.3 KB preset: png layers_rendered: 2检查生成的 JSON 文件确认图层和文字内容已正确保存{layers:[{id:1,name:Title,type:text,text:AI 打工人,font:Arial,font_size:120,color:#ffffff,offset_x:660,offset_y:400},{id:0,name:Background,type:solid,fill:#1a1a2e}]}生成的 PNG 文件大小 13.3 KB1920x1080 分辨率符合预期。架构分析设计思路CLI-Anything 的核心设计思路是为软件生成统一的 CLI 接口而不是直接操作软件本身。以 GIMP 为例┌─────────────────┐ │ AI Agent │ │ (Claude Code, │ │ OpenClaw 等) │ └────────┬────────┘ │ CLI 命令 ▼ ┌─────────────────┐ │ CLI-Anything │ │ (Click CLI) │ └────────┬────────┘ │ JSON 项目文件 ▼ ┌─────────────────┐ │ Pillow / │ │ GIMP Batch │ │ (后端引擎) │ └─────────────────┘这种设计的优点是统一接口所有软件都遵循相同的 CLI 模式可发现性通过--help可以查看所有可用命令结构化输出支持--json参数输出机器可读格式会话管理支持 undo/redo适合交互式使用项目格式CLI-Anything 使用 JSON 作为项目文件格式这是一个明智的选择人类可读便于调试机器可解析便于 Agent 处理跨平台无编码问题易于版本控制但这也带来一个问题JSON 文件需要显式保存而当前的 Session 设计倾向于内存操作导致数据丢失。与其他方案对比方案对比表方案优点缺点适用场景CLI-Anything统一接口、可发现性好开发中状态、灵活性受限批量任务、多软件协作直接写代码灵活、快速需要知道 API、每次重新实现一次性任务、原型开发GUI 自动化不需要 API脆弱、依赖 UI 稳定性无 API 的闭源软件官方 API稳定、功能完整每个软件不同、学习成本高深度集成场景实际体验从开发者角度CLI-Anything 的学习成本确实较低。一旦掌握了project new、layer new、export render这几个核心命令就可以操作 GIMP、Blender、LibreOffice 等多个软件。但问题在于当需要超出预定义命令的功能时就无法继续了。比如 GIMP CLI 目前没有实现滤镜操作、路径绘制等高级功能。相比之下直接写 Python 代码虽然学习成本高但灵活性更好。比如用 Pillow 实现海报生成只需要几行代码fromPILimportImage,ImageDraw,ImageFont imgImage.new(RGB,(1920,1080),#1a1a2e)drawImageDraw.Draw(img)draw.text((660,400),AI 打工人,fillwhite,size120)img.save(poster.png)适用场景分析基于实际测试我认为 CLI-Anything 适合以下场景适合批量重复任务每天处理 100 张图片标准化文档生成固定工作流自动化多软件协作统一接口管理 GIMP Blender LibreOffice跨软件工作流编排CLI 为主的 AgentClaude Code 等主要靠 CLI 的 Agent不允许执行任意代码的环境不适合一次性灵活需求临时任务直接写代码更快复杂定制需求需要精细控制超出 CLI 预定义功能能直接写代码的 AgentOpenClaw 等有exec工具的 Agent可以直接调用 Python 库项目质量评估优点测试覆盖完善1458 项测试用例单元测试 端到端测试100% 通过率文档详细HARNESS.md 记录了方法论每个软件有独立的架构文档命令参考完整设计思路清晰统一 CLI 接口JSON 项目格式会话管理undo/redo缺点开发中状态存在保存 bug部分命令未实现需要自己修复后端依赖GIMP CLI 需要安装 GIMP 才能完整使用部分功能依赖外部工具如 ffmpeg灵活性受限只能做预定义的操作扩展需要修改源码结论CLI-Anything 是一个有想法的项目它试图解决 AI Agent 操控专业软件的问题。从设计理念来看统一 CLI 接口、结构化输出、可发现性等思路都是正确的。但从实际使用来看项目还处于早期开发阶段存在保存 bug 等问题。对于能直接写代码的 Agent如 OpenClawCLI-Anything 的价值有限。但对于 CLI 为主的 Agent如 Claude Code它提供了一个标准化的解决方案。个人建议如果你是 Agent 开发者可以学习 CLI-Anything 的设计思路如果你需要批量处理任务可以试用 CLI-Anything如果你需要灵活定制直接写代码可能更合适如果想参与开源欢迎贡献代码项目需要更多维护者参考资料CLI-Anything GitHub: https://github.com/HKUDS/CLI-AnythingPillow 文档: https://pillow.readthedocs.io/OpenClaw: https://github.com/openclaw/openclaw
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2409072.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!