智能记账本:OpenClaw+Qwen3.5-9B自动归类信用卡消费邮件
智能记账本OpenClawQwen3.5-9B自动归类信用卡消费邮件1. 为什么需要自动化记账工具每次收到银行消费短信时我都会陷入两难手动记账太繁琐不记账又会导致月度消费分析失真。传统记账软件需要手动输入金额和分类而银行发送的邮件通知里其实已经包含了完整的交易信息——只是这些信息散落在收件箱里需要人工提取和归类。上个月我尝试用OpenClaw配合Qwen3.5-9B模型搭建了一个自动化记账系统。现在每当收到招商银行的消费通知邮件系统会自动提取关键信息智能判断消费类型并将结构化数据填入Google Sheets表格。整个过程完全自动化我的记账时间从每月3小时缩短到了零。2. 系统架构与核心组件2.1 技术选型思路这个自动化记账系统由三个核心部分组成邮件抓取模块通过OpenClaw的IMAP技能定期扫描收件箱识别银行发送的消费通知邮件信息提取模块使用Qwen3.5-9B模型解析邮件正文提取商户名称、消费金额和交易时间数据入库模块将结构化数据通过Google Sheets API写入预设的记账表格选择Qwen3.5-9B是因为它在中文文本理解和信息提取任务上表现优异。测试发现对于星巴克(北京朝阳大悦城店)这类商户名模型能准确识别出餐饮类别而不会误判为购物。2.2 环境准备在开始前需要确保本地部署OpenClaw我使用macOS一键安装脚本能访问Qwen3.5-9B模型的API端点我使用星图平台部署的镜像Google Sheets编辑权限和API凭证# OpenClaw基础安装 curl -fsSL https://openclaw.ai/install.sh | bash openclaw onboard --install-daemon3. 关键实现步骤3.1 配置邮件监控技能首先安装邮件处理相关技能包clawhub install email-processor google-sheets然后在OpenClaw配置文件中添加IMAP服务器信息{ skills: { email: { imap: { host: imap.qq.com, port: 993, user: your_emailqq.com, password: your_app_password, mailbox: INBOX } } } }这里需要注意QQ邮箱需要使用授权码而非登录密码。配置完成后可以通过命令测试连接openclaw skills email check-connection3.2 设计信息提取prompt为了让Qwen3.5-9B准确提取信息我设计了以下prompt模板你是一个专业的财务助手。请从以下邮件正文中提取消费信息 邮件正文{{email_text}} 请按JSON格式返回 1. merchant_name商户全称 2. amount消费金额(仅数字) 3. currency货币类型(CNY/USD等) 4. transaction_time交易时间(YYYY-MM-DD HH:MM格式) 5. category消费类型(餐饮、交通、购物等) 如果无法确定category请留空。这个prompt经过多次迭代加入了以下优化明确要求只返回数字金额避免带上货币符号规定时间格式方便后续处理允许category为空避免模型强行猜测3.3 配置Google Sheets集成在Google Cloud Platform创建项目启用Sheets API然后下载credentials.json文件。将其放在OpenClaw配置目录mv ~/Downloads/credentials.json ~/.openclaw/然后创建记账模板表格记录下Spreadsheet ID。测试写入功能openclaw skills sheets test-write --spreadsheet-id YOUR_ID4. 模糊匹配与分类规则4.1 商户名称标准化银行邮件中的商户名往往包含分店信息如麦当劳(北京西站店)。我建立了一个商户别名映射表{ merchant_aliases: { 麦当劳.*: 麦当劳, 星巴克.*: 星巴克, 滴滴出行.*: 滴滴出行 } }OpenClaw会在调用模型前先用正则表达式将原始商户名标准化。这样星巴克(朝阳大悦城店)和星巴克(三里屯店)都会被归类为星巴克。4.2 自定义分类规则对于模型无法准确分类的情况我设置了优先级规则先检查用户定义的精确匹配规则然后尝试关键词匹配如包含火锅→餐饮最后才使用模型预测规则配置文件示例{ category_rules: [ { merchant: 瑞幸咖啡, category: 餐饮 }, { pattern: .*医院.*, category: 医疗 } ] }5. 系统优化与效果验证5.1 性能优化技巧初期测试发现每次处理邮件都要调用大模型token消耗很大。我做了以下优化缓存机制对相同商户的消费直接复用上次分类结果批量处理每小时处理一次邮件而不是实时响应简化prompt去掉不必要的说明文字缩短上下文最终平均每笔消费的处理成本从0.03元降到了0.005元。5.2 准确率测试我收集了200封历史邮件进行测试指标初始版本优化后金额提取准确率92%100%分类准确率76%94%处理速度8秒/封2秒/封特别是对连锁商户的分类准确率提升明显这得益于别名标准化和规则优先的策略。6. 遇到的问题与解决方案6.1 邮件格式变化最初系统上线两周后突然停止工作发现是招商银行更新了邮件模板。解决方案是在prompt中加入更多示例添加邮件模板版本检测对解析失败的情况发送告警通知6.2 跨时区问题有一次出差到国外系统将当地货币消费都错误归类。修复方法是在prompt中明确要求识别货币类型添加汇率转换模块在表格中增加原币种金额列7. 最终效果与使用建议现在我的记账系统已经稳定运行三个月自动处理了487笔消费记录。每月底Google Sheets会自动生成消费分析图表帮助我优化开支。对于想尝试类似系统的开发者我的建议是从小范围开始先处理单一银行的邮件建立完善的错误处理机制避免漏记定期检查分类规则适应消费习惯变化这个项目的最大价值不是节省了多少时间而是让我养成了理性消费的习惯。通过自动化的数据积累和分析我能更清晰地看到资金流向做出更明智的财务决策。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2453249.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!