【开源首发】双脑 AI 工作流:强制模型隔离 + 省 60% Token,完美替代 CrewAI,支持本地 Ollama 免费跑
前言大家好我是一名大一的生物医药数据科学专业学生。最近半年一直在用 AI 做各种自动化工具前前后后踩了 LangChain 和 CrewAI 的无数坑。我发现所有主流 AI Agent 框架都有一个致命的设计盲区它们默认相信 AI 能自己监督自己。但实际用下来你会发现让同一个模型既规划任务又审核结果本质上就是让学生自己改卷子。它会用完美的逻辑自圆其说自己的幻觉改十轮都发现不了问题最后 Token 还哗哗烧。忍无可忍之下我花了两个月课余时间写了一个完全不同思路的 AI 工作流引擎AI Flow Architect今天正式开源。核心就一条不可打破的铁律负责规划的模型绝对不能负责审核。一、我踩过的那些无解的坑相信每一个用过 AI Agent 框架的人都感同身受角色混淆是天生的你把产品、开发、测试的 prompt 写得再详细跑着跑着 AI 就忘了自己是谁测试开始写代码产品开始改架构自审等于没审让 GPT-4o 检查 GPT-4o 写的代码它会拍着胸脯说 没有任何问题结果一运行全是低级 bugToken 浪费到肉疼每次调用都传完整上下文一个简单的任务跑下来几十块钱没了还不知道花在哪了调试地狱出了问题根本不知道是哪一步错了只能对着几百行日志瞎猜我试过所有能找到的优化方法拆分 prompt、加角色前缀、手动做上下文压缩、加人工审核... 最后发现这些全都是治标不治本。调 prompt 解决不了这个问题这是架构层面的缺陷。二、我的解决方案强制双脑隔离架构既然 AI 不能自己监督自己那我就用两个完全独立的 AI。我设计了一个固定的三阶段双脑流程从根上解决这个问题Brain1建筑师只用强模型如 gpt-4o、Claude Sonnet只负责一件事把用户的模糊需求拆解成可执行的任务蓝图每一步都明确专家角色和交付标准用户审批蓝图生成后必须经过用户确认不满意可以随时修改从源头避免 AI 跑偏浪费 Token调度器执行所有专家创意 / 评估 / 编程 / 评审都是完全独立的会话互相不知道对方的存在只能通过结构化字段传递数据彻底杜绝角色混淆Brain2监理强制使用和 Brain1 不同的模型只负责一件事逐项对比 需求蓝图 和 最终交付物不合格直接打回对应步骤修改两个大脑完全隔离Brain2 根本看不到 Brain1 的思考过程只能做客观的第三方仲裁。亲测 OpenAIAnthropic 的组合能发现 90% 以上单模型看不到的幻觉和遗漏。三、与主流框架核心对比为了质量我主动放弃了所有主流框架都在吹的 无限灵活性用固定流程换可预测性和质量控制。这是我们最核心的差异维度AI Flow ArchitectLangChainCrewAI质量控制✅ 内置跨模型强制仲裁❌ 完全手动实现⚠️ 可选单模型自审Token 优化✅ 4 种机制零配置自动运行❌ 需手动编写优化逻辑❌ 需手动编写优化逻辑角色隔离✅ 架构层面强制会话隔离❌ 不强制共享上下文❌ 不强制共享上下文四、实测效果Token 直接砍 60%除了质量提升最让我惊喜的是成本控制。同样是 设计并实现一个用户管理系统 的任务这得益于我内置的 4 种零配置 Token 节省机制开箱即用不用你写一行代码✅语义缓存相同专家 相同任务直接命中缓存跳过 API 调用✅上下文自动压缩历史超过阈值自动精简减少约 60% 输入 Token✅本地规则预检查空任务、无效专家等直接拦截0 成本✅智能跳过步骤失败自动终止后续流程低复杂度步骤自动跳过五、3 分钟快速上手手把手教程1. 安装git clone https://github.com/wdnmd1265/ai-flow-architect.git cd ai-flow-architect pip install -e .2. 配置复制.env.example为.env添加你的 API 密钥# 单OpenAI密钥即可开箱即用 OPENAI_API_KEYsk-your-key # Brain2会自动选择gpt-4o-mini做审核3. 运行import asyncio from ai_flow_architect import FlowArchitect async def main(): # 一行代码初始化什么都不用额外配置 architect FlowArchitect(config{brain1: gpt-4o}) result await architect.run(设计一个用户管理系统) if result[status] success: print(f质量评分: {result[audit_result].get(score, N/A)}/100) else: for suggestion in result[revision_suggestions]: print(f修改建议: {suggestion}) asyncio.run(main())4. 本地 Ollama 运行完全免费如果你不想花钱用云模型完美支持本地 Ollama安装 Ollamahttps://ollama.com/拉取模型ollama pull llama3修改配置architect FlowArchitect(config{ brain1: llama3, brain2: qwen2.5-coder })六、已支持的所有模型提供商目前已经支持所有主流模型新增提供商只需要在models.yaml里加几行配置不用修改任何 Python 代码云厂商OpenAI、Anthropic、通义千问、智谱 GLM、月之暗面、DeepSeek本地部署Ollamallama3、qwen2.5-coder 等所有模型自定义兼容所有 OpenAI 格式的 APIvLLM、LocalAI、代理服务七、工程化保障作为一个个人开发者的项目我特别注重稳定性和可维护性✅ 114 个单元测试覆盖所有核心模块✅ 三级错误处理指数退避重试→自动模型降级→用户决策✅ 三层提示系统全局格式约束 角色预设 任务指令保证输出一致性✅ 字段过滤仅传递专家必需的输入字段避免信息过载八、写在最后必须坦诚地说它不是万能的也绝对不是 LangChain 和 CrewAI 的替代品。如果你需要高度定制化的复杂 Agent、需要调用各种工具链、需要无限灵活的流程那 LangGraph 和 CrewAI 会更适合你但如果你只是想让多个 AI 帮你完成一个可预测的任务—— 写代码、写文档、做设计、分析数据 —— 并且希望输出质量有保证、不会乱花 Token、调试简单那这个工具绝对值得一试项目今天刚开源还有很多不完善的地方。路线图里的 CLI 工具、PyPI 包、并行执行、流式输出、Web UI 都在紧锣密鼓地开发中。我是一个大一学生。有任何 bug 或者建议都可以在 GitHub 提 issue我会第一时间回复。如果觉得这个项目对你有帮助麻烦去 GitHub 点个 Star这对我这个个人开发者真的非常非常重要。谢谢大家项目地址https://github.com/wdnmd1265/ai-flow-architect
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2626905.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!