从实践中提炼的架构设计与工程规范
前端开发工程师、技术日更博主、已过CET6 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》、《前端求职突破计划》蓝桥云课签约作者、上架课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你从入门到实战全面掌握 uni-app》文章目录一、架构设计核心原则实战版二、标准分层架构企业通用三、工程规范直接进团队文档1API 规范2Prompt 规范3RAG 规范4部署规范5安全规范6成本规范7日志规范四、上线前必做检查防崩清单五、一句话总结最精髓一、架构设计核心原则实战版统一入口不裸调模型所有业务 → 网关层 → 模型服务绝不前端直连第三方API。能规则就规则能检索就检索最后才大模型查询、计算、固定流程 → 用代码/数据库知识问答 → RAG自然语言生成 → 大模型模型与业务解耦今天用GPT明天换文心/通义/Llama业务代码不动。必须有缓存、限流、降级缓存扛重复请求限流防账单爆炸降级保证服务不死。输入必校验输出必审核输入防注入、防恶意prompt输出防幻觉、违规、越权。流式优先异步兜底对话用stream长任务用异步不阻塞、体验好。多模型路由动态选择简单问题小模型复杂问题强模型敏感问题本地模型。一切可观测日志、埋点、监控调用量、耗时、token、成本、错误率、幻觉率全都要看得见。二、标准分层架构企业通用接入层鉴权、限流、流量管控、协议统一业务层意图识别、状态管理、流程控制、工具调用能力层RAG检索、函数调用、插件系统、多模态模型调度层路由、熔断、重试、负载均衡模型适配层统一封装OpenAI/文心/通义/Claude/本地模型护栏层敏感词、越权行为、违规输出、事实校验日志与治理层审计、成本、质量、复盘三、工程规范直接进团队文档1API 规范统一使用类 OpenAI 格式/v1/chat/completions必传参数request_id、user_id、scene、stream统一返回结构code、data、message、usage2Prompt 规范固定结构角色 约束 资料 格式 示例禁止超长prompt必须走RAG禁止动态拼接用户输入无过滤温度 factual0.10.3创意0.40.73RAG 规范文档分段200~500 token召回数量3~8段召回策略向量 关键词混合必加引用来源减少幻觉4部署规范模型服务容器化Docker外网模型走代理统一出口IP白名单流式返回用SSE不轮询量化优先INT4/INT8降低显存5安全规范用户输入过滤对抗指令、敏感词、越权请求输出审核违规、极限词、越权承诺关键业务必须人工审核绝不把业务数据、隐私数据传入公网模型6成本规范相同请求必须缓存历史对话自动截断简单请求强制走低成本模型每日/每月额度硬限制7日志规范必记录输入、输出、耗时、token、场景、模型不记录敏感信息手机号、身份证、密钥全链路可追踪四、上线前必做检查防崩清单超时设置重试机制熔断降级缓存策略额度限制敏感词过滤输出审核转人工兜底全链路日志监控告警五、一句话总结最精髓大模型应用要做好就三件事架构分层解耦工程规范稳定安全护栏兜底。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2588211.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!