RAGday13-day15
Day13RAG 常见问题 调优实战检索不到内容原因分块太小、关键词太偏、没做混合检索解决换递归 / 父子分块、加上 ES 混合检索、做 Query 改写搜到内容多但答不对原因检索杂、没重排、没上下文压缩解决加 Rerank 精筛、压缩冗余文本大模型总瞎编幻觉原因参考资料太少、给的上下文太乱解决补全检索资料、精简上下文、限制模型随意发挥RAG 调优核心就三步调分块 → 调检索混合 重排→ 调问句改写Day14RAG 项目工程落地要点文档预处理PDF、Word 先转纯文本去掉乱码、空格、无效页眉页脚增量更新不用每次全量重新入库新增文档单独分块、单独入库节省资源版本管理知识库分版本上线新策略可以灰度测试不好用随时回退权限控制不同角色只能看对应文档RAG 要加文档权限过滤Day15RAG 面试总结 整体架构收口RAG 两大核心检索靠谱 给到模型的上下文干净完整工业级流程终极版文档预处理 → 合理分块 → ES 建索引 向量入库→ Query 改写 → 混合检索 → Rerank 重排→ 上下文压缩 → 大模型生成 → 日志复盘迭代RAG 适合谁企业私有文档、法规手册、内部知识库、客服问答RAG 不适合谁实时热点、创意脑洞、复杂高数推理、纯主观创作面试必背一句话RAG 本质先找对资料再让模型照着资料老实回答减少瞎编
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2607938.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!