LLM工程化实践——RAG基础入门(一)
大模型 RAG 系统基础入门1. RAG 是什么RAG Retrieval-Augmented Generation检索增强生成先从外部知识库检索相关信息再送给大模型生成答案。解决 LLM 三大问题知识过时、幻觉、隐私数据不可访问。2. 核心基础概念LLM大语言模型负责理解、推理、生成文本。Embedding向量 / 嵌入把文本变成可计算的向量用于语义匹配。Vector Database向量数据库存储、检索向量。Chunk文本分块把长文档切成小段提高检索精度。Retrieval检索从知识库中找到与问题最相关的内容。Prompt Engineering提示工程指导模型基于检索内容回答。Hallucination幻觉模型编造不存在的信息RAG 主要目标之一就是抑制。3. RAG vs Fine-tuningRAG低成本、实时更新、安全可控、适合知识库问答。Fine-tuning适合改风格、强逻辑、任务范式学习。实际工程RAG 为主微调为辅。4. RAG技术架构5. RAG技术体系
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2529479.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!