前言
上一篇:【知识库1】聊一聊关于知识库中用到的几个模型:“生成式语言模型、检索模型、检索增强生成模型(RAG)”我们聊了三个模型之间的区别与关系,这篇文字中我们将更深入的谈一谈:RAG的工作原理以及适用场景。
在前几天和朋友一起聊了一个话题:
知识库是否能解决一切问题?是不是只要我把知识库建立维护起来了,就能解决我想要咨询的问题呢?
在回答这个问题之前,我们需要先知道知识库的工作原理:
RAG模型通过“检索+生成+反馈”三个步骤,实现了从知识库中提取信息到生成高质量回答的完整流程。它的核心优势在于结合了语义检索的精准性和生成模型的流畅性,同时通过多轮交互不断优化,适应复杂对话场景。
1. 检索阶段:从知识库中找到相关信息
-
工作内容:当用户提出问题时,RAG模型会先将问题转化为一种特殊的“数字表达”(称为向量),然后在知识库中搜索与这个向量最匹配的内容。
-
技术亮点:
-
- 使用类似BERT的预训练模型,将问题和知识库中的文档片段都转化为向量。
- 不是简单地匹配关键词,而是通过“语义相似度”(如余弦相似度)找到语义上最相关的文档片段。
- 即使问题表述模糊,RAG也能通过语义理解找到合适的知识。
-
重要性:检索阶段决定了后续生成答案的质量。如果检索到的内容不相关或不完整,生成的回答可能就不准确。
2. 生成阶段:将检索到的信息变成流畅答案
-
工作内容:RAG的生成器(通常基于BART或GPT等模型)会结合用户的问题和检索到的文档片段,生成一段连贯、自然的回答。
-
技术亮点:
-
- 生成器不仅能让回答读起来通顺,还能确保内容基于知识库中的事实。
- 相比传统生成模型,RAG的回答更准确,因为它参考了外部知识库,而不是仅凭模型“记忆”生成。
-
优势:生成的回答既有语言的流畅性,又有事实依据,适合需要高准确性的场景。
3. 多轮交互与反馈:让对话更智能
-
工作内容:在多轮对话中,RAG会把之前的对话内容和用户反馈作为参考,优化后续的检索和生成。
-
技术亮点:
-
- 系统通过学习用户的反馈,逐步调整检索和生成策略,让回答越来越贴合用户需求。
- 支持复杂的多轮对话,能整合多轮信息,进行更深入的推理。
-
优势:这种反馈机制让RAG在长时间对话中表现更灵活,适合需要持续交互的场景,比如客服机器人或知识问答系统。
RAG模型的工作流程可以总结为以下几个步骤:
1、输入查询:用户提交自然语言问题
2、问题向量化:系统将问题转化为向量表示(如使用Embedding模型)
3、文档检索
双路径并行:
向量检索技术:通过向量相似度匹配
传统检索技术:如BM25进行关键词匹配
目标:从知识库中提取最相关的文档片段
4、生成器处理
接收原始查询 + 检索到的文档片段
利用大语言模型(LLM)生成自然语言答案
关键点:答案结合查询意图和文档上下文
5、输出结果
将生成的答案返回给用户
确保回答准确且基于最新知识

核心特点标注:
蓝色节点:数据预处理阶段
紫色节点:多路径检索技术
橙色节点:知识库交互
青色节点:答案生成核心流程
粉色节点:用户交互端点
在了解了知识库的基本原理之后,我们来做一个实验:
假设我有一个知识库,这个知识库包含所有学生的姓名、年龄、以及每个科目的成绩。

我现在将这份数据导入到知识库:

由于是通过excel导入的,我们可以看到,知识库中是将整个excel作为一个向量存储,因此,基本能回答我们的问题:

下面我们通过txt的文件格式创建一个知识库:


当我发起问题:曾十一的分数是不是最高
从下图的结果可以看到,知识库中只返回了3条名字中带有“十”的数据

从下图结果中可以看到,分析的结果认为沈十的成绩是最高,这是因为在沈十、曾十一、何十二中沈十是最高的(但不是知识库中最高的)。因此,这个时候知识库的缺陷就体现出来了

实际上我们是有10个学生,分数最高的是张三和李四

下面,我们聊一聊RAG的优势与局限:
优势
-
信息完整性:
RAG结合检索与生成技术,生成的文本语言流畅且基于外部知识库的实时信息,显著提升知识密集型任务(如医疗问答、法律意见生成)的准确性,避免生成模型“编造”信息的风险,确保输出真实可靠。
-
知识推理能力:
RAG通过高效检索大规模知识库并结合真实数据进行推理,能处理复杂任务,如法律判例推理或金融分析报告生成,优于传统生成模型。
-
领域适应性强:
RAG可根据不同领域知识库进行高效检索与生成,在医疗、法律、金融等需要实时更新和高准确性的领域表现优异。
局限
- 检索器的依赖性与质量问题
-
问题:
RAG性能依赖检索器返回的文档质量。若文档不相关或不准确,生成内容可能出现偏差或误导,尤其在模糊查询或跨领域检索时。
-
挑战:
知识库庞大且多样时,传统检索方法(如BM25)在语义模糊查询中效果有限。
-
解决途径:
采用混合检索技术,如结合稀疏检索(BM25)与密集检索(Faiss+BERT),提升语义匹配效果,减少无关文档影响。
-
生成器的计算复杂度与性能瓶颈
-
-
问题:
RAG整合检索与生成模块,计算复杂度高,尤其在处理大规模数据或长文本时,推理速度下降,资源消耗大,影响实时应用。
-
挑战:
知识库规模扩大时,检索与生成效率降低,GPU和内存消耗增加。
-
解决途径:
通过模型压缩、知识蒸馏、分布式计算(如DeepSpeed)优化推理效率,降低计算复杂度。
-
-
知识库的更新与维护
-
-
问题:
知识库内容的时效性直接影响生成结果可信度,过时信息可能导致错误答案,尤其在医疗、金融等场景。
-
挑战:
手动更新知识库耗时且易出错,自动化更新需保证系统性能。
-
解决途径:
利用自动化爬虫(如Scrapy)和动态索引技术实现知识库实时更新,结合增量学习吸收新信息,避免生成过时答案。
-
-
生成内容的可控性与透明度
-
-
问题:
生成器可能基于不准确文档生成错误推理,且“黑箱”特性使答案来源难以追溯,降低用户信任,尤其在法律、医疗等高敏感领域。
-
挑战:
模型透明度不足,用户难以验证答案可信度,影响高可解释性任务。
-
解决途径:
引入可解释性AI技术(如LIME、SHAP)提供答案溯源,展示引用的知识片段;通过规则约束和用户反馈优化生成内容可控性与可信度。
-
-
总结
-
RAG是连接动态知识库与生成式AI的桥梁,虽能显著提升回答可靠性,但性能高度依赖检索质量与系统维护,需持续优化以发挥潜力。
-
RAG的优势与局限:
-
维度 优势 局限与解决方案 信息质量 ✅ 结合实时知识库,避免生成模型“编造”信息。 ❌ 检索依赖性强:无关文档导致答案偏差。 ✅ 方案:混合检索(BM25+Faiss/BERT)。 推理能力 ✅ 高效整合知识库数据,处理复杂任务(法律/金融)。 ❌ 计算复杂度高:大规模数据导致延迟。 ✅ 方案:模型压缩/分布式计算。 领域适应性 ✅ 支持跨领域实时更新(医疗/法律等)。 ❌ 知识库更新难:过时信息影响结果可信度。 ✅ 方案:自动化爬虫+动态索引。 可控性 - ❌ 透明度不足:答案来源难追溯。 ✅ 方案:可解释AI技术(LIME/SHAP)+规则约束。
如何学习AI大模型?
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。
不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!
想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高
那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓
👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

学习路线

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓


1155

被折叠的 条评论
为什么被折叠?



