【LLM相关知识点】 LLM关键技术简单拆解，以及常用应用框架整理（二）

文章目录

【LLM相关知识点】 LLM关键技术简单拆解，以及常用应用框架整理（二）

一、市场调研：业界智能问答助手的标杆案例

关于垂直领域智能问答助手标杆案例及技术细节：

垂直领域	标杆案例	框架选型	核心技术方案与流程	瓶颈问题	解决方案
医疗	南山医院AI助手	LangChain + MaxKB	1. 基于DeepSeek-R1微调医学文献 2. 集成PubMed/UpToDate知识库RAG检索 3. 医疗实体识别与知识图谱校验	1. 医疗长文本处理效率低 2. 专业术语歧义导致幻觉 3. 文献更新延迟	1. 采用`LlamaIndex`优化分块检索 2. 构建实体消歧规则引擎 3. 增量更新机制
法律	福田公证处智能客服 2	LlamaIndex + Haystack	1. 法律文本结构化解析（NER + 关系抽取） 2. 条款对比模块 3. 风险条款匹配与案例法关联	1. 复杂法律文本解析错误 2. 地域法条冲突 3. 时效性验证困难	1. 分层注意力机制预训练 2. 时空维度法律知识图谱 3. 法条更新API接入
电商	千川智能客服 3	Coze平台 + DeepSeek模型	1. 多轮对话状态跟踪 2. 订单/物流API集成 3. 敏感信息过滤	1. 小语种覆盖不足 2. API响应不稳定 3. 方言理解偏差	1. 混合机器翻译与低资源微调 2. 异步重试机制 3. 领域术语增强词表
教育	清华大学自适应学习系统 4	LangChain + Ollama本地部署	1. 错题模式分析 2. 知识点拓扑路径生成 3. 多难度答案生成	1. 个性化推理资源消耗大 2. 跨学科融合困难 3. 交互延迟	1. 动态压缩学生特征向量 2. 学科交叉知识图谱 3. 边缘节点轻量化部署
政务	洋山VTS智慧政务助手 2	RAGFlow + DeepSeek	1. 政策文件结构化解析 2. 多部门知识库融合 3. 审批流程自动化	1. 非结构化数据抽取误差 2. 跨部门数据孤岛 3. 安全合规要求高	1. `LayoutLM`优化表格解析 2. 联邦学习框架 3. 国密算法数据加密
金融	东财"小银杏"投顾助手 2	AutoGen + vLLM	1. 多模态财报解析（`OCR`+表格理解） 2. 行业指标对比 3. 合规审查模块	1. 数值推理错误率高 2. 实时数据延迟 3. 金融风控规则复杂	1. 数学符号增强微调 2. 流式数据优先级缓存 3. 规则引擎嵌套校验

1、技术方案共性特征

架构选型：普遍采用 “预训练模型（DeepSeek）+ RAG增强 + 垂直领域插件” 的三层架构

参考 DeepSeek 接入 MaxKB 知识库问答系统，真的太香了！
核心创新：
- 医疗领域采用动态知识图谱校验机制
- 法律系统开发时空维度法条追踪模块
- 电商客服引入方言增强型BERT模型这产品经理：基于DeepSeek手搓AI智能客服（附案例）
性能优化：
- 使用LlamaIndex实现长文档O(1)时间复杂度检索
- 通过MoE架构将激活参数控制在总参数量5%-8% 必看！万字长文为你深度解析DeepSeek
- 采用MLA注意力机制减少30% KV缓存漫谈DeepSeek及其背后的核心技术_腾讯新闻

2、典型瓶颈与突破

长文本处理：通过分段注意力机制和层次化检索，将医疗文献处理速度提升4倍
多模态融合：金融领域结合LayoutLM实现表格结构识别准确率达92%
实时性要求：使用vLLM的连续批处理技术，使投研报告生成延迟降低至3秒内深度剖析：DeepSeek四大热门部署框架全方位对比
安全合规：政务系统采用国密SM4算法实现知识库加密，通过等保三级认证

更多技术细节可参考DeepSeek官方生态集成指南DeepSeek官方整理的R1/V3 LLM生态实用集成工具「AI技术选型必备及MaxKB开源项目文档 DeepSeek 接入 MaxKB 知识库问答系统，真的太香了！

3、案例关键技术流程图分析

东莞水务系统

采用双通道处理架构：文档处理通道集成格式校对（LayoutLM技术） 和智能审核模块，数据通道实现时序预测（Prophet算法）与可视化（Echarts）
知识库检索响应时间 < 3秒参考东莞水务集团上线DeepSeek AI智能助手_腾讯新闻

教育系统

错题分析采用动态特征提取技术（TF-IDF优化算法）
知识拓扑构建融合图神经网络（GNN）和TransE嵌入模型

智能客服：

RAG检索层使用Hybrid Search混合检索（BM25+Embedding）
安全模块集成正则表达式和规则引擎双重过滤

二、LLM关键步骤和关键技术 - LLM基座的黑箱拆解

1、LLM关键步骤（文本输入 - LLM（DS / TY / ChatGPT） - 文本输出的过程）

参考从黑箱到透明：深度拆解LLM的8个关键步骤

表面上看，大型语言模型（LLMs）似乎非常直接——你输入一些内容，它们生成一个回应。简单的输入，简单的输出。但在幕后，这是一个复杂的转换链——原始文本被分解成数字，通过神经计算的多层处理，最终，模型生成的内容听起来非常接近人类的语言。从根本上说，这一切都归结为一件事：预测下一个词。

输入处理（如何为模型准备文本） -> 神经网络处理（LLMs如何思考）-> 输出处理与解码（生成下一个标记） -> 训练与优化（LLMs如何学习） -> 记忆与上下文处理（LLMs如何“记住”事物）-> 定制与推理（LLMs如何部署与使用） -> 评估与安全性（我们如何衡量和改进LLMs）-> 扩展与未来改进（LLMs的未来是什么？）

1）第一步：输入处理（如何为模型准备文本）

LLMs并不“阅读”文本——它们处理数字。标记化是这一过程中的第一个关键步骤。

目标：将原始用户文本转换为模型可以理解的格式。

原始文本 → 标记化 → 标记ID → 模型的结构化输入

关键步骤：

原始文本 → 预处理文本：清理输入（去除多余空格、统一大小写、格式化特殊字符）。
文本 → 标记：使用标记器（BPE、WordPiece、Unigram）将输入拆分为单词/子单词。
标记 → 标记ID：根据模型的词汇表，将每个标记映射到唯一的数字ID。
标记ID → 对话模板（如果适用）：将输入结构化为系统、用户和助手角色，用于对话式AI。
标记ID → 模型输入：将标记打包为带有填充、截断和注意力掩码的格式。
传递到神经网络：将编码后的输入传递到模型的嵌入层进行进一步处理。

import tiktoken

tokenizer = tiktoken.encoding_for_model("gpt-4")
text = "I want to learn about LLMs"
tokens = tokenizer.encode(text)

print("Token IDs:", tokens) # [40, 1390, 311, 4048, 922, 445, 11237, 82]
print("Decoded Tokens:", [tokenizer.decode([t]) for t in tokens])
#['I', ' want', ' to', ' learn', ' about', ' L', 'LM', 's']